3  Typische Problemstellungen und Lernansätze

3.1 Typische Problemstellungen im Maschinellen Lernen

1. Klassifikation

  • Beschreibung: Eingaben werden in diskrete Klassen eingeteilt.
  • Beispiele:
    • Bilderkennung (Katze vs. Hund)
    • Spam-Filter (Spam vs. Nicht-Spam)
    • Krankheitsdiagnose (z. B. Tumor ja/nein)

2. Regression

  • Beschreibung: Vorhersage eines kontinuierlichen Werts.
  • Beispiele:
    • Vorhersage von Immobilienpreisen
    • Prognose der Außentemperatur
    • Schätzung des Energieverbrauchs

3. Clustering

  • Beschreibung: Gruppierung von Datenpunkten in Cluster, ohne vorherige Labels.
  • Beispiele:
    • Kundensegmentierung im Marketing
    • Gruppierung von Dokumenten nach Themen
    • Mustererkennung in Genomdaten

4. Dimensionsreduktion

  • Beschreibung: Reduzierung der Anzahl an Merkmalen, während wichtige Strukturen erhalten bleiben.
  • Beispiele:
    • Visualisierung hochdimensionaler Daten (z. B. PCA, t-SNE)
    • Feature Engineering zur Beschleunigung von Modellen
    • Rauschunterdrückung in Daten

5. Anomalieerkennung

  • Beschreibung: Erkennung von ungewöhnlichen oder abweichenden Datenpunkten.
  • Beispiele:
    • Betrugserkennung bei Kreditkarten
    • Erkennung von Maschinendefekten in der Industrie
    • Intrusion Detection in Netzwerken

6. Reinforcement Tasks

  • Beschreibung: Lernen einer Strategie/Policy zur Interaktion mit einer Umgebung.
  • Beispiele:
    • Spiele (z. B. Schach, Go, Videospiele)
    • Robotik (z. B. Greifen, Gehen)
    • Optimierung von Verkehrsflüssen

3.2 Lernparadigmen (Wie wird gelernt?)

Supervised Learning (Überwachtes Lernen)

  • Man hat Trainingsdaten mit Labels (Eingabe + richtige Ausgabe).
  • Ziel: Modell lernt eine Abbildung von Eingaben → Ausgaben.
  • Beispiele:
    • Bilderkennung („Das ist eine Katze / ein Hund“)
    • Spamfilter (E-Mail → „Spam“ oder „kein Spam“)

Unsupervised Learning (Unüberwachtes Lernen)

  • Man hat nur ungelabelte Daten, keine „richtigen Antworten“.
  • Ziel: Strukturen, Muster oder Gruppen in den Daten finden.
  • Beispiele:
    • Clustering von Kunden im Marketing (Kundensegmente)
    • Dimensionsreduktion (z. B. PCA)

Reinforcement Learning (Verstärkendes Lernen)

  • Agent lernt durch Interaktion mit einer Umgebung und bekommt Belohnungen / Strafen.
  • Ziel: Strategien entwickeln, die langfristig maximale Belohnung bringen.
  • Beispiele:
    • AlphaGo, das Go-Spiel meistert
    • Roboter, der laufen lernt

(ergänzend) Semi-Supervised Learning

  • Mischung: Wenige gelabelte Daten + viele ungelabelte Daten.
  • Nützlich, wenn Labeling teuer ist.

(ergänzend) Self-Supervised Learning

  • Labels werden automatisch aus den Daten selbst erzeugt.
  • Sehr wichtig für große Sprachmodelle.
  • Beispiel: Vorhersage des nächsten Wortes in einem Satz.