logo

Überwachtes maschinelles Lernen

Unter überwachtem Lernen versteht man die Form des maschinellen Lernens, bei der Maschinen mithilfe gut „beschrifteter“ Trainingsdaten trainiert werden und die Maschinen auf der Grundlage dieser Daten die Ergebnisse vorhersagen. Die gekennzeichneten Daten bedeuten, dass einige Eingabedaten bereits mit der richtigen Ausgabe gekennzeichnet sind.

Beim überwachten Lernen fungieren die den Maschinen bereitgestellten Trainingsdaten als Supervisor, der den Maschinen beibringt, die Ausgabe korrekt vorherzusagen. Es wendet das gleiche Konzept an, das ein Schüler unter der Aufsicht des Lehrers lernt.

Überwachtes Lernen ist ein Prozess, bei dem dem maschinellen Lernmodell sowohl Eingabedaten als auch korrekte Ausgabedaten bereitgestellt werden. Das Ziel eines überwachten Lernalgorithmus ist es Finden Sie eine Zuordnungsfunktion, um die Eingabevariable (x) der Ausgabevariable (y) zuzuordnen. .

In der Praxis kann überwachtes Lernen eingesetzt werden Risikobewertung, Bildklassifizierung, Betrugserkennung, Spam-Filterung , usw.

Wie funktioniert überwachtes Lernen?

Beim überwachten Lernen werden Modelle mithilfe gekennzeichneter Datensätze trainiert, wobei das Modell über jeden Datentyp lernt. Sobald der Trainingsprozess abgeschlossen ist, wird das Modell auf der Grundlage von Testdaten (einer Teilmenge des Trainingssatzes) getestet und sagt dann die Ausgabe voraus.

Die Funktionsweise des überwachten Lernens lässt sich anhand des folgenden Beispiels und Diagramms leicht verstehen:

Überwachtes maschinelles Lernen

Angenommen, wir haben einen Datensatz mit verschiedenen Arten von Formen, darunter Quadrat, Rechteck, Dreieck und Polygon. Der erste Schritt besteht nun darin, das Modell für jede Form zu trainieren.

  • Wenn die gegebene Form vier Seiten hat und alle Seiten gleich sind, wird sie als a bezeichnet Quadrat .
  • Wenn die gegebene Form drei Seiten hat, wird sie als a bezeichnet Dreieck .
  • Wenn die gegebene Form sechs gleiche Seiten hat, wird sie mit beschriftet Hexagon .

Nach dem Training testen wir nun unser Modell mithilfe des Testsatzes. Die Aufgabe des Modells besteht darin, die Form zu identifizieren.

Die Maschine ist bereits auf alle Arten von Formen trainiert und wenn sie eine neue Form findet, klassifiziert sie die Form anhand der Basis mehrerer Seiten und sagt die Ausgabe voraus.

Schritte beim überwachten Lernen:

  • Bestimmen Sie zunächst die Art des Trainingsdatensatzes
  • Sammeln/Sammeln Sie die gekennzeichneten Trainingsdaten.
  • Teilen Sie den Trainingsdatensatz in Training auf Datensatz, Testdatensatz und Validierungsdatensatz .
  • Bestimmen Sie die Eingabemerkmale des Trainingsdatensatzes, die über genügend Wissen verfügen sollten, damit das Modell die Ausgabe genau vorhersagen kann.
  • Bestimmen Sie den geeigneten Algorithmus für das Modell, z. B. Support Vector Machine, Entscheidungsbaum usw.
  • Führen Sie den Algorithmus für den Trainingsdatensatz aus. Manchmal benötigen wir Validierungssätze als Kontrollparameter, die die Teilmenge der Trainingsdatensätze darstellen.
  • Bewerten Sie die Genauigkeit des Modells, indem Sie den Testsatz bereitstellen. Wenn das Modell die korrekte Ausgabe vorhersagt, bedeutet dies, dass unser Modell korrekt ist.

Arten von überwachten Algorithmen für maschinelles Lernen:

Überwachtes Lernen kann weiter in zwei Arten von Problemen unterteilt werden:

Überwachtes maschinelles Lernen

1. Rückschritt

Regressionsalgorithmen werden verwendet, wenn zwischen der Eingabevariablen und der Ausgabevariablen ein Zusammenhang besteht. Es wird zur Vorhersage kontinuierlicher Variablen wie Wettervorhersagen, Markttrends usw. verwendet. Nachfolgend sind einige beliebte Regressionsalgorithmen aufgeführt, die unter überwachtes Lernen fallen:

  • Lineare Regression
  • Regressionsbäume
  • Nichtlineare Regression
  • Bayesianische lineare Regression
  • Polynomielle Regression

2. Klassifizierung

Klassifizierungsalgorithmen werden verwendet, wenn die Ausgabevariable kategorisch ist, was bedeutet, dass es zwei Klassen gibt, z. B. Ja-Nein, Männlich-Weiblich, Richtig-Falsch usw.

Spam-Filterung,

  • Zufälliger Wald
  • Entscheidungsbäume
  • Logistische Regression
  • Support-Vektor-Maschinen

Hinweis: Wir werden diese Algorithmen in späteren Kapiteln ausführlich besprechen.

Vorteile des überwachten Lernens:

  • Mit Hilfe des überwachten Lernens kann das Modell den Output auf der Grundlage früherer Erfahrungen vorhersagen.
  • Beim überwachten Lernen können wir eine genaue Vorstellung von den Objektklassen haben.
  • Das überwachte Lernmodell hilft uns, verschiedene reale Probleme zu lösen, wie z Betrugserkennung, Spam-Filterung , usw.

Nachteile des überwachten Lernens:

  • Modelle des überwachten Lernens sind für die Bewältigung der komplexen Aufgaben nicht geeignet.
  • Überwachtes Lernen kann die korrekte Ausgabe nicht vorhersagen, wenn sich die Testdaten vom Trainingsdatensatz unterscheiden.
  • Das Training erforderte viel Rechenzeit.
  • Beim überwachten Lernen benötigen wir ausreichend Wissen über die Objektklassen.