logo

Unüberwachtes maschinelles Lernen

Im vorherigen Thema haben wir das überwachte maschinelle Lernen kennengelernt, bei dem Modelle mithilfe gekennzeichneter Daten unter der Aufsicht von Trainingsdaten trainiert werden. Aber es kann viele Fälle geben, in denen wir keine gekennzeichneten Daten haben und die verborgenen Muster aus dem gegebenen Datensatz finden müssen. Um solche Fälle beim maschinellen Lernen zu lösen, benötigen wir unbeaufsichtigte Lerntechniken.

Was ist unüberwachtes Lernen?

Wie der Name schon sagt, handelt es sich beim unüberwachten Lernen um eine Technik des maschinellen Lernens, bei der Modelle nicht mithilfe von Trainingsdatensätzen überwacht werden. Stattdessen finden die Modelle selbst die verborgenen Muster und Erkenntnisse aus den gegebenen Daten. Es kann mit dem Lernen verglichen werden, das im menschlichen Gehirn beim Erlernen neuer Dinge stattfindet. Es kann wie folgt definiert werden:

Zeichenfolge in c
Unüberwachtes Lernen ist eine Art maschinelles Lernen, bei dem Modelle mithilfe unbeschrifteter Datensätze trainiert werden und ohne Aufsicht auf diese Daten reagieren dürfen.

Unüberwachtes Lernen kann nicht direkt auf ein Regressions- oder Klassifizierungsproblem angewendet werden, da wir im Gegensatz zum überwachten Lernen über die Eingabedaten, aber keine entsprechenden Ausgabedaten verfügen. Das Ziel des unbeaufsichtigten Lernens ist es Finden Sie die zugrunde liegende Struktur des Datensatzes, gruppieren Sie diese Daten nach Ähnlichkeiten und stellen Sie diesen Datensatz in einem komprimierten Format dar .

Beispiel: Angenommen, dem unbeaufsichtigten Lernalgorithmus wird ein Eingabedatensatz mit Bildern verschiedener Arten von Katzen und Hunden gegeben. Der Algorithmus wird nie auf den gegebenen Datensatz trainiert, was bedeutet, dass er keine Ahnung von den Merkmalen des Datensatzes hat. Die Aufgabe des unüberwachten Lernalgorithmus besteht darin, die Bildmerkmale selbstständig zu identifizieren. Ein unbeaufsichtigter Lernalgorithmus führt diese Aufgabe aus, indem er den Bilddatensatz entsprechend den Ähnlichkeiten zwischen den Bildern in Gruppen gruppiert.

Überwachtes maschinelles Lernen

Warum unüberwachtes Lernen nutzen?

Nachfolgend sind einige Hauptgründe aufgeführt, die die Bedeutung des unüberwachten Lernens beschreiben:

  • Unüberwachtes Lernen ist hilfreich, um aus den Daten nützliche Erkenntnisse zu gewinnen.
  • Unüberwachtes Lernen ist dem sehr ähnlich, wenn ein Mensch das Denken durch eigene Erfahrungen lernt, was es der echten KI näher bringt.
  • Unüberwachtes Lernen funktioniert mit unbeschrifteten und nicht kategorisierten Daten, was unüberwachtes Lernen wichtiger macht.
  • In der realen Welt verfügen wir nicht immer über Eingabedaten mit entsprechenden Ausgaben. Um solche Fälle zu lösen, benötigen wir daher unüberwachtes Lernen.

Funktionsweise des unbeaufsichtigten Lernens

Die Funktionsweise des unbeaufsichtigten Lernens kann anhand des folgenden Diagramms verstanden werden:

Überwachtes maschinelles Lernen

Hier haben wir unbeschriftete Eingabedaten verwendet, was bedeutet, dass sie nicht kategorisiert sind und auch keine entsprechenden Ausgaben gegeben werden. Diese unbeschrifteten Eingabedaten werden nun dem maschinellen Lernmodell zugeführt, um es zu trainieren. Zunächst werden die Rohdaten interpretiert, um die verborgenen Muster in den Daten zu finden, und dann werden geeignete Algorithmen wie K-Means-Clustering, Entscheidungsbaum usw. angewendet.

Sobald der geeignete Algorithmus angewendet wird, teilt der Algorithmus die Datenobjekte entsprechend der Ähnlichkeiten und Unterschiede zwischen den Objekten in Gruppen ein.

Arten von unbeaufsichtigten Lernalgorithmen:

Der Algorithmus für unbeaufsichtigtes Lernen kann weiter in zwei Arten von Problemen eingeteilt werden:

Wählen Sie Multi-Table-SQL aus
Überwachtes maschinelles Lernen
    Clustering: Clustering ist eine Methode zum Gruppieren von Objekten in Clustern, sodass Objekte mit den meisten Ähnlichkeiten in einer Gruppe bleiben und weniger oder keine Ähnlichkeiten mit den Objekten einer anderen Gruppe aufweisen. Die Clusteranalyse findet die Gemeinsamkeiten zwischen den Datenobjekten und kategorisiert sie nach dem Vorhandensein und Fehlen dieser Gemeinsamkeiten.Verband: Eine Assoziationsregel ist eine unbeaufsichtigte Lernmethode, die zum Ermitteln der Beziehungen zwischen Variablen in der großen Datenbank verwendet wird. Es bestimmt die Menge der Elemente, die zusammen im Datensatz vorkommen. Die Assoziationsregel macht die Marketingstrategie effektiver. So neigen Menschen, die X-Artikel (z. B. ein Brot) kaufen, auch dazu, Y-Artikel (Butter/Marmelade) zu kaufen. Ein typisches Beispiel für eine Assoziationsregel ist die Warenkorbanalyse.

Hinweis: Wir werden diese Algorithmen in späteren Kapiteln lernen.

Unüberwachte Lernalgorithmen:

Nachfolgend finden Sie eine Liste einiger beliebter Algorithmen für unbeaufsichtigtes Lernen:

    K-bedeutet Clustering KNN (k-nächste Nachbarn) Hierarchisches Clustering Anomalieerkennung Neuronale Netze Hauptkomponentenanalyse Unabhängige Komponentenanalyse Apriori-Algorithmus Einzelwertzerlegung

Vorteile des unbeaufsichtigten Lernens

  • Unüberwachtes Lernen wird im Vergleich zum überwachten Lernen für komplexere Aufgaben verwendet, da wir beim unüberwachten Lernen keine gekennzeichneten Eingabedaten haben.
  • Unüberwachtes Lernen ist vorzuziehen, da es einfacher ist, unbeschriftete Daten im Vergleich zu beschrifteten Daten zu erhalten.

Nachteile des unüberwachten Lernens

  • Unüberwachtes Lernen ist grundsätzlich schwieriger als überwachtes Lernen, da es keinen entsprechenden Output liefert.
  • Das Ergebnis des unüberwachten Lernalgorithmus ist möglicherweise weniger genau, da die Eingabedaten nicht gekennzeichnet sind und Algorithmen die genaue Ausgabe nicht im Voraus kennen.