logo

Arten des maschinellen Lernens

Maschinelles Lernen ist eine Teilmenge der KI, die es der Maschine ermöglicht, automatisch aus Daten zu lernen, die Leistung anhand vergangener Erfahrungen zu verbessern und Vorhersagen zu treffen . Maschinelles Lernen umfasst eine Reihe von Algorithmen, die mit großen Datenmengen arbeiten. Diesen Algorithmen werden Daten zugeführt, um sie zu trainieren. Auf der Grundlage des Trainings erstellen sie das Modell und führen eine bestimmte Aufgabe aus.

Arten des maschinellen Lernens

Diese ML-Algorithmen helfen bei der Lösung verschiedener Geschäftsprobleme wie Regression, Klassifizierung, Prognose, Clustering und Assoziationen usw.

Basierend auf den Methoden und der Art des Lernens wird maschinelles Lernen hauptsächlich in vier Typen unterteilt:

Schalten Sie den Entwicklermodus aus
  1. Überwachtes maschinelles Lernen
  2. Unüberwachtes maschinelles Lernen
  3. Halbüberwachtes maschinelles Lernen
  4. Verstärkungslernen
Arten des maschinellen Lernens

In diesem Thema stellen wir eine detaillierte Beschreibung der Arten des maschinellen Lernens zusammen mit ihren jeweiligen Algorithmen bereit:

1. Überwachtes maschinelles Lernen

Wie der Name schon sagt, Überwachtes maschinelles Lernen basiert auf Aufsicht. Das bedeutet, dass wir bei der Technik des überwachten Lernens die Maschinen mithilfe des „gekennzeichneten“ Datensatzes trainieren und die Maschine auf der Grundlage des Trainings die Ausgabe vorhersagt. Hier geben die beschrifteten Daten an, dass einige der Eingaben bereits der Ausgabe zugeordnet sind. Noch kostbarer können wir sagen; Zuerst trainieren wir die Maschine mit der Eingabe und der entsprechenden Ausgabe und bitten die Maschine dann, die Ausgabe anhand des Testdatensatzes vorherzusagen.

Lassen Sie uns überwachtes Lernen anhand eines Beispiels verstehen. Angenommen, wir haben einen Eingabedatensatz mit Katzen- und Hundebildern. Daher werden wir zunächst die Maschine trainieren, um die Bilder zu verstehen, z Form und Größe des Schwanzes von Katze und Hund, Form der Augen, Farbe, Größe (Hunde sind größer, Katzen kleiner) usw. Nach Abschluss des Trainings geben wir das Bild einer Katze ein und bitten die Maschine, das Objekt zu identifizieren und die Ausgabe vorherzusagen. Jetzt ist die Maschine gut trainiert, sodass sie alle Merkmale des Objekts wie Höhe, Form, Farbe, Augen, Ohren, Schwanz usw. überprüft und feststellt, dass es sich um eine Katze handelt. Daher wird es in die Kategorie „Katze“ eingeordnet. Dies ist der Prozess, wie die Maschine die Objekte beim überwachten Lernen identifiziert.

Das Hauptziel der überwachten Lerntechnik besteht darin, die Eingabevariable (x) der Ausgabevariable (y) zuzuordnen. Einige reale Anwendungen des überwachten Lernens sind Risikobewertung, Betrugserkennung, Spam-Filterung, usw.

Kategorien des überwachten maschinellen Lernens

Überwachtes maschinelles Lernen kann in zwei Arten von Problemen eingeteilt werden, die im Folgenden aufgeführt sind:

    Einstufung Rückschritt

a) Klassifizierung

Klassifizierungsalgorithmen werden verwendet, um Klassifizierungsprobleme zu lösen, bei denen die Ausgabevariable kategorial ist, wie zum Beispiel „ Ja oder Nein, männlich oder weiblich, rot oder blau usw . Die Klassifizierungsalgorithmen sagen die im Datensatz vorhandenen Kategorien voraus. Einige Beispiele aus der Praxis für Klassifizierungsalgorithmen sind: Spam-Erkennung, E-Mail-Filterung usw.

Nachfolgend sind einige beliebte Klassifizierungsalgorithmen aufgeführt:

    Random-Forest-Algorithmus Entscheidungsbaum-Algorithmus Logistischer Regressionsalgorithmus Unterstützt den Vektormaschinenalgorithmus

b) Regression

Regressionsalgorithmen werden zur Lösung von Regressionsproblemen verwendet, bei denen ein linearer Zusammenhang zwischen Eingabe- und Ausgabevariablen besteht. Diese werden verwendet, um kontinuierliche Ausgabevariablen wie Markttrends, Wettervorhersagen usw. vorherzusagen.

Nachfolgend sind einige beliebte Regressionsalgorithmen aufgeführt:

    Einfacher linearer Regressionsalgorithmus Multivariater Regressionsalgorithmus Entscheidungsbaum-Algorithmus Lasso-Regression

Vor- und Nachteile des überwachten Lernens

Vorteile:

  • Da überwachtes Lernen mit dem gekennzeichneten Datensatz arbeitet, können wir eine genaue Vorstellung von den Objektklassen haben.
  • Diese Algorithmen sind hilfreich bei der Vorhersage der Ausgabe auf der Grundlage früherer Erfahrungen.

Nachteile:

  • Diese Algorithmen sind nicht in der Lage, komplexe Aufgaben zu lösen.
  • Es kann zu einer falschen Ausgabe kommen, wenn sich die Testdaten von den Trainingsdaten unterscheiden.
  • Das Trainieren des Algorithmus erfordert viel Rechenzeit.

Anwendungen des überwachten Lernens

Nachfolgend sind einige häufige Anwendungen des überwachten Lernens aufgeführt:

    Bildsegmentierung:
    Bei der Bildsegmentierung werden überwachte Lernalgorithmen verwendet. Dabei wird die Bildklassifizierung verschiedener Bilddaten mit vordefinierten Beschriftungen durchgeführt.Medizinische Diagnose:
    Auch im medizinischen Bereich werden überwachte Algorithmen zu Diagnosezwecken eingesetzt. Dies geschieht durch die Verwendung medizinischer Bilder und zuvor gekennzeichneter Daten mit Bezeichnungen für Krankheitszustände. Mit einem solchen Verfahren kann die Maschine eine Krankheit für die neuen Patienten identifizieren.Entdeckung eines Betruges -Klassifizierungsalgorithmen für überwachtes Lernen werden zur Identifizierung von Betrugstransaktionen, Betrugskunden usw. verwendet. Dabei werden historische Daten verwendet, um die Muster zu identifizieren, die zu möglichem Betrug führen können.Spam-Erkennung –Bei der Spam-Erkennung und -Filterung werden Klassifizierungsalgorithmen verwendet. Diese Algorithmen klassifizieren eine E-Mail als Spam oder nicht als Spam. Die Spam-E-Mails werden an den Spam-Ordner gesendet.Spracherkennung -Auch bei der Spracherkennung werden überwachte Lernalgorithmen eingesetzt. Der Algorithmus wird mit Sprachdaten trainiert und verschiedene Identifikationen können damit durchgeführt werden, wie z. B. sprachaktivierte Passwörter, Sprachbefehle usw.

2. Unüberwachtes maschinelles Lernen

Unbeaufsichtigtes Lernen g unterscheidet sich von der überwachten Lerntechnik; Wie der Name schon sagt, ist keine Aufsicht erforderlich. Das bedeutet, dass beim unbeaufsichtigten maschinellen Lernen die Maschine mithilfe des unbeschrifteten Datensatzes trainiert wird und die Maschine die Ausgabe ohne jegliche Überwachung vorhersagt.

Beim unüberwachten Lernen werden die Modelle mit Daten trainiert, die weder klassifiziert noch gekennzeichnet sind, und das Modell verarbeitet diese Daten ohne jegliche Überwachung.

Das Hauptziel des unüberwachten Lernalgorithmus besteht darin, den unsortierten Datensatz nach Ähnlichkeiten, Mustern und Unterschieden zu gruppieren oder zu kategorisieren. Maschinen werden angewiesen, die verborgenen Muster aus dem Eingabedatensatz zu finden.

Nehmen wir ein Beispiel, um es besser zu verstehen. Angenommen, es gibt einen Korb mit Obstbildern, und wir geben ihn in das Modell für maschinelles Lernen ein. Die Bilder sind dem Modell völlig unbekannt und die Aufgabe der Maschine besteht darin, die Muster und Kategorien der Objekte zu finden.

Jetzt erkennt die Maschine ihre Muster und Unterschiede, wie z. B. Farbunterschiede und Formunterschiede, und sagt die Ausgabe voraus, wenn sie mit dem Testdatensatz getestet wird.

Kategorien des unbeaufsichtigten maschinellen Lernens

Unüberwachtes Lernen kann weiter in zwei Typen eingeteilt werden, die im Folgenden aufgeführt sind:

    Clustering Verband

1) Clustering

Die Clustering-Technik wird verwendet, wenn wir die inhärenten Gruppen aus den Daten ermitteln möchten. Dabei handelt es sich um eine Möglichkeit, die Objekte in einem Cluster zu gruppieren, sodass die Objekte mit den meisten Ähnlichkeiten in einer Gruppe bleiben und weniger oder keine Ähnlichkeiten mit den Objekten anderer Gruppen aufweisen. Ein Beispiel für den Clustering-Algorithmus ist die Gruppierung der Kunden nach ihrem Kaufverhalten.

Einige der beliebtesten Clustering-Algorithmen sind unten aufgeführt:

    K-Means-Clustering-Algorithmus Mean-Shift-Algorithmus DBSCAN-Algorithmus Hauptkomponentenanalyse Unabhängige Komponentenanalyse

2) Assoziation

Das Lernen von Assoziationsregeln ist eine unbeaufsichtigte Lerntechnik, die interessante Beziehungen zwischen Variablen innerhalb eines großen Datensatzes findet. Das Hauptziel dieses Lernalgorithmus besteht darin, die Abhängigkeit eines Datenelements von einem anderen Datenelement zu ermitteln und diese Variablen entsprechend zuzuordnen, damit maximaler Gewinn erzielt werden kann. Dieser Algorithmus wird hauptsächlich in angewendet Warenkorbanalyse, Web Usage Mining, kontinuierliche Produktion , usw.

Einige beliebte Algorithmen zum Lernen von Assoziationsregeln sind Apriori-Algorithmus, Eclat, FP-Wachstumsalgorithmus.

Vor- und Nachteile des unbeaufsichtigten Lernalgorithmus

Vorteile:

  • Diese Algorithmen können im Vergleich zu den überwachten Aufgaben für kompliziertere Aufgaben verwendet werden, da diese Algorithmen mit dem unbeschrifteten Datensatz arbeiten.
  • Unüberwachte Algorithmen sind für verschiedene Aufgaben vorzuziehen, da es einfacher ist, den unbeschrifteten Datensatz zu erhalten als den beschrifteten Datensatz.

Nachteile:

  • Die Ausgabe eines unbeaufsichtigten Algorithmus kann weniger genau sein, da der Datensatz nicht gekennzeichnet ist und Algorithmen nicht zuvor mit der genauen Ausgabe trainiert wurden.
  • Die Arbeit mit unbeaufsichtigtem Lernen ist schwieriger, da es mit dem unbeschrifteten Datensatz arbeitet, der nicht mit der Ausgabe übereinstimmt.

Anwendungen des unüberwachten Lernens

    Netzwerkanalyse:Unüberwachtes Lernen wird zur Identifizierung von Plagiaten und Urheberrechten bei der Dokumentennetzwerkanalyse von Textdaten für wissenschaftliche Artikel eingesetzt.Empfehlungssysteme:Empfehlungssysteme nutzen häufig unbeaufsichtigte Lerntechniken zum Erstellen von Empfehlungsanwendungen für verschiedene Webanwendungen und E-Commerce-Websites.Anomalieerkennung:Die Anomalieerkennung ist eine beliebte Anwendung des unbeaufsichtigten Lernens, mit der ungewöhnliche Datenpunkte innerhalb des Datensatzes identifiziert werden können. Es wird verwendet, um betrügerische Transaktionen aufzudecken.Einzelwertzerlegung:Singular Value Decomposition oder SVD wird verwendet, um bestimmte Informationen aus der Datenbank zu extrahieren. Beispielsweise das Extrahieren von Informationen zu jedem Benutzer, der sich an einem bestimmten Standort befindet.

3. Halbüberwachtes Lernen

Halbüberwachtes Lernen ist eine Art Algorithmus für maschinelles Lernen, der zwischen überwachtem und unüberwachtem maschinellem Lernen liegt . Es stellt die Zwischenstufe zwischen überwachten (mit beschrifteten Trainingsdaten) und unbeaufsichtigten Lernalgorithmen (ohne beschriftete Trainingsdaten) dar und verwendet die Kombination von beschrifteten und unbeschrifteten Datensätzen während des Trainingszeitraums.

A Obwohl halbüberwachtes Lernen den Mittelweg zwischen überwachtem und unüberwachtem Lernen darstellt und mit Daten arbeitet, die aus wenigen Etiketten bestehen, besteht es größtenteils aus unbeschrifteten Daten. Da Etiketten teuer sind, für Unternehmenszwecke jedoch nur wenige Etiketten vorhanden sind. Es unterscheidet sich grundlegend vom überwachten und unbeaufsichtigten Lernen, da diese auf dem Vorhandensein und Fehlen von Etiketten basieren.

Um die Nachteile von überwachten und unüberwachten Lernalgorithmen zu überwinden, wird das Konzept des halbüberwachten Lernens eingeführt . Das Hauptziel des halbüberwachten Lernens besteht darin, alle verfügbaren Daten effektiv zu nutzen und nicht nur gekennzeichnete Daten wie beim überwachten Lernen. Zunächst werden ähnliche Daten zusammen mit einem unbeaufsichtigten Lernalgorithmus geclustert, und darüber hinaus hilft es, die unbeschrifteten Daten in beschriftete Daten umzuwandeln. Dies liegt daran, dass die Anschaffung beschrifteter Daten vergleichsweise teurer ist als die Beschaffung unbeschrifteter Daten.

Wir können uns diese Algorithmen anhand eines Beispiels vorstellen. Beim überwachten Lernen steht ein Schüler zu Hause und an der Hochschule unter der Aufsicht eines Lehrers. Wenn der Schüler außerdem das gleiche Konzept ohne die Hilfe des Lehrers selbst analysiert, fällt dies unter unbeaufsichtigtes Lernen. Beim halbüberwachten Lernen muss der Student sich selbst wiederholen, nachdem er das gleiche Konzept unter Anleitung eines Dozenten an der Hochschule analysiert hat.

Vor- und Nachteile des halbüberwachten Lernens

Vorteile:

  • Der Algorithmus ist einfach und leicht zu verstehen.
  • Es ist hocheffizient.
  • Es wird verwendet, um Nachteile von Algorithmen für überwachtes und unüberwachtes Lernen zu beheben.

Nachteile:

  • Iterationsergebnisse sind möglicherweise nicht stabil.
  • Wir können diese Algorithmen nicht auf Daten auf Netzwerkebene anwenden.
  • Die Genauigkeit ist gering.

4. Verstärkungslernen

Reinforcement Learning basiert auf einem Feedback-basierten Prozess, bei dem ein KI-Agent (eine Softwarekomponente) automatisch seine Umgebung durch „Hit & Trail“ erkundet, Maßnahmen ergreift, aus Erfahrungen lernt und seine Leistung verbessert. Der Agent wird für jede gute Aktion belohnt und für jede schlechte Aktion bestraft; Daher besteht das Ziel des Reinforcement-Learning-Agenten darin, die Belohnungen zu maximieren.

Beim Reinforcement Learning gibt es keine gekennzeichneten Daten wie beim überwachten Lernen, und Agenten lernen nur aus ihren Erfahrungen.

Der Prozess des Verstärkungslernens ähnelt dem eines Menschen. Beispielsweise lernt ein Kind durch Erfahrungen im Alltag verschiedene Dinge. Ein Beispiel für verstärkendes Lernen ist das Spielen eines Spiels, bei dem das Spiel die Umgebung ist, die Bewegungen eines Agenten bei jedem Schritt Zustände definieren und das Ziel des Agenten darin besteht, eine hohe Punktzahl zu erzielen. Der Agent erhält Feedback hinsichtlich Bestrafung und Belohnung.

1nf 2nf 3nf

Aufgrund seiner Arbeitsweise wird Reinforcement Learning in verschiedenen Bereichen eingesetzt, z Spieltheorie, Operationsforschung, Informationstheorie, Multiagentensysteme.

Ein Reinforcement-Learning-Problem kann mit formalisiert werden Markov-Entscheidungsprozess (MDP). Bei MDP interagiert der Agent ständig mit der Umgebung und führt Aktionen aus; Bei jeder Aktion reagiert die Umgebung und generiert einen neuen Zustand.

Kategorien des Reinforcement Learning

Reinforcement Learning wird hauptsächlich in zwei Arten von Methoden/Algorithmen eingeteilt:

    Positives Verstärkungslernen:Positives Verstärkungslernen bezeichnet die Erhöhung der Tendenz, dass das geforderte Verhalten erneut auftritt, indem man etwas hinzufügt. Es verstärkt die Stärke des Verhaltens des Agenten und wirkt sich positiv darauf aus.Negatives Verstärkungslernen:Negatives Verstärkungslernen funktioniert genau entgegengesetzt zum positiven RL. Es erhöht die Tendenz, dass das spezifische Verhalten erneut auftritt, wenn der negative Zustand vermieden wird.

Reale Anwendungsfälle von Reinforcement Learning

    Videospiele:
    RL-Algorithmen erfreuen sich in Gaming-Anwendungen großer Beliebtheit. Es wird verwendet, um übermenschliche Leistungen zu erbringen. Einige beliebte Spiele, die RL-Algorithmen verwenden, sind AlphaGO Und AlphaGO Zero .Resourcenmanagement:
    Das Papier „Ressourcenmanagement mit Deep Reinforcement Learning“ zeigte, wie RL im Computer verwendet werden kann, um Ressourcen automatisch zu lernen und zu planen, damit sie auf verschiedene Jobs warten, um die durchschnittliche Jobverlangsamung zu minimieren.Robotik:
    RL wird häufig in Robotikanwendungen eingesetzt. Roboter werden im Industrie- und Fertigungsbereich eingesetzt und durch Reinforcement Learning leistungsfähiger gemacht. Es gibt verschiedene Branchen, die ihre Vision haben, intelligente Roboter mithilfe von KI und maschineller Lerntechnologie zu bauen.Text-Mining
    Text-Mining, eine der großartigen Anwendungen von NLP, wird jetzt mit Hilfe von Reinforcement Learning von der Firma Salesforce implementiert.

Vor- und Nachteile des Reinforcement Learning

Vorteile

  • Es hilft bei der Lösung komplexer realer Probleme, die mit allgemeinen Techniken nur schwer zu lösen sind.
  • Das Lernmodell von RL ähnelt dem Lernen von Menschen; Daher können die genauesten Ergebnisse gefunden werden.
  • Hilft dabei, langfristige Ergebnisse zu erzielen.

Nachteil

  • RL-Algorithmen werden für einfache Probleme nicht bevorzugt.
  • RL-Algorithmen erfordern riesige Datenmengen und Berechnungen.
  • Zu viel verstärkendes Lernen kann zu einer Überlastung der Zustände führen, was die Ergebnisse schwächen kann.

Der Fluch der Dimensionalität schränkt das verstärkende Lernen für reale physikalische Systeme ein.