Ein maschinelles Lernmodell ist als mathematische Darstellung der Ergebnisse des Trainingsprozesses definiert. Unter maschinellem Lernen versteht man das Studium verschiedener Algorithmen, die sich durch Erfahrung und alte Daten automatisch verbessern und das Modell aufbauen können. Ein maschinelles Lernmodell ähnelt einer Computersoftware, die darauf ausgelegt ist, Muster oder Verhaltensweisen auf der Grundlage früherer Erfahrungen oder Daten zu erkennen. Der Lernalgorithmus entdeckt Muster in den Trainingsdaten und gibt ein ML-Modell aus, das diese Muster erfasst und Vorhersagen zu neuen Daten trifft.
Sehen wir uns ein Beispiel des ML-Modells an, bei dem wir eine App erstellen, um die Emotionen des Benutzers anhand des Gesichtsausdrucks zu erkennen. Die Erstellung einer solchen App ist also durch Modelle des maschinellen Lernens möglich, bei denen wir ein Modell trainieren, indem wir Bilder von Gesichtern mit verschiedenen darauf gekennzeichneten Emotionen einspeisen. Wann immer diese App verwendet wird, um die Stimmung des Benutzers zu bestimmen, liest sie alle eingegebenen Daten und ermittelt dann die Stimmung des Benutzers.
Daher können wir in einfachen Worten sagen, dass a Ein maschinelles Lernmodell ist eine vereinfachte Darstellung von etwas oder einem Prozess. In diesem Thema werden wir verschiedene Modelle des maschinellen Lernens sowie deren Techniken und Algorithmen diskutieren .
Was ist ein Modell für maschinelles Lernen?
Modelle des maschinellen Lernens können als ein Programm verstanden werden, das darauf trainiert wurde, Muster in neuen Daten zu finden und Vorhersagen zu treffen. Diese Modelle werden als mathematische Funktion dargestellt, die Anfragen in Form von Eingabedaten entgegennimmt, Vorhersagen zu Eingabedaten trifft und dann als Antwort eine Ausgabe bereitstellt. Zuerst werden diese Modelle anhand einer Reihe von Daten trainiert, und dann wird ihnen ein Algorithmus zur Verfügung gestellt, um über Daten nachzudenken, das Muster aus Feed-Daten zu extrahieren und aus diesen Daten zu lernen. Sobald diese Modelle trainiert sind, können sie zur Vorhersage des unsichtbaren Datensatzes verwendet werden.
Es stehen verschiedene Arten von Modellen für maschinelles Lernen zur Verfügung, die auf unterschiedlichen Geschäftszielen und Datensätzen basieren.
Klassifizierung maschineller Lernmodelle:
Basierend auf unterschiedlichen Geschäftszielen und Datensätzen gibt es drei Lernmodelle für Algorithmen. Jeder Algorithmus für maschinelles Lernen ordnet sich einem der drei Modelle zu:
- Überwachtes Lernen
- Unbeaufsichtigtes Lernen
- Verstärkungslernen
Überwachtes Lernen ist weiter in zwei Kategorien unterteilt:
- Einstufung
- Rückschritt
Unüberwachtes Lernen ist ebenfalls in die folgenden Kategorien unterteilt:
- Clustering
- Vereinsregel
- Dimensionsreduktion
1. Überwachte Modelle für maschinelles Lernen
Überwachtes Lernen ist das am einfachsten zu verstehende Modell des maschinellen Lernens, bei dem Eingabedaten als Trainingsdaten bezeichnet werden und eine bekannte Bezeichnung oder ein bekanntes Ergebnis als Ausgabe haben. Es funktioniert also nach dem Prinzip der Input-Output-Paare. Dazu muss eine Funktion erstellt werden, die mithilfe eines Trainingsdatensatzes trainiert werden kann. Anschließend wird sie auf unbekannte Daten angewendet und führt zu einer gewissen Vorhersageleistung. Überwachtes Lernen ist aufgabenbasiert und wird anhand gekennzeichneter Datensätze getestet.
Wir können ein überwachtes Lernmodell für einfache reale Probleme implementieren. Wir haben zum Beispiel einen Datensatz bestehend aus Alter und Größe; Anschließend können wir ein überwachtes Lernmodell erstellen, um die Größe der Person basierend auf ihrem Alter vorherzusagen.
Modelle des überwachten Lernens werden weiter in zwei Kategorien eingeteilt:
Rückschritt
Bei Regressionsproblemen ist die Ausgabe eine kontinuierliche Variable. Einige häufig verwendete Regressionsmodelle sind wie folgt:
a) Lineare Regression
Die lineare Regression ist das einfachste Modell des maschinellen Lernens, bei dem wir versuchen, eine Ausgabevariable anhand einer oder mehrerer Eingabevariablen vorherzusagen. Die Darstellung der linearen Regression ist eine lineare Gleichung, die eine Menge von Eingabewerten (x) und eine vorhergesagte Ausgabe (y) für die Menge dieser Eingabewerte kombiniert. Es wird in Form einer Linie dargestellt:
Y = bx + c.
Das Hauptziel des linearen Regressionsmodells besteht darin, die beste Anpassungslinie zu finden, die am besten zu den Datenpunkten passt.
Die lineare Regression wird auf die multiple lineare Regression (Finden einer Ebene mit der besten Anpassung) und die Polynomregression (Finden der Kurve mit der besten Anpassung) erweitert.
b) Entscheidungsbaum
Mini-Symbolleiste in Excel
Entscheidungsbäume sind die beliebten Modelle des maschinellen Lernens, die sowohl für Regressions- als auch für Klassifizierungsprobleme verwendet werden können.
Ein Entscheidungsbaum verwendet eine baumartige Struktur von Entscheidungen zusammen mit ihren möglichen Konsequenzen und Ergebnissen. Dabei wird jeder interne Knoten verwendet, um einen Test für ein Attribut darzustellen; Jeder Zweig wird verwendet, um das Ergebnis des Tests darzustellen. Je mehr Knoten ein Entscheidungsbaum hat, desto genauer ist das Ergebnis.
Der Vorteil von Entscheidungsbäumen besteht darin, dass sie intuitiv und einfach zu implementieren sind, es ihnen jedoch an Genauigkeit mangelt.
Entscheidungsbäume werden häufig verwendet Operations Research, insbesondere in der Entscheidungsanalyse und strategischen Planung und hauptsächlich im maschinellen Lernen.
c) Zufälliger Wald
Random Forest ist die Ensemble-Lernmethode, die aus einer großen Anzahl von Entscheidungsbäumen besteht. Jeder Entscheidungsbaum in einer Zufallsstruktur sagt ein Ergebnis voraus, und die Vorhersage mit der Mehrheit der Stimmen wird als Ergebnis betrachtet.
Ein Random-Forest-Modell kann sowohl für Regressions- als auch für Klassifizierungsprobleme verwendet werden.
Für die Klassifizierungsaufgabe wird das Ergebnis der Zufallsstruktur aus der Mehrheit der Stimmen ermittelt. Bei der Regressionsaufgabe hingegen wird das Ergebnis aus dem Mittelwert oder Durchschnitt der von jedem Baum generierten Vorhersagen ermittelt.
d) Neuronale Netze
Neuronale Netze sind eine Teilmenge des maschinellen Lernens und werden auch als künstliche neuronale Netze bezeichnet. Neuronale Netze bestehen aus künstlichen Neuronen und sind so konzipiert, dass sie der Struktur und Funktionsweise des menschlichen Gehirns ähneln. Jedes künstliche Neuron verbindet sich mit vielen anderen Neuronen in einem neuronalen Netzwerk, und diese Millionen verbundener Neuronen bilden eine hochentwickelte kognitive Struktur.
Neuronale Netze bestehen aus einer mehrschichtigen Struktur, die eine Eingabeschicht, eine oder mehrere verborgene Schichten und eine Ausgabeschicht enthält. Da jedes Neuron mit einem anderen Neuron verbunden ist, überträgt es Daten von einer Schicht zum anderen Neuron der nächsten Schichten. Schließlich erreichen die Daten die letzte Schicht oder Ausgabeschicht des neuronalen Netzwerks und erzeugen eine Ausgabe.
Neuronale Netze sind auf Trainingsdaten angewiesen, um zu lernen und ihre Genauigkeit zu verbessern. Ein perfekt trainiertes und genaues neuronales Netzwerk kann jedoch Daten schnell bündeln und zu einem leistungsstarken Werkzeug für maschinelles Lernen und KI werden. Eines der bekanntesten neuronalen Netze ist Der Suchalgorithmus von Google.
Einstufung
Klassifizierungsmodelle sind die zweite Art von Techniken des überwachten Lernens, die verwendet werden, um Schlussfolgerungen aus beobachteten Werten in kategorialer Form zu generieren. Das Klassifizierungsmodell kann beispielsweise erkennen, ob es sich bei der E-Mail um Spam handelt oder nicht. Ein Käufer wird das Produkt kaufen oder nicht usw. Klassifizierungsalgorithmen werden verwendet, um zwei Klassen vorherzusagen und die Ausgabe in verschiedene Gruppen zu kategorisieren.
Bei der Klassifizierung wird ein Klassifikationsmodell entworfen, das den Datensatz in verschiedene Kategorien klassifiziert, und jeder Kategorie wird eine Bezeichnung zugewiesen.
Beim maschinellen Lernen gibt es zwei Arten von Klassifizierungen:
Einige beliebte Klassifizierungsalgorithmen sind wie folgt:
a) Logistische Regression
Die logistische Regression wird verwendet, um die Klassifizierungsprobleme beim maschinellen Lernen zu lösen. Sie ähneln der linearen Regression, werden jedoch zur Vorhersage der kategorialen Variablen verwendet. Es kann die Ausgabe entweder als Ja oder Nein, 0 oder 1, Wahr oder Falsch usw. vorhersagen. Anstatt jedoch die genauen Werte anzugeben, liefert es die Wahrscheinlichkeitswerte zwischen 0 und 1.
b) Support Vector Machine
Support Vector Machine oder SVM ist der beliebte Algorithmus für maschinelles Lernen, der häufig für Klassifizierungs- und Regressionsaufgaben verwendet wird. Insbesondere wird es jedoch zur Lösung von Klassifizierungsproblemen verwendet. Das Hauptziel von SVM besteht darin, die besten Entscheidungsgrenzen in einem N-dimensionalen Raum zu finden, der Datenpunkte in Klassen aufteilen kann. Die beste Entscheidungsgrenze wird als Hyperebene bezeichnet. SVM wählt den Extremvektor aus, um die Hyperebene zu finden. Diese Vektoren werden als Unterstützungsvektoren bezeichnet.
c) Naive Bayes
Naive Bayes ist ein weiterer beliebter Klassifizierungsalgorithmus, der beim maschinellen Lernen verwendet wird. Es wird so genannt, weil es auf dem Bayes-Theorem basiert und der naiven (unabhängigen) Annahme zwischen den Merkmalen folgt, die wie folgt gegeben ist:
Jeder naive Bayes-Klassifikator geht davon aus, dass der Wert einer bestimmten Variablen unabhängig von anderen Variablen/Merkmalen ist. Wenn beispielsweise eine Frucht nach Farbe, Form und Geschmack klassifiziert werden muss. Gelb, oval und süß werden also als Mango erkannt. Hier ist jedes Feature unabhängig von anderen Features.
2. Unbeaufsichtigte Modelle für maschinelles Lernen
Unbeaufsichtigte Modelle für maschinelles Lernen implementieren den Lernprozess, der dem überwachten Lernen entgegengesetzt ist, was bedeutet, dass sie es dem Modell ermöglichen, aus dem unbeschrifteten Trainingsdatensatz zu lernen. Basierend auf dem unbeschrifteten Datensatz sagt das Modell die Ausgabe voraus. Durch unüberwachtes Lernen lernt das Modell selbständig und ohne Aufsicht verborgene Muster aus dem Datensatz.
Modelle des unbeaufsichtigten Lernens werden hauptsächlich zur Ausführung von drei Aufgaben verwendet:
Clustering ist eine unbeaufsichtigte Lerntechnik, bei der die Datenpunkte basierend auf Ähnlichkeiten und Unterschieden in verschiedene Cluster gruppiert oder abgetastet werden. Die Objekte mit den meisten Ähnlichkeiten bleiben in derselben Gruppe und haben keine oder nur sehr wenige Ähnlichkeiten mit anderen Gruppen.
Clustering-Algorithmen können in verschiedenen Aufgabenbereichen eingesetzt werden, z Bildsegmentierung, statistische Datenanalyse, Marktsegmentierung , usw.
Einige häufig verwendete Clustering-Algorithmen sind K-bedeutet Clustering, hierarchisches Clustering, DBSCAN , usw.
Das Lernen von Assoziationsregeln ist eine unbeaufsichtigte Lerntechnik, die interessante Beziehungen zwischen Variablen innerhalb eines großen Datensatzes findet. Das Hauptziel dieses Lernalgorithmus besteht darin, die Abhängigkeit eines Datenelements von einem anderen Datenelement zu ermitteln und diese Variablen entsprechend zuzuordnen, damit maximaler Gewinn erzielt werden kann. Dieser Algorithmus wird hauptsächlich in angewendet Warenkorbanalyse, Web Usage Mining, kontinuierliche Produktion , usw.
Einige beliebte Algorithmen zum Lernen von Assoziationsregeln sind Apriori-Algorithmus, Eclat, FP-Wachstumsalgorithmus.
Die Anzahl der in einem Datensatz vorhandenen Merkmale/Variablen wird als Dimensionalität des Datensatzes bezeichnet, und die zur Reduzierung der Dimensionalität verwendete Technik wird als Dimensionsreduktionstechnik bezeichnet.
Obwohl mehr Daten genauere Ergebnisse liefern, können sie sich auch auf die Leistung des Modells/Algorithmus auswirken, beispielsweise durch Überanpassungsprobleme. In solchen Fällen werden Techniken zur Dimensionsreduktion eingesetzt.
' Dabei handelt es sich um einen Prozess der Konvertierung des Datensatzes höherer Dimensionen in einen Datensatz geringerer Dimensionen, um sicherzustellen, dass er ähnliche Informationen liefert .'
Verschiedene Dimensionsreduktionsmethoden wie z wie PCA (Hauptkomponentenanalyse), Singularwertzerlegung usw.
Verstärkungslernen
Beim Reinforcement Learning lernt der Algorithmus Aktionen für eine gegebene Menge von Zuständen, die zu einem Zielzustand führen. Es handelt sich um ein auf Feedback basierendes Lernmodell, das nach jedem Zustand oder jeder Aktion durch Interaktion mit der Umgebung Feedbacksignale entgegennimmt. Dieses Feedback fungiert als Belohnung (positiv für jede gute Aktion und negativ für jede schlechte Aktion). Das Ziel des Agenten besteht darin, die positiven Belohnungen zu maximieren, um seine Leistung zu verbessern.
Das Verhalten des Modells beim Reinforcement Learning ähnelt dem menschlichen Lernen, da Menschen Dinge durch Erfahrungen als Feedback lernen und mit der Umgebung interagieren.
Im Folgenden sind einige beliebte Algorithmen aufgeführt, die unter Reinforcement Learning fallen:
Ziel ist es, die Richtlinien zu erlernen, die dem KI-Agenten dabei helfen können, unter bestimmten Umständen die besten Maßnahmen zur Maximierung der Belohnung zu ergreifen. Es berücksichtigt Q-Werte für jedes Zustands-Aktionspaar, die die Belohnung für das Befolgen eines bestimmten Zustandspfads angeben, und versucht, den Q-Wert zu maximieren.
Trainieren von Modellen für maschinelles Lernen
Sobald das Modell für maschinelles Lernen erstellt ist, wird es trainiert, um die entsprechenden Ergebnisse zu erhalten. Um ein Modell für maschinelles Lernen zu trainieren, benötigt man eine große Menge vorverarbeiteter Daten. Vorverarbeitete Daten bedeuten hier Daten in strukturierter Form mit reduzierten Nullwerten usw. Wenn wir keine vorverarbeiteten Daten bereitstellen, besteht eine große Wahrscheinlichkeit, dass unser Modell eine schreckliche Leistung erbringt.
Wie wählt man das beste Modell aus?
Im obigen Abschnitt haben wir verschiedene Modelle und Algorithmen für maschinelles Lernen besprochen. Aber eine höchst verwirrende Frage, die sich für jeden Anfänger stellen kann, lautet: „Welches Modell soll ich wählen?“. Die Antwort lautet also, dass es hauptsächlich von den Geschäftsanforderungen oder Projektanforderungen abhängt. Darüber hinaus hängt es auch von den zugehörigen Attributen, dem Umfang des verfügbaren Datensatzes, der Anzahl der Features, der Komplexität usw. ab. In der Praxis empfiehlt es sich jedoch, immer mit dem einfachsten Modell zu beginnen, das auf den jeweiligen Fall angewendet werden kann Lösen Sie das Problem und erhöhen Sie dann schrittweise die Komplexität und testen Sie die Genauigkeit mithilfe von Parameteroptimierung und Kreuzvalidierung.
Unterschied zwischen maschinellem Lernmodell und Algorithmen
Eine der verwirrendsten Fragen für Anfänger ist: Sind Modelle und Algorithmen für maschinelles Lernen dasselbe? Denn in verschiedenen Fällen im maschinellen Lernen und in der Datenwissenschaft werden diese beiden Begriffe synonym verwendet.
Die Antwort auf diese Frage lautet „Nein“, und das Modell des maschinellen Lernens ist nicht dasselbe wie ein Algorithmus. Auf einfache Weise ein Der ML-Algorithmus ist wie ein Verfahren oder eine Methode, die Daten ausführt, um daraus Muster zu erkennen und das Modell generieren. Gleichzeitig a Ein maschinelles Lernmodell ist wie ein Computerprogramm, das Ausgaben generiert oder Vorhersagen trifft . Genauer gesagt: Wenn wir einen Algorithmus mit Daten trainieren, wird er zu einem Modell.
Machine Learning Model = Model Data + Prediction Algorithm