WIE VERWENDE ICH DIE FUNKTION LM() IN R, UM LINEARE MODELLE ANZUPASSEN?

In diesem Artikel erfahren Sie, wie Sie die Funktion lm() verwenden, um lineare Modelle in der Programmiersprache R anzupassen.

Ein lineares Modell wird verwendet, um den Wert einer unbekannten Variablen basierend auf unabhängigen Variablen vorherzusagen. Es wird hauptsächlich verwendet, um die Beziehung zwischen Variablen und Prognosen herauszufinden. Die Funktion lm() wird verwendet, um lineare Modelle an Datenrahmen in der R-Sprache anzupassen. Es kann verwendet werden, um eine Regression, eine Einzelschicht-Varianzanalyse und eine Kovarianzanalyse durchzuführen, um den Wert vorherzusagen, der Daten entspricht, die sich nicht im Datenrahmen befinden. Diese sind sehr hilfreich bei der Vorhersage des Immobilienpreises, der Wettervorhersage usw.

So passen Sie ein lineares Modell in die R-Sprache an, indem Sie Folgendes verwenden: lm() Funktion: Wir verwenden zunächst die Funktion data.frame(), um einen Beispieldatenrahmen zu erstellen, der Werte enthält, die mithilfe der Regressionsfunktion an ein lineares Modell angepasst werden müssen. Dann verwenden wir die Funktion lm(), um eine bestimmte Funktion an einen bestimmten Datenrahmen anzupassen.

Syntax:

lm(fitting_formula, dataframe)

Parameter:

Fitting_Formula: Bestimmt die Formel für das lineare Modell. Datenrahmen: Bestimmt den Namen des Datenrahmens, der die Daten enthält.

Anschließend können wir die Funktion summary() verwenden, um die Zusammenfassung des linearen Modells anzuzeigen. Die Funktion summary() interpretiert die wichtigsten statistischen Werte für die Analyse des linearen Modells.

Java-Architektur

Syntax:

Zusammenfassung( lineares_modell)

Die Zusammenfassung enthält die folgenden wesentlichen Informationen:

Reststandardfehler: Bestimmt die Standardabweichung des Fehlers, bei dem die Quadratwurzel der Varianz n minus 1 + Anzahl der beteiligten Variablen subtrahiert, anstatt durch n-1 zu dividieren. Multiples R-Quadrat: Bestimmt, wie gut Ihr Modell zu den Daten passt. Angepasstes R-Quadrat: Normalisiert mehrere R-Quadrate, indem es berücksichtigt, wie viele Stichproben Sie haben und wie viele Variablen Sie verwenden. F-Statistik: ist ein globaler Test, der prüft, ob mindestens einer Ihrer Koeffizienten ungleich Null ist.

Beispiel: Beispiel zur Darstellung der Verwendung der Funktion lm().

R

# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # view summary of linear model> summary>(linear_model)>

Ausgabe:

Anruf:

lm(Formel = y ~ x^2, Daten = df)

Restbestände:

1 2 3 4 5

2.000e+00 5.329e-15 -3.000e+00 -2.000e+00 3.000e+00

Koeffizienten:

Schätzung Std. Fehler t-Wert Pr(>|t|)

(Abschnitt) -7,0000 3,0876 -2,267 0,10821

x 6,0000 0,9309 6,445 0,00757 **

—

Signif. Codes: 0 „***“ 0,001 „**“ 0,01 „*“ 0,05 „.“ 0,1 „ “ 1

Reststandardfehler: 2,944 bei 3 Freiheitsgraden

Multiples R-Quadrat: 0,9326, angepasstes R-Quadrat: 0,9102

F-Statistik: 41,54 bei 1 und 3 DF, p-Wert: 0,007575

Diagnosediagramme

Die Diagnosediagramme helfen uns, die Beziehung zwischen verschiedenen statistischen Werten des Modells anzuzeigen. Es hilft uns bei der Analyse des Ausmaßes von Ausreißern und der Effizienz des angepassten Modells. Um Diagnosediagramme eines linearen Modells anzuzeigen, verwenden wir die Funktion plot() in der R-Sprache.

Syntax:

plot( lineares_modell )

Beispiel: Diagnosediagramme für das oben angepasste lineare Modell.

R

# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # view diagnostic plot> plot>(linear_model)>

Ausgabe:

Zeichnen eines linearen Modells

Mit der abline()-Methode können wir das oben angepasste lineare Modell grafisch darstellen, um es gut zu visualisieren. Wir zeichnen zunächst ein Streudiagramm von Datenpunkten und überlagern es dann mithilfe der Funktion abline() mit einem Abline-Diagramm des linearen Modells.

Syntax:

plot( df$x, df$y)
Logik erster Ordnung

abline( Linear_model )

Beispiel: Zeichnen eines linearen Modells

R

string zu int

# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # Plot abline plot> plot>( df$x, df$y )> abline>( linear_model)>

Ausgabe:

Sagen Sie Werte für unbekannte Datenpunkte mithilfe des angepassten Modells voraus

Um Werte für neuartige Eingaben mithilfe des oben angepassten linearen Modells vorherzusagen, verwenden wir die Funktion „predict()“. Die Funktion „predict()“ verwendet das Modell und den Datenrahmen mit unbekannten Datenpunkten und sagt den Wert für jeden Datenpunkt gemäß dem angepassten Modell voraus.

Syntax:

vorhersagen (Modell, Daten)

Parameter:

Modell: Bestimmt das lineare Modell. Daten: Bestimmt den Datenrahmen mit unbekannten Datenpunkten.

Beispiel: Vorhersage neuartiger Eingaben

R

# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # Predict values> predict>( linear_model, newdata =>data.frame>(x=>c>(15,16,17)) )>

Ausgabe:

1 2 3 83 89 95>

TechCodeview

R

Diagnosediagramme

R

Zeichnen eines linearen Modells

R

Sagen Sie Werte für unbekannte Datenpunkte mithilfe des angepassten Modells voraus

R