Der Chi-Quadrat-Test Der Unabhängigkeitsgrad bewertet, ob ein Zusammenhang zwischen den Kategorien der beiden Variablen besteht. Grundsätzlich gibt es zwei Arten von Zufallsvariablen und sie liefern zwei Arten von Daten: numerische und kategoriale. In Programmiersprache R Mithilfe der Chi-Quadrat-Statistik wird untersucht, ob sich die Verteilungen kategorialer Variablen voneinander unterscheiden. Der Chi-Quadrat-Test ist auch nützlich, wenn die Gesamtheit oder Anzahl der kategorialen Antworten zwischen zwei (oder mehr) unabhängigen Gruppen verglichen wird.
In der Programmiersprache R lautet die Funktion zur Durchführung eines Chi-Quadrat-Tests chisq.test()>
.
Syntax:
chisq.test(Daten)
Listenerstellung in JavaParameter:
Daten : Daten ist eine Tabelle, die Zählwerte der Variablen in der Tabelle enthält.
Wir werden die Umfragedaten in die aufnehmen MASS>
Bibliothek, die die Daten einer unter Studierenden durchgeführten Umfrage darstellt.
R
# load the MASS package> library> (MASS)> print> (> str> (survey))> |
>
>
Ausgabe:
'data.frame': 237 obs. of 12 variables: $ Sex : Factor w/ 2 levels 'Female','Male': 1 2 2 2 2 1 2 1 2 2 ... $ Wr.Hnd: num 18.5 19.5 18 18.8 20 18 17.7 17 20 18.5 ... $ NW.Hnd: num 18 20.5 13.3 18.9 20 17.7 17.7 17.3 19.5 18.5 ... $ W.Hnd : Factor w/ 2 levels 'Left','Right': 2 1 2 2 2 2 2 2 2 2 ... $ Fold : Factor w/ 3 levels 'L on R','Neither',..: 3 3 1 3 2 1 1 3 3 3 ... $ Pulse : int 92 104 87 NA 35 64 83 74 72 90 ... $ Clap : Factor w/ 3 levels 'Left','Neither',..: 1 1 2 2 3 3 3 3 3 3 ... $ Exer : Factor w/ 3 levels 'Freq','None',..: 3 2 2 2 3 3 1 1 3 3 ... $ Smoke : Factor w/ 4 levels 'Heavy','Never',..: 2 4 3 2 2 2 2 2 2 2 ... $ Height: num 173 178 NA 160 165 ... $ M.I : Factor w/ 2 levels 'Imperial','Metric': 2 1 NA 2 2 1 1 2 2 2 ... $ Age : num 18.2 17.6 16.9 20.3 23.7 ... NULL>
Das obige Ergebnis zeigt, dass der Datensatz viele Faktorvariablen enthält, die als kategoriale Variablen betrachtet werden können. Für unser Modell werden wir die Variablen berücksichtigen Exer Und Rauch .Die Spalte „Rauch“ erfasst die Rauchgewohnheiten der Schüler, während die Spalte „Exer“ ihr Trainingsniveau aufzeichnet. Unser Ziel ist es, die Hypothese zu testen, ob die Rauchgewohnheiten der Schüler auf einem Signifikanzniveau von 0,05 unabhängig von ihrem Trainingsniveau sind.
Zu einem Array Java hinzufügen
R
# Create a data frame from the main data set.> stu_data => data.frame> (survey$Smoke,survey$Exer)> # Create a contingency table with the needed variables.> stu_data => table> (survey$Smoke,survey$Exer)> > print> (stu_data)> |
>
>
Ausgabe:
Freq None Some Heavy 7 1 3 Never 87 18 84 Occas 12 3 4 Regul 9 1 7>
Und schließlich wenden wir das an chisq.test()>
Funktion zur Kontingenztabelle stu_data.
R
js gesetzt
# applying chisq.test() function> print> (> chisq.test> (stu_data))> |
>
>
Ausgabe:
Pearson's Chi-squared test data: stu_data X-squared = 5.4885, df = 6, p-value = 0.4828>
Da der p-Wert 0,4828 größer als 0,05 ist, schließen wir, dass die Rauchgewohnheit unabhängig vom Trainingsniveau des Schülers ist und daher eine schwache oder keine Korrelation zwischen den beiden Variablen besteht. Der vollständige R-Code ist unten angegeben.
Zusammenfassend lässt sich also sagen, dass es sehr einfach ist, einen Chi-Quadrat-Test mit R durchzuführen. Man kann diese Aufgabe mit durchführen chisq.test()>
Funktion in R.
Visualisieren Sie die Daten des Chi-Quadrat-Tests
R
# Load required library> library> (MASS)> # Print structure of the survey dataset> print> (> str> (survey))> # Create a data frame for smoking and exercise columns> stu_data <-> data.frame> (survey$Smoke, survey$Exer)> stu_data <-> table> (survey$Smoke, survey$Exer)> # Print the table> print> (stu_data)> # Perform the Chi-Square Test> chi_result <-> chisq.test> (stu_data)> print> (chi_result)> # Visualize the data with a bar plot> barplot> (stu_data, beside => TRUE> , col => c> (> 'lightblue'> ,> 'lightgreen'> ),> > main => 'Smoking Habits vs Exercise Levels'> ,> > xlab => 'Exercise Level'> , ylab => 'Number of Students'> )> # Add legend separately> legend> (> 'center'> , legend => rownames> (stu_data), fill => c> (> 'lightblue'> ,> 'lightgreen'> ))> |
Git, füge alles hinzu
>
>
Ausgabe:

Chi-Quadrat-Test in R
In diesem Code verwenden wir dieMASS>
Bibliothek, um einen Chi-Quadrat-Test für den „Umfrage“-Datensatz durchzuführen, der sich auf die Beziehung zwischen Rauchgewohnheiten und Trainingsniveau konzentriert.
Es erstellt eine Kontingenztabelle, führt den statistischen Test durch und visualisiert die Daten mithilfe eines Balkendiagramms. Die Legende wird separat in der oberen linken Ecke hinzugefügt und unterscheidet unterschiedliche Rauchgewohnheiten durch unterschiedliche Farben.
Der Code zielt darauf ab, die Zusammenhänge zwischen Rauchverhalten und Trainingspraktiken innerhalb des Datensatzes zu untersuchen und zu kommunizieren.