logo

Hypothesentests verstehen

Das Testen von Hypothesen umfasst die Formulierung von Annahmen über Bevölkerungsparameter auf der Grundlage von Stichprobenstatistiken und die strenge Bewertung dieser Annahmen anhand empirischer Beweise. Dieser Artikel beleuchtet die Bedeutung des Hypothesentests und die entscheidenden Schritte, die mit dem Prozess verbunden sind.

Was ist Hypothesentest?

Das Testen von Hypothesen ist eine statistische Methode, die verwendet wird, um anhand experimenteller Daten eine statistische Entscheidung zu treffen. Das Testen von Hypothesen ist im Grunde eine Annahme, die wir über einen Populationsparameter treffen. Dabei werden zwei sich gegenseitig ausschließende Aussagen über eine Grundgesamtheit ausgewertet, um zu bestimmen, welche Aussage durch die Stichprobendaten am besten unterstützt wird.



Beispiel: Sie sagen, dass die Durchschnittsgröße in der Klasse bei 30 liegt oder dass ein Junge größer als ein Mädchen ist. All dies ist eine Annahme, die wir annehmen, und wir benötigen eine statistische Möglichkeit, dies zu beweisen. Wir brauchen eine mathematische Schlussfolgerung, was auch immer wir für wahr halten.

Hypothesen definieren

  • Nullhypothese (H 0 ): In der Statistik ist die Nullhypothese eine allgemeine Aussage oder Standardposition, dass es keinen Zusammenhang zwischen zwei gemessenen Fällen oder keinen Zusammenhang zwischen Gruppen gibt. Mit anderen Worten handelt es sich um eine Grundannahme oder um eine Annahme, die auf dem Problemwissen basiert.
    Beispiel : Die durchschnittliche Produktion eines Unternehmens beträgt 50 Einheiten pro Tag0: mu= 50.
  • Alternativhypothese (H 1 ): Die Alternativhypothese ist die beim Hypothesentest verwendete Hypothese, die im Widerspruch zur Nullhypothese steht.
    Beispiel: Die Produktion eines Unternehmens beträgt nicht 50 Einheiten pro Tag, d. h. H1: mu N fünfzig.

Schlüsselbegriffe des Hypothesentests

  • Signifikanzniveau : Es bezieht sich auf den Grad der Signifikanz, in dem wir die Nullhypothese akzeptieren oder ablehnen. Eine 100-prozentige Genauigkeit ist für die Annahme einer Hypothese nicht möglich, daher wählen wir ein Signifikanzniveau, das normalerweise bei 5 % liegt. Dies wird normalerweise mit gekennzeichnet AlphaIm Allgemeinen liegt er bei 0,05 oder 5 %, was bedeutet, dass Ihre Ausgabe zu 95 % sicher sein sollte, dass sie bei jeder Probe ein ähnliches Ergebnis liefert.
  • P-Wert: Der P-Wert oder berechnete Wahrscheinlichkeit ist die Wahrscheinlichkeit, die beobachteten/extremen Ergebnisse zu finden, wenn die Nullhypothese (H0) eines in der Studie gegebenen Problems wahr ist. Wenn Ihr P-Wert unter dem gewählten Signifikanzniveau liegt, lehnen Sie die Nullhypothese ab, d. h. Sie akzeptieren, dass Ihre Stichprobe behauptet, die Alternativhypothese zu stützen.
  • Teststatistik: Die Teststatistik ist ein numerischer Wert, der während eines Hypothesentests aus Stichprobendaten berechnet wird und dazu dient, zu bestimmen, ob die Nullhypothese abgelehnt werden soll. Er wird mit einem kritischen Wert oder p-Wert verglichen, um Entscheidungen über die statistische Signifikanz der beobachteten Ergebnisse zu treffen.
  • Kritischer Wert : Der kritische Wert in der Statistik ist ein Schwellenwert oder Grenzwert, der verwendet wird, um zu bestimmen, ob die Nullhypothese in einem Hypothesentest abgelehnt werden soll.
  • Freiheitsgrade: Freiheitsgrade sind mit der Variabilität oder Freiheit verbunden, die man bei der Schätzung eines Parameters hat. Die Freiheitsgrade hängen mit der Stichprobengröße zusammen und bestimmen die Form.

Warum verwenden wir Hypothesentests?

Das Testen von Hypothesen ist ein wichtiges Verfahren in der Statistik. Beim Hypothesentest werden zwei sich gegenseitig ausschließende Bevölkerungsaussagen ausgewertet, um zu ermitteln, welche Aussage durch die Stichprobendaten am meisten gestützt wird. Wenn wir sagen, dass die Ergebnisse dank Hypothesentests statistisch signifikant sind.

Einseitiger und zweiseitiger Test

Ein einseitiger Test konzentriert sich auf eine Richtung, entweder größer oder kleiner als ein angegebener Wert. Wir verwenden einen einseitigen Test, wenn eine klare Richtungserwartung auf der Grundlage von Vorwissen oder Theorie besteht. Der kritische Bereich liegt nur auf einer Seite der Verteilungskurve. Wenn die Stichprobe in diesen kritischen Bereich fällt, wird die Nullhypothese zugunsten der Alternativhypothese verworfen.



Einseitiger Test

Es gibt zwei Arten von einseitigen Tests:

  • Linksschwänziger (linksseitiger) Test: Die Alternativhypothese besagt, dass der wahre Parameterwert kleiner als die Nullhypothese ist. Beispiel: H0​: mu geq 50und H1:
  • und H1: mu>50

Zweiseitiger Test

Ein zweiseitiger Test berücksichtigt beide Richtungen, größer als und kleiner als ein bestimmter Wert. Wir verwenden einen zweiseitigen Test, wenn keine spezifische Richtungserwartung besteht und wir einen signifikanten Unterschied erkennen möchten.

zusammengesetzter Primärschlüssel

Beispiel: H0: in =50 und H1: mu 
eq 50



Was sind Typ-1- und Typ-2-Fehler beim Hypothesentest?

Beim Hypothesentest Fehler vom Typ I und Typ II sind zwei mögliche Fehler, die Forscher machen können, wenn sie auf der Grundlage einer Datenstichprobe Rückschlüsse auf eine Population ziehen. Diese Fehler hängen mit den Entscheidungen bezüglich der Nullhypothese und der Alternativhypothese zusammen.

  • Fehler vom Typ I: Wenn wir die Nullhypothese ablehnen, obwohl diese Hypothese wahr war. Fehler vom Typ I werden durch Alpha( Alpha).
  • Fehler vom Typ II: Wenn wir die Nullhypothese akzeptieren, ist sie jedoch falsch. Fehler vom Typ II werden mit Beta( Beta).


Die Nullhypothese ist wahr

Die Nullhypothese ist falsch

Nullhypothese ist wahr (Akzeptieren)

Richtige Entscheidung

Fehler vom Typ II (falsch negativ)

Alternativhypothese ist wahr (Ablehnen)

Fehler vom Typ I (falsch positiv)

Richtige Entscheidung

Wie funktioniert das Testen von Hypothesen?

Schritt 1: Null- und Alternativhypothese definieren

Formulieren Sie die Nullhypothese ( H_0), was keinen Effekt darstellt, und die Alternativhypothese ( H_1​), was auf einen Effekt oder Unterschied hindeutet.

Wir identifizieren zunächst das Problem, zu dem wir eine Annahme treffen wollen, wobei wir berücksichtigen, dass unsere Annahmen im Widerspruch zueinander stehen sollten Normalverteilte Daten.

Schritt 2 – Wählen Sie das Signifikanzniveau

Wählen Sie ein Signifikanzniveau ( Alpha), typischerweise 0,05, um den Schwellenwert für die Ablehnung der Nullhypothese zu bestimmen. Es verleiht unserem Hypothesentest Gültigkeit und stellt sicher, dass wir über ausreichende Daten zur Untermauerung unserer Behauptungen verfügen. Normalerweise bestimmen wir unser Signifikanzniveau vor dem Test. Der p-Wert ist das Kriterium zur Berechnung unseres Signifikanzwerts.

Schritt 3 Sammeln und analysieren Sie Daten.

Sammeln Sie relevante Daten durch Beobachtung oder Experimente. Analysieren Sie die Daten mit geeigneten statistischen Methoden, um eine Teststatistik zu erhalten.

Schritt 4 – Teststatistik berechnen

In diesem Schritt werden die Daten für die Tests ausgewertet. Wir suchen nach verschiedenen Bewertungen basierend auf den Eigenschaften der Daten. Die Wahl der Teststatistik hängt von der Art des durchgeführten Hypothesentests ab.

Es gibt verschiedene Hypothesentests, die jeweils für unterschiedliche Ziele zur Berechnung unseres Tests geeignet sind. Dies könnte ein sein Z-Test , Chi-Quadrat , T-Test , und so weiter.

  1. Z-Test : Wenn Populationsmittelwerte und Standardabweichungen bekannt sind. Häufig wird die Z-Statistik verwendet.
  2. T-Test : Wenn die Populationsstandardabweichungen unbekannt sind. und die Stichprobengröße ist kleiner als die T-Test-Statistik angemessener ist.
  3. Chi-Quadrat-Test : Der Chi-Quadrat-Test wird für kategoriale Daten oder zum Testen der Unabhängigkeit in Kontingenztabellen verwendet
  4. F-Test : Der F-Test wird häufig in der Varianzanalyse (ANOVA) verwendet, um Varianzen zu vergleichen oder die Gleichheit der Mittelwerte über mehrere Gruppen hinweg zu testen.

Wir haben einen kleineren Datensatz, daher ist der T-Test besser geeignet, unsere Hypothese zu testen.

Die T-Statistik ist ein Maß für die Differenz zwischen den Mittelwerten zweier Gruppen im Verhältnis zur Variabilität innerhalb jeder Gruppe. Er wird als Differenz zwischen den Stichprobenmittelwerten dividiert durch den Standardfehler der Differenz berechnet. Er wird auch als T-Wert oder T-Score bezeichnet.

Schritt 5 – Teststatistik vergleichen:

In dieser Phase entscheiden wir, wo wir die Nullhypothese akzeptieren oder ablehnen sollen. Es gibt zwei Möglichkeiten zu entscheiden, ob wir die Nullhypothese akzeptieren oder ablehnen sollen.

Methode A: Verwendung kritischer Werte

Beim Vergleich der Teststatistik und des tabellierten kritischen Werts, den wir haben,

  • Wenn Teststatistik> Kritischer Wert: Lehnen Sie die Nullhypothese ab.
  • Wenn Teststatistik≤kritischer Wert: Die Nullhypothese kann nicht abgelehnt werden.

Notiz: Kritische Werte sind vorgegebene Schwellenwerte, die zur Entscheidungsfindung bei Hypothesentests herangezogen werden. Bestimmen kritische Werte Zum Testen von Hypothesen beziehen wir uns normalerweise auf eine statistische Verteilungstabelle, z. B. die Normalverteilungs- oder T-Verteilungstabellen basierend auf.

Methode B: Verwendung von P-Werten

Wir können auch mithilfe des p-Werts zu einer Schlussfolgerung kommen,

Zeichenfolge in int
  • Wenn der p-Wert kleiner oder gleich dem Signifikanzniveau ist, d. h. ( pleqalpha), lehnen Sie die Nullhypothese ab. Dies weist darauf hin, dass es unwahrscheinlich ist, dass die beobachteten Ergebnisse allein durch Zufall zustande gekommen sind, was einen Beweis für die Alternativhypothese liefert.
  • Wenn der p-Wert größer als das Signifikanzniveau ist, d. h. ( pgeqalpha), können Sie die Nullhypothese nicht ablehnen. Dies legt nahe, dass die beobachteten Ergebnisse mit dem übereinstimmen, was unter der Nullhypothese zu erwarten wäre.

Notiz : Der p-Wert ist die Wahrscheinlichkeit, eine Teststatistik zu erhalten, die genauso extrem oder noch extremer ist als die in der Stichprobe beobachtete, vorausgesetzt, dass die Nullhypothese wahr ist. Bestimmen p-Wert Zum Testen von Hypothesen beziehen wir uns normalerweise auf eine statistische Verteilungstabelle, z. B. die Normalverteilungs- oder T-Verteilungstabellen basierend auf.

Schritt 7 – Interpretieren Sie die Ergebnisse

Endlich können wir unser Experiment mit Methode A oder B abschließen.

Berechnung der Teststatistik

Um unsere Hypothese über einen Populationsparameter zu validieren, verwenden wir statistische Funktionen . Wir verwenden den Z-Score, den P-Wert und das Signifikanzniveau (Alpha), um Beweise für unsere Hypothese zu erbringen normalverteilte Daten .

1. Z-Statistik:

Wenn Populationsmittelwerte und Standardabweichungen bekannt sind.

z = frac{ar{x} - mu}{frac{sigma}{sqrt{n}}}

Wo,

  • ar{x}ist der Stichprobenmittelwert,
  • μ stellt den Bevölkerungsmittelwert dar,
  • σ ist die Standardabweichung
  • und n ist die Größe der Stichprobe.

2. T-Statistik

Der T-Test wird verwendet, wenn n<30,

Die t-statistische Berechnung ergibt sich aus:

t=frac{x̄-Μ}{s/sqrt{n}}

Beispiele für Javascript-Beispielcode

Wo,

  • t = t-Score,
  • x̄ = Stichprobenmittelwert
  • μ = Bevölkerungsmittelwert,
  • s = Standardabweichung der Stichprobe,
  • n = Stichprobengröße

3. Chi-Quadrat-Test

Chi-Quadrat-Test für kategoriale Unabhängigkeitsdaten (nicht normalverteilt) unter Verwendung von:

chi^2 = sum frac{(O_{ij} - E_{ij})^2}{E_{ij}}

Wo,

  • O_{ij}ist die beobachtete Frequenz in der Zelle {ij}
  • i,j sind der Zeilen- bzw. Spaltenindex.
  • E_{ij}ist die erwartete Frequenz in der Zelle {ij}, berechnet als:
    frac{{	ext{{Zeilensumme}} 	imes 	ext{{Spaltensumme}}}}{{	ext{{Gesamtbeobachtungen}}}}

Beispiel für einen Hypothesentest aus dem wirklichen Leben

Lassen Sie uns das Testen von Hypothesen anhand von zwei realen Situationen untersuchen:

Fall A: D Gibt es ein neues Medikament, das den Blutdruck beeinflusst?

Stellen Sie sich vor, ein Pharmaunternehmen hat ein neues Medikament entwickelt, von dem es glaubt, dass es den Blutdruck bei Patienten mit Bluthochdruck wirksam senken kann. Bevor sie das Medikament auf den Markt bringen, müssen sie eine Studie durchführen, um seine Auswirkungen auf den Blutdruck zu bewerten.

Daten:

  • Vor der Behandlung: 120, 122, 118, 130, 125, 128, 115, 121, 123, 119
  • Nach der Behandlung: 115, 120, 112, 128, 122, 125, 110, 117, 119, 114

Schritt 1 : Definieren Sie die Hypothese

  • Nullhypothese : (H0)Das neue Medikament hat keinen Einfluss auf den Blutdruck.
  • Alternative Hypothese : (H1)Das neue Medikament hat eine Wirkung auf den Blutdruck.

Schritt 2: Definieren Sie das Signifikanzniveau

Betrachten wir das Signifikanzniveau bei 0,05, was die Ablehnung der Nullhypothese anzeigt.

Wenn die Beweise darauf hindeuten, dass die Wahrscheinlichkeit, dass die Ergebnisse aufgrund zufälliger Variationen beobachtet werden, weniger als 5 % beträgt.

Schritt 3 : Berechnen Sie die Teststatistik

Benutzen gepaarter T-Test Analysieren Sie die Daten, um eine Teststatistik und einen p-Wert zu erhalten.

Die Teststatistik (z. B. T-Statistik) wird basierend auf den Unterschieden zwischen Blutdruckmessungen vor und nach der Behandlung berechnet.

t = m/(s/√n)

Wo:

  • M = Mittelwert der Differenz, d. h X nach, X Vor
  • S = Standardabweichung der Differenz (d), d.h D ich ​= X nach, ich ​− X Vor,
  • N = Stichprobengröße,

dann ist m= -3,9, s= 1,8 und n= 10

Wir berechnen die T-Statistik = -9 basierend auf der Formel für den gepaarten T-Test

Schritt 4: Finden Sie den p-Wert

Die berechnete T-Statistik beträgt -9 und Freiheitsgrade df = 9, können Sie den p-Wert mithilfe einer Statistiksoftware oder einer T-Verteilungstabelle ermitteln.

also p-Wert = 8,538051223166285e-06

Schritt 5: Ergebnis

  • Wenn der p-Wert kleiner oder gleich 0,05 ist, lehnen die Forscher die Nullhypothese ab.
  • Wenn der p-Wert größer als 0,05 ist, können sie die Nullhypothese nicht ablehnen.

Abschluss: Da der p-Wert (8,538051223166285e-06) unter dem Signifikanzniveau (0,05) liegt, lehnen die Forscher die Nullhypothese ab. Es gibt statistisch signifikante Hinweise darauf, dass der durchschnittliche Blutdruck vor und nach der Behandlung mit dem neuen Medikament unterschiedlich ist.

Python-Implementierung des Hypothesentests

Lassen Sie uns Hypothesentests mit Python erstellen, bei denen wir testen, ob ein neues Medikament den Blutdruck beeinflusst. Für dieses Beispiel verwenden wir einen gepaarten T-Test. Wir werden das verwenden scipy.stats> Bibliothek für den T-Test.

Mausrad scrollt nicht richtig

Wir werden unser erstes echtes Problem über Python implementieren,

Python3

import> numpy as np> from> scipy>import> stats> # Data> before_treatment>=> np.array([>120>,>122>,>118>,>130>,>125>,>128>,>115>,>121>,>123>,>119>])> after_treatment>=> np.array([>115>,>120>,>112>,>128>,>122>,>125>,>110>,>117>,>119>,>114>])> # Step 1: Null and Alternate Hypotheses> # Null Hypothesis: The new drug has no effect on blood pressure.> # Alternate Hypothesis: The new drug has an effect on blood pressure.> null_hypothesis>=> 'The new drug has no effect on blood pressure.'> alternate_hypothesis>=> 'The new drug has an effect on blood pressure.'> # Step 2: Significance Level> alpha>=> 0.05> # Step 3: Paired T-test> t_statistic, p_value>=> stats.ttest_rel(after_treatment, before_treatment)> # Step 4: Calculate T-statistic manually> m>=> np.mean(after_treatment>-> before_treatment)> s>=> np.std(after_treatment>-> before_treatment, ddof>=>1>)># using ddof=1 for sample standard deviation> n>=> len>(before_treatment)> t_statistic_manual>=> m>/> (s>/> np.sqrt(n))> # Step 5: Decision> if> p_value <>=> alpha:> >decision>=> 'Reject'> else>:> >decision>=> 'Fail to reject'> # Conclusion> if> decision>=>=> 'Reject'>:> >conclusion>=> 'There is statistically significant evidence that the average blood pressure before and after treatment with the new drug is different.'> else>:> >conclusion>=> 'There is insufficient evidence to claim a significant difference in average blood pressure before and after treatment with the new drug.'> # Display results> print>(>'T-statistic (from scipy):'>, t_statistic)> print>(>'P-value (from scipy):'>, p_value)> print>(>'T-statistic (calculated manually):'>, t_statistic_manual)> print>(f>'Decision: {decision} the null hypothesis at alpha={alpha}.'>)> print>(>'Conclusion:'>, conclusion)>
>
>

Ausgabe:

T-statistic (from scipy): -9.0 P-value (from scipy): 8.538051223166285e-06 T-statistic (calculated manually): -9.0 Decision: Reject the null hypothesis at alpha=0.05. Conclusion: There is statistically significant evidence that the average blood pressure before and after treatment with the new drug is different.>

Im obigen Beispiel deuten die Ergebnisse angesichts der T-Statistik von etwa -9 und eines extrem kleinen p-Werts darauf hin, dass die Nullhypothese bei einem Signifikanzniveau von 0,05 stark abgelehnt werden sollte.

  • Die Ergebnisse deuten darauf hin, dass das neue Medikament, die neue Behandlung oder der neue Eingriff einen signifikanten Einfluss auf die Senkung des Blutdrucks hat.
  • Die negative T-Statistik zeigt an, dass der mittlere Blutdruck nach der Behandlung deutlich niedriger ist als der angenommene Bevölkerungsmittelwert vor der Behandlung.

Fall B : Cholesterinspiegel in einer Bevölkerung

Daten: Es wird eine Probe von 25 Personen entnommen und deren Cholesterinspiegel gemessen.

Cholesterinspiegel (mg/dl): 205, 198, 210, 190, 215, 205, 200, 192, 198, 205, 198, 202, 208, 200, 205, 198, 205, 210, 192, 205, 198, 205, 210, 192, 205.

Bevölkerungsdurchschnitt = 200

Populationsstandardabweichung (σ): 5 mg/dL (für dieses Problem angegeben)

Schritt 1: Definieren Sie die Hypothese

  • Nullhypothese (H 0 ): Der durchschnittliche Cholesterinspiegel in einer Bevölkerung beträgt 200 mg/dl.
  • Alternative Hypothese (H 1 ): Der durchschnittliche Cholesterinspiegel in einer Bevölkerung liegt unter 200 mg/dL.

Schritt 2: Definieren Sie das Signifikanzniveau

Da die Richtung der Abweichung nicht angegeben ist, gehen wir von einem zweiseitigen Test aus und anhand einer Normalverteilungstabelle können die kritischen Werte für ein Signifikanzniveau von 0,05 (zweiseitig) durch berechnet werden Z-Tabelle und betragen ungefähr -1,96 und 1,96.

Schritt 3 : Berechnen Sie die Teststatistik

Die Teststatistik wird mithilfe der Z-Formel berechnet MIT = (203,8 - 200) / (5 div sqrt{25})​ und wir bekommen dementsprechend, MIT =2,039999999999992.

Schritt 4: Ergebnis

Da der absolute Wert der Teststatistik (2,04) größer als der kritische Wert (1,96) ist, lehnen wir die Nullhypothese ab. Und kommen Sie zu dem Schluss, dass es statistisch signifikante Beweise dafür gibt, dass der durchschnittliche Cholesterinspiegel in der Bevölkerung von 200 mg/dl abweicht

Python-Implementierung des Hypothesentests

Python3

import> scipy.stats as stats> import> math> import> numpy as np> # Given data> sample_data>=> np.array(> >[>205>,>198>,>210>,>190>,>215>,>205>,>200>,>192>,>198>,>205>,>198>,>202>,>208>,>200>,>205>,>198>,>205>,>210>,>192>,>205>,>198>,>205>,>210>,>192>,>205>])> population_std_dev>=> 5> population_mean>=> 200> sample_size>=> len>(sample_data)> # Step 1: Define the Hypotheses> # Null Hypothesis (H0): The average cholesterol level in a population is 200 mg/dL.> # Alternate Hypothesis (H1): The average cholesterol level in a population is different from 200 mg/dL.> # Step 2: Define the Significance Level> alpha>=> 0.05> # Two-tailed test> # Critical values for a significance level of 0.05 (two-tailed)> critical_value_left>=> stats.norm.ppf(alpha>/>2>)> critical_value_right>=> ->critical_value_left> # Step 3: Compute the test statistic> sample_mean>=> sample_data.mean()> z_score>=> (sample_mean>-> population_mean)>/> > >(population_std_dev>/> math.sqrt(sample_size))> # Step 4: Result> # Check if the absolute value of the test statistic is greater than the critical values> if> abs>(z_score)>>max>(>abs>(critical_value_left),>abs>(critical_value_right)):> >print>(>'Reject the null hypothesis.'>)> >print>(>'There is statistically significant evidence that the average cholesterol level in the population is different from 200 mg/dL.'>)> else>:> >print>(>'Fail to reject the null hypothesis.'>)> >print>(>'There is not enough evidence to conclude that the average cholesterol level in the population is different from 200 mg/dL.'>)>
>
>

Ausgabe:

Reject the null hypothesis. There is statistically significant evidence that the average cholesterol level in the population is different from 200 mg/dL.>

Einschränkungen des Hypothesentests

  • Obwohl es sich um eine nützliche Technik handelt, bietet das Testen von Hypothesen keinen umfassenden Überblick über das untersuchte Thema. Ohne die Komplexität oder den gesamten Kontext der Phänomene vollständig wiederzugeben, konzentriert es sich auf bestimmte Hypothesen und statistische Signifikanz.
  • Die Genauigkeit der Ergebnisse von Hypothesentests hängt von der Qualität der verfügbaren Daten und der Eignung der verwendeten statistischen Methoden ab. Ungenaue Daten oder schlecht formulierte Hypothesen können zu falschen Schlussfolgerungen führen.
  • Sich ausschließlich auf Hypothesentests zu verlassen, kann dazu führen, dass Analysten signifikante Muster oder Zusammenhänge in den Daten übersehen, die von den spezifischen, getesteten Hypothesen nicht erfasst werden. Diese Einschränkung unterstreicht, wie wichtig es ist, Hypothesentests durch andere analytische Ansätze zu ergänzen.

Abschluss

Das Testen von Hypothesen ist ein Eckpfeiler der statistischen Analyse und ermöglicht es Datenwissenschaftlern, mit Unsicherheiten umzugehen und glaubwürdige Schlussfolgerungen aus Beispieldaten zu ziehen. Durch die systematische Definition von Null- und Alternativhypothesen, die Auswahl von Signifikanzniveaus und den Einsatz statistischer Tests können Forscher die Gültigkeit ihrer Annahmen beurteilen. Der Artikel erläutert auch die entscheidende Unterscheidung zwischen Fehlern vom Typ I und Typ II und vermittelt ein umfassendes Verständnis des differenzierten Entscheidungsprozesses, der dem Testen von Hypothesen innewohnt. Das reale Beispiel der Prüfung der Wirkung eines neuen Medikaments auf den Blutdruck mithilfe eines gepaarten T-Tests zeigt die praktische Anwendung dieser Prinzipien und unterstreicht die Bedeutung statistischer Genauigkeit bei der datengesteuerten Entscheidungsfindung.

Häufig gestellte Fragen (FAQs)

1. Welche 3 Arten von Hypothesentests gibt es?

Es gibt drei Arten von Hypothesentests: rechtsseitige, linksseitige und zweiseitige. Rechtsseitige Tests beurteilen, ob ein Parameter größer ist, linksseitige Tests, wenn er kleiner ist. Bei zweiseitigen Tests wird auf größere oder kleinere ungerichtete Unterschiede geprüft.

2.Was sind die 4 Komponenten des Hypothesentests?

Nullhypothese ( H_o): Es besteht kein Effekt oder Unterschied.

Alternative Hypothese ( H_1): Es liegt ein Effekt oder Unterschied vor.

Signifikanzniveau ( Alpha): Risiko der Ablehnung der Nullhypothese, wenn sie wahr ist (Fehler Typ I).

Teststatistik: Numerischer Wert, der beobachtete Beweise gegen die Nullhypothese darstellt.

3.Was ist Hypothesentest im ML?

Statistische Methode zur Bewertung der Leistung und Gültigkeit von Modellen für maschinelles Lernen. Testet spezifische Hypothesen zum Modellverhalten, z. B. ob Merkmale Vorhersagen beeinflussen oder ob sich ein Modell gut auf unsichtbare Daten verallgemeinern lässt.

4.Was ist der Unterschied zwischen Pytest und Hypothese in Python?

Pytest dient als allgemeines Test-Framework für Python-Code, während Hypothesis ein eigenschaftsbasiertes Test-Framework für Python ist, das sich auf die Generierung von Testfällen basierend auf bestimmten Eigenschaften des Codes konzentriert.


Bereiten Sie sich auf den Test-Mockito vor