Varianz ist ein Messwert, der verwendet wird, um herauszufinden, wie die Daten im Hinblick auf den Mittelwert oder den Durchschnittswert des Datensatzes verteilt sind. Es wird verwendet, um herauszufinden, wie die Verteilungsdaten in Bezug auf den Mittelwert oder den Durchschnittswert verteilt sind. Das zur Definition der Varianz verwendete Symbol ist σ2. Es ist das Quadrat der Standardabweichung.
Es gibt zwei Arten von Varianz, die in der Statistik verwendet werden:
- Stichprobenvarianz
- Populationsvarianz
Die Populationsvarianz wird verwendet, um zu bestimmen, wie jeder Datenpunkt in einer bestimmten Population schwankt oder verteilt ist, während die Stichprobenvarianz verwendet wird, um den Durchschnitt der quadrierten Abweichungen vom Mittelwert zu ermitteln.
In diesem Artikel erfahren wir mehr darüber Varianz (Stichprobe, Population), ihre Formeln, Eigenschaften und andere im Detail.
Inhaltsverzeichnis
- Was ist Varianz?
- Arten von Varianz
- Varianzsymbol
- Varianzbeispiel
- Varianzformel
- Stichprobenvarianzformel
- Formel für die Populationsvarianz
- Varianzformel für gruppierte Daten
- Varianzformel für nicht gruppierte Daten
- Formel zur Berechnung der Varianz
- Wie berechnet man die Varianz?
- Varianz und Standardabweichung
- Varianz und Kovarianz
- Varianzeigenschaften
- Beispiele zur Varianzformel
- Zusammenfassung – Varianz
- FAQs zum Thema Varianz
Was ist Varianz?
Wir messen die verschiedenen Werte der Daten und diese Werte werden für verschiedene Zwecke verwendet. Die Daten können in zwei Arten gruppierter Daten oder nicht gruppierter (diskreter) Daten angegeben werden. Wenn die Daten in Form von Klassenintervallen angegeben werden, spricht man von gruppierten Daten. Wenn die Daten jedoch in Form eines einzelnen Datenpunkts vorliegen, spricht man von einem diskreten oder nicht gruppierten Datenpunkt. Varianz ist das Maß für die Streuung der Daten bezüglich des Mittelwerts der Daten. Es sagt uns, wie die Daten im gegebenen Datenwert verteilt sind. Wir können die Stichprobenvarianz und die Populationsvarianz sowohl für gruppierte als auch für nicht gruppierte Daten leicht berechnen.
Varianzdefinition
Varianz ist ein statistisches Maß, das die Streuung oder Streuung einer Reihe von Datenpunkten quantifiziert. Sie gibt an, wie stark die einzelnen Datenpunkte in einem Datensatz vom Mittelwert (Durchschnitt) des Datensatzes abweichen
Arten von Varianz
Wir können die Varianz der gegebenen Daten auf zwei Arten definieren:
- Populationsvarianz
- Stichprobenvarianz
Lassen Sie uns nun im Detail mehr über sie erfahren.
Populationsvarianz
Die Populationsvarianz wird verwendet, um die Streuung der gegebenen Population zu ermitteln. Die Bevölkerung wird als eine Gruppe von Menschen definiert und alle Menschen in dieser Gruppe sind Teil der Bevölkerung. Es sagt uns, wie sich die Bevölkerung einer Gruppe im Vergleich zur Durchschnittsbevölkerung unterscheidet.
Alle Mitglieder einer Gruppe werden als Bevölkerung bezeichnet. Wenn wir herausfinden möchten, wie jeder Datenpunkt in einer bestimmten Grundgesamtheit variiert oder verteilt ist, verwenden wir die Grundgesamtheitsvarianz. Es wird verwendet, um den quadratischen Abstand jedes Datenpunkts vom Mittelwert der Grundgesamtheit anzugeben.
Stichprobenvarianz
Wenn die Populationsdaten sehr groß sind, wird es schwierig, die Populationsvarianz des Datensatzes zu berechnen. In diesem Fall nehmen wir eine Stichprobe von Daten aus dem gegebenen Datensatz und ermitteln die Varianz dieses Datensatzes, die als Stichprobenvarianz bezeichnet wird. Bei der Berechnung des Stichprobenmittelwerts achten wir darauf, den Stichprobenmittelwert zu berechnen, d. h. den Mittelwert des Stichprobendatensatzes und nicht den Populationsmittelwert. Wir können die Stichprobenvarianz als Mittelwert des Quadrats der Differenz zwischen dem Stichprobendatenpunkt und dem Stichprobenmittelwert definieren.
Varianzsymbol
Das Symbol für Varianz wird in der Regel durch den griechischen Buchstaben Sigma-Quadrat (σ²) dargestellt, wenn es um die Populationsvarianz geht. Die Stichprobenvarianz wird oft mit s² bezeichnet.
Varianzbeispiel
Wir können das Konzept der Varianz anhand des unten diskutierten Beispiels verstehen.
Finden Sie die Populationsvarianz der Daten {4,6,8,10}
Lösung:
Mittelwert = (4+6+8+10)/4 = 7
4 (4-7)2 9 6 (6-7)2 1 8 (8-7)2 1 10 (10-7)2 9 Varianz = (9+1+1+9)/4 = 20/4 = 5
Somit beträgt die Varianz der Daten 5
Varianzformel
Die Varianz für einen Datensatz wird mit dem Symbol σ bezeichnet2. Bei Bevölkerungsdaten entspricht die Formel der Summe der quadrierten Differenzen der Dateneinträge vom Mittelwert dividiert durch die Anzahl der Einträge. Bei Beispieldaten hingegen dividieren wir den Zählerwert durch die Differenz zwischen der Anzahl der Einträge und Eins.
Stichprobenvarianzformel
Wenn es sich bei dem Datensatz um eine Stichprobe handelt, lautet die Varianzformel wie folgt:
P 2 = ∑ (x ich - X) 2 /(n – 1)
Wo,
- X ist der Mittelwert des Beispieldatensatzes
- N ist die Gesamtzahl der Beobachtungen
Formel für die Populationsvarianz
Wenn wir einen Bevölkerungsdatensatz haben, wird die Formel wie folgt geschrieben:
P 2 = ∑ (x ich - X) 2 /N
Wo,
- X ist der Mittelwert des Bevölkerungsdatensatzes
- N ist die Gesamtzahl der Beobachtungen
Wir können auch die Varianz für gruppierte und nicht gruppierte Datensätze berechnen. Verschiedene Formeln für die Varianz sind:
mvc Java
Varianzformel für gruppierte Daten
Für gruppierte Daten wird die Varianzformel unten erläutert:
Stichprobenvarianzformel für gruppierte Daten (σ 2 ) = ∑ f(m ich - X) 2 /(n-1)
Populationsvarianzformel für gruppierte Daten (P 2 ) = ∑ f(m ich - X) 2 /N
Wo,
- F ist die Häufigkeit jedes Intervalls
- M ich ist der Mittelpunkt des iThIntervall
- X ist der Mittelwert der gruppierten Daten
Für gruppierte Daten wird der Mittelwert wie folgt berechnet:
Mittelwert = ∑ (f ich X ich ) / ∑ f ich
Varianzformel für nicht gruppierte Daten
Für nicht gruppierte Daten wird die Varianzformel unten erläutert:
- Stichprobenvarianzformel für nicht gruppierte Daten (P 2 ) = ∑ (x ich - X) 2 /(n-1)
- Populationsvarianzformel für nicht gruppierte Daten (P 2 ) = ∑ (x ich - X) 2 /N
Wo X ist der Mittelwert der gruppierten Daten
Formel zur Berechnung der Varianz
Die zur Berechnung der Varianz verwendete Formel wird im Bild unten erläutert.

Wie berechnet man die Varianz?
Im Allgemeinen bedeutet Varianz die Populationsstandardvarianz. Die Schritte zur Berechnung der Varianz eines bestimmten Wertesatzes sind:
Schritt 1: Berechnen Sie den Mittelwert der Beobachtung mithilfe der Formel (Mittelwert = Summe der Beobachtungen/Anzahl der Beobachtungen).
Schritt 2: Berechnen Sie die quadrierten Differenzen der Datenwerte vom Mittelwert. (Datenwert – Mittelwert)2
Schritt 3: Berechnen Sie den Durchschnitt der quadrierten Differenzen der gegebenen Werte, die als Varianz des Datensatzes bezeichnet werden.
(Varianz = Summe der quadrierten Differenzen / Anzahl der Beobachtungen)
Varianz und Standardabweichung
Varianz und Standardabweichung Beides sind Maßstäbe für die zentrale Tendenz, die uns Aufschluss über das Ausmaß gibt, in dem die Werte des Datensatzes vom Zentral- oder Mittelwert des Datensatzes abweichen.
Für jeden Datensatz besteht eine eindeutige Beziehung zwischen Varianz und Standardabweichung.
Varianz = (Standardabweichung) 2
Varianz ist als Quadrat der Standardabweichung definiert, d. h. wenn wir das Quadrat der Standardabweichung für eine beliebige Datengruppe bilden, erhalten wir die Varianz dieses Datensatzes. Varianz wird über das Symbol definiert P 2 wohingegen P wird verwendet, um die Standardabweichung des Datensatzes zu definieren. Die Varianz des Datensatzes wird in quadrierten Einheiten ausgedrückt, während die Standardabweichung des Datensatzes in einer Einheit ausgedrückt wird, die dem Mittelwert des Datensatzes ähnelt.
Erfahren Sie mehr: Varianz und Standardabweichung
Varianz der Binomialverteilung
Binomialverteilung ist die diskrete Wahrscheinlichkeitsverteilung, die uns die Anzahl der positiven Ergebnisse in einem n-mal durchgeführten Binomialexperiment angibt. Das Ergebnis des Binomial-Experiments ist 0 oder 1, also entweder positiv oder negativ.
Im Binomialexperiment von N Versuchen und wo die Wahrscheinlichkeit jedes Versuchs angegeben ist P , dann ist die Varianz der Binomialverteilung gegeben durch:
P 2 = np (1 – p)
Wo 'z.B' ist definiert als der Mittelwert der Werte der Binomialverteilung.
Varianz der Poisson-Verteilung
Giftverteilung ist als diskrete Wahrscheinlichkeitsverteilung definiert, die verwendet wird, um die Wahrscheinlichkeit zu definieren, dass die Anzahl „n“ Ereignisse innerhalb des Zeitraums „x“ auftritt. Der Mittelwert in der Poisson-Verteilung wird durch das Symbol definiert l.
Bei der Poisson-Verteilung sind der Mittelwert und die Varianz des gegebenen Datensatzes gleich. Die Varianz der Poisson-Verteilung wird mit der Formel angegeben:
P 2 = λ
Varianz der Gleichverteilung
Bei einer Gleichverteilung sind die Wahrscheinlichkeitsverteilungsdaten stetig. Das Ergebnis dieser Experimente liegt im Bereich zwischen einer bestimmten Obergrenze und einer bestimmten Untergrenze. Daher werden diese Verteilungen auch als Rechteckverteilungen bezeichnet. Ob die Obergrenze oder die Höchstgrenze ist B und die untere Grenze oder die minimale Grenze ist a, dann wird die Varianz der Gleichverteilung mit der Formel berechnet:
P 2 = (1/12)(b – a) 2
Der Mittelwert der Gleichverteilung wird mit der Formel angegeben:
Mittelwert = (b + a) / 2
Wo,
- B ist die Obergrenze der Gleichverteilung
- A ist die untere Grenze der Gleichverteilung
Varianz und Kovarianz
Die Varianz des Datensatzes definiert die Volatilität aller Werte des Datensatzes in Bezug auf den Mittelwert des Datensatzes. Die Kovarianz sagt uns, wie die Zufallsvariablen miteinander in Beziehung stehen und wie sich die Änderung einer Variablen auf die Änderung anderer Variablen auswirkt.
Kovarianz kann positiv oder negativ sein. Die positive Kovarianz bedeutet, dass sich beide Variablen in Bezug auf den Mittelwert in die gleiche Richtung bewegen, während negative Kovarianz bedeutet, dass sich beide Variablen in Bezug auf den Mittelwert in entgegengesetzte Richtungen bewegen.
Für zwei Zufallsvariablen x und y, wobei x die abhängige Variable und y die unabhängige Variable ist, wird die Kovarianz mithilfe der im unten angehängten Bild genannten Formel berechnet.

Varianzeigenschaften
Varianz wird in der Mathematik, Statistik und anderen Wissenschaftszweigen häufig für verschiedene Zwecke verwendet. Varianz hat verschiedene Eigenschaften, die häufig zur Lösung verschiedener Probleme verwendet werden. Einige der grundlegenden Eigenschaften der Varianz sind:
- Die Varianz des Datensatzes ist die nicht negative Größe und der Nullwert der Varianz bedeutet, dass alle Werte des Datensatzes gleich sind.
- Ein höherer Wert der Varianz sagt uns, dass alle Datenwerte des Datensatzes weit gestreut sind, also weit vom Mittelwert des Datensatzes entfernt sind.
- Ein niedrigerer Wert der Varianz sagt uns, dass alle Datenwerte des Datensatzes nahe beieinander liegen, d. h. sie liegen sehr nahe am Mittelwert des Datensatzes.
Für jede Konstante „c“
- Var(x + c) = Var(x)
Wo X ist eine Zufallsvariable
- Var(cx) = c2
Wo X ist eine Zufallsvariable
Auch wenn A Und B sind der konstante Wert und X ist dann eine Zufallsvariable,
- Var(ax + b) = a2
Für unabhängige Variablen x1, X2, X3…,XNWir wissen das,
- Wo(x1+ x2+……+ xN) = Var(x1) + Wo(x2) +……..+Wo(xN)
Die Leute lesen auch:
- Bedeuten
- Modus
- Unterschied zwischen Varianz und Standardabweichung
Beispiele zur Varianzformel
Beispiel 1: Berechnen Sie die Varianz der Beispieldaten: 7, 11, 15, 19, 24.
Lösung:
Wir haben die Daten 7, 11, 15, 19, 24
Ermitteln Sie den Mittelwert der Daten.
x̄ = (7 + 11 + 15 + 19 + 24)/5
= 76/5
= 15,2Mit der Varianzformel erhalten wir:
P2= ∑ (xich- X)2/(n – 1)
= (67,24 + 17,64 + 0,04 + 14,44 + 77,44)/(5 – 1)
= 176,8/4
= 44,2
Beispiel 2: Berechnen Sie die Anzahl der Beobachtungen, wenn die Varianz der Daten 12 beträgt und die Summe der quadrierten Differenzen der Daten vom Mittelwert 156 beträgt.
Lösung:
Wir haben,
(Xich- X)2= 156
P2= 12
Mit der Varianzformel erhalten wir:
P2= ∑ (xich- X)2/N
12 = 156/n
n = 156/12
n = 13
Beispiel 3: Berechnen Sie die Varianz für die angegebenen Daten
| Xich | Fich |
|---|---|
| 10 | 1 |
| 4 | 3 |
| 6 | 5 |
| 8 | 1 |
Lösung:
Mittelwert (x̄) = ∑(fichXich)/∑(fich)
= (10×1 + 4×3 + 6×5 + 8×1)/(1+3+5+1)
= 60/10 = 6n = ∑(fich) = 1+3+5+1 = 10
Xich
Fich
FichXich
(Xich- X)
(Xich- X)2
Fich(Xich- X)2
10 1 10 4 16 16 4 3 12 -2 4 12 6 5 30 0 0 0 8 1 8 2 4 8 Jetzt,
P 2 = (∑ ich N F ich (X ich - X) 2 /N)
= [(16 + 12 + 0 +8)/10]
= 3,6Varianz(σ2) = 3,6
Beispiel 4: Ermitteln Sie die Varianz der folgenden Datentabelle
| Klasse | Frequenz Centos vs. Rhel |
|---|---|
| 0-10 | 3 |
| 10-20 | 6 |
| 20-30 | 4 |
| 30-40 | 2 |
| 40-50 | 1 |
Lösung:
Klasse
Xi
Fich
f×Xi
Xi – μ
(Xi – μ)2
f×(Xi – μ)2
0-10
5
3
fünfzehn
-fünfzehn
225
675
10-20
fünfzehn
6
90
-5
25
150
20-30
25
4
100
5
25
100
30-40
35
Wie viele Tasten haben Tastaturen?2
70
fünfzehn
225
450
40-50
Vier fünf
1
Vier fünf
25
625
625
Gesamt
16
320
2000
Mittelwert (μ) = ∑(fi xi)/∑(fi)
= 320/16 = 20P 2 = (∑ ich N F ich (X ich - M) 2 /N)
= [(2000)/(16)]
= (125)Die Varianz des gegebenen Datensatzes beträgt 125.
Zusammenfassung – Varianz
Varianz ist ein statistisches Maß, das zeigt, wie stark die Werte in einem Datensatz vom Mittelwert abweichen. Es hilft uns, die Ausbreitung oder Streuung von Datenpunkten zu verstehen. Es gibt zwei Haupttypen von Varianz: Populationsvarianz, die misst, wie sich Datenpunkte in einer gesamten Population verteilen, und Stichprobenvarianz, die misst, wie sich Datenpunkte in einer Stichprobe verteilen. Die Varianz wird mit σ² bezeichnet und ist das Quadrat der Standardabweichung. Um die Varianz zu berechnen, ermitteln Sie den Mittelwert der Daten, subtrahieren den Mittelwert von jedem Datenpunkt, quadrieren die Differenzen und mitteln dann diese quadrierten Differenzen. Varianz ist wichtig, weil sie uns hilft, die Variabilität innerhalb eines Datensatzes zu verstehen. Eine hohe Varianz weist darauf hin, dass die Datenpunkte weit verteilt sind, während eine niedrige Varianz darauf hinweist, dass sie nahe am Mittelwert liegen. Die Varianz ist immer nicht negativ, da es sich um die Quadrierung der Differenzen handelt.
FAQs zum Thema Varianz
Was ist Varianz in der Statistik?
Varianz ist definiert als die Streuung der Werte des Datensatzes in Bezug auf den Mittelwert des Datensatzes. Die Varianz des Datensatzes gibt an, inwieweit die Werte in einem bestimmten Datensatz vom Mittelwert abweichen.
Was ist das Varianzsymbol?
Wir verwenden die Symbole σ2, s2 und Var(x) zur Angabe der Varianz des Datensatzes.
Was ist die Varianzformel?
Die Varianz des Datensatzes wird mithilfe der Formel berechnet:
P 2 = E[( X – m ) 2 ]
Was sagt Varianz aus?
Die Varianz wird verwendet, um das Ausmaß der Streuung der Daten zu ermitteln, d. h. sie sagt uns, wie die Werte in einem Datensatz im Verhältnis zum Mittelwert verteilt sind. Für den größeren Varianzwert sind die Werte in Bezug auf den Mittelwert weit gestreut, wohingegen die Werte für den kleineren Varianzwert in Bezug auf den Mittelwert eng gestreut sind
Welche Beziehung besteht zwischen Varianz und Standardabweichung?
Für den gegebenen Datensatz ist die Varianz des Datensatzes das Quadrat der Standardabweichung dieses Datensatzes. Diese Beziehung wird ausgedrückt als:
Varianz = (Standardabweichung) 2
Wie berechnet man die Varianz?
Um die Varianz zu berechnen, ermitteln Sie zunächst den Mittelwert (Durchschnitt) des Datensatzes. Subtrahieren Sie dann den Mittelwert von jedem Datenpunkt und quadrieren Sie das Ergebnis. Berechnen Sie abschließend den Durchschnitt dieser quadrierten Differenzen.
Warum ist Varianz wichtig?
Varianz ist entscheidend für das Verständnis der Datenverteilung innerhalb eines Datensatzes. Es hilft bei der Bestimmung, wie weit die Datenpunkte vom Durchschnittswert abweichen, und gibt Aufschluss über die Variabilität oder Konsistenz innerhalb der Daten.
Was ist der Unterschied zwischen Varianz und Standardabweichung?
Während sowohl die Varianz als auch die Standardabweichung die Datenstreuung messen, ist die Standardabweichung die Quadratwurzel der Varianz. Die Standardabweichung wird in denselben Einheiten wie die Daten ausgedrückt, wodurch sie für die Angabe der Streuung besser interpretierbar ist.
Kann Varianz negativ sein?
Nein, die Varianz kann nicht negativ sein. Da er als Durchschnitt der quadrierten Differenzen vom Mittelwert berechnet wird, ist der resultierende Wert immer nicht negativ.