Die Tagestemperaturen unterscheiden sich in Deutschland in einem Jahr erheblich. Am Äquator dagegen deutlich weniger. Ein Maß für die Streuung eines Datensatzes ist die Varianz. Die Erklärung für den Begriff ist: Die Varianz misst, wie die Streuung in einem weit ein Datensatz verteilt ist. Ein Wert von Null bedeutet, dass es keine Variabilität gibt. Alle Zahlen im Datensatz sind gleich.
In der mathematischen Statistik bezeichnet der Begriff „Varianz“ ein so genanntes Streumaß, und zwar ein nicht relativiertes Streumaß. Die Varianz dient der Beschreibung der Verteilung von beispielsweise Daten einer Stichprobe. Die Varianz von Daten wird berechnet, indem man die Abweichung vom Mittelwert der Stichprobe oder von einem Erwartungswert für jeden einzelnen Wert mit sich selbst multipliziert, also zum Quadrat nimmt und dann die Summe hieraus bildet, die man dann durch die um eins reduzierte Anzahl der Datensätze teilt. Für die Berechnung der ebenfalls häufig verwendeten Standardabweichung zieht man aus der für die Varianz ermittelten Zahl die Quadratwurzel.
Praktisches Beispiel für Varianz
Zum Einen benötigt man in der mathematischen Statistik die Varianz für zahlreiche weiterführende Berechnungen, zum Anderen dient sie einfach dazu, Informationen über Daten von Stichproben zu geben. So ist es zum Beispiel noch nicht sehr informativ, nur die Anzahl der Probanden einer Studie zur Körpergröße von Schulanfängern zu kennen und das statistische Mittel aller gemessenen Werte. Wie groß die Streuung um den Mittelwert ist, sagt schon etwas mehr aus. Je mehr stark vom Mittelwert abweichende Werte vorhanden sind, desto größer ist der für die Varianz errechnete Wert.
Um bei dem obigen Beispiel zu bleiben, wird dies deutlich, wenn man die Varianz betrachtet bei einer Messung der Körpergröße von Schulanfängern, also sechs- bis siebenjährigen Kindern im Vergleich zur Varianz bei einer Messung der Körpergröße von Grundschulkindern, also Kindern zwischen sechs und zehn oder elf Jahren. Die Varianz der Werte dieser zweiten Messung wird erheblich größer sein als die Varianz der ersten Messung. Misst man dagegen die Körperlänge von Neugeborenen, ist die Varianz noch deutlich kleiner.
Fazit: Die Definition des Begriffs Varianz ist: Ein Streuungsmaß einer Verteilung. Auch eine Zufallsvariable ist nicht willkürlich verteilt, sondern unterliegt einer bestimmten Verteilung. Die Varianz drückt für eine Zufallsvariable die Streuung um den Erwartungswert aus.
Umrechner