t-TestDer t-Test (auch Student’s T-Test genannt) vergleicht zwei Mittelwerte und zeigt an, ob sie sich voneinander unterscheiden. Der t-Test zeigt auch an, wie signifikant die Unterschiede sind. Mit anderen Worten: Es wird angezeigt, ob diese Unterschiede durch Zufall entstanden sein könnten.

Ein sehr einfaches Beispiel: Angenommen, Sie haben eine Erkältung und versuchen ein naturheilkundliches Mittel. Ihre Erkältung dauert einige Tage. Wenn Sie sich das nächste Mal erkältet haben, kaufen Sie ein rezeptfreies Medikament, und die Erkältung dauert eine Woche. Sie befragen Ihre Freunde und sie alle sagen Ihnen, dass ihre Erkältungen kürzer waren (durchschnittlich 3 Tage), als sie das homöopathische Mittel einnahmen. Was möchten Sie eigentlich wissen? Sind diese Ergebnisse wiederholbar? Ein Test kann Ihnen dies sagen, indem Sie die Mittelwerte der beiden Gruppen vergleichen und Ihnen die Wahrscheinlichkeit des Zufalls dieser Ergebnisse mitteilen.

Was ist ein t-Test? Begriff & Definition & Berechnung

In der Statistik gehört der t-Test zu den wichtigsten Verfahren, um Unterschiede zwischen Mittelwerten zu bewerten. Er wird eingesetzt, wenn untersucht werden soll, ob zwei Gruppen sich hinsichtlich einer bestimmten Messgröße signifikant voneinander unterscheiden. Dabei kann es sich beispielsweise um die Wirksamkeit eines Medikaments, den Unterschied zwischen zwei Herstellungsverfahren oder die Entwicklung vor und nach einer Intervention handeln. Der t-Test prüft, ob der beobachtete Mittelwertsunterschied rein zufällig entstanden ist oder auf einen systematischen Effekt hinweist.

Besonders relevant ist dieses Verfahren bei kleinen Stichproben, bei denen die Standardabweichung der Grundgesamtheit nicht bekannt ist. Grundlage des Tests ist die sogenannte t-Verteilung, eine Wahrscheinlichkeitsverteilung, die bei geringen Fallzahlen anstelle der Normalverteilung verwendet wird. Der t-Test lässt sich in verschiedene Varianten unterteilen – je nachdem, ob eine oder zwei Gruppen betrachtet werden und ob die Gruppen voneinander unabhängig oder verbunden sind.

Ein typisches Ergebnis des Tests ist der p-Wert, der die Wahrscheinlichkeit angibt, mit der ein beobachteter Unterschied zufällig zustande gekommen sein könnte. Liegt dieser Wert unter einem definierten Schwellenwert, meist 0,05, gilt das Ergebnis als statistisch signifikant. Der t-Test bildet damit eine zentrale Grundlage für datenbasierte Entscheidungen in Wissenschaft und Praxis.

Man stellt hierzu die sogenannte Nullhypothese auf, dass die beiden Mittelwerte nicht unterschiedlich sind, die Abweichung also zufallsbedingt ist. Zwei Grundvoraussetzungen müssen von den erhobenen Daten erfüllt werden, damit ein t-Test darauf anwendbar ist. Zum Einen muss es sich um intervallskalierte Daten handeln, was bedeutet, dass die Abstände der numerischen Werte gleich sein müssen, und zum Anderen muss eine Normalverteilung der Werte vorliegen.

Formel

In die Formel zur Berechnung von t, das aussagt, ob ein signifikanter Unterschied zwischen den zu betrachtenden Mittelwerten besteht, gehen diese Mittelwerte, die Varianzen der beiden Stichproben zu den Mittelwerten und die Anzahl der Datensätze der Stichproben ein.

Der Wert für t kann positiv oder negativ sein, je nachdem, ob die erste Stichprobe größer oder kleiner war als die zweite Stichprobe. Dies sagt über die statistische Signifikanz nichts aus. Je größer die Differenz der Mittelwerte ist, desto größer ist auch der t-Wert. Um die Aussage eines berechneten t-Wertes zu ermitteln, also um zu sehen, ob er die Nullhypothese ablehnt, muss man in einer entsprechenden Tabelle nachsehen oder diesen t-Wert wiederum in eine Formel zur Berechnung der Signifikanz von t-Werten einsetzen. Liegt der ermittelte t-Wert zum Beispiel unter dem für die Mittelwertdifferenz und die Irrtumswahrscheinlichkeit von 5% gültigen Tabellenwert, so bedeutet dies, dass es in weniger als 5% aller Fälle, in denen man diesen Hypothesentest wiederholt, vorkommt, dass die Nullhypothese abgelehnt wird, obwohl sie in Wirklichkeit zutrifft. Eine Ablehnung der Nullhypothese bedeutet, dass der Unterschied zwischen den betrachteten Mittelwerten nicht zufallsbedingt ist, sondern statistisch signifikant.

Verschiedene Testarten

Der t-Test ist ein vielseitiges statistisches Verfahren, das in drei Hauptformen unterteilt wird: den Ein-Stichproben-t-Test, den unabhängigen Zwei-Stichproben-t-Test und den gepaarten t-Test. Jede dieser Varianten dient dazu, Mittelwertsunterschiede unter bestimmten Bedingungen zu analysieren. Die Wahl des geeigneten Tests hängt vom Studiendesign und der Beziehung zwischen den zu vergleichenden Gruppen ab.

Ein-Stichproben-t-Test

Der Ein-Stichproben-t-Test wird verwendet, wenn eine einzige Stichprobe mit einem festgelegten Referenzwert verglichen werden soll. Dieser Test beantwortet die Frage, ob der Mittelwert der Stichprobe signifikant von einem hypothetischen Wert abweicht. Typische Anwendungsbeispiele finden sich in Qualitätskontrollen oder bei der Überprüfung theoretischer Erwartungen.

Beispiel:
Ein Unternehmen behauptet, dass die Lebensdauer seiner LED-Lampen im Durchschnitt 25.000 Stunden beträgt. Ein Prüflabor testet eine Stichprobe von 30 Lampen und ermittelt eine durchschnittliche Lebensdauer von 24.200 Stunden. Mithilfe eines Ein-Stichproben-t-Tests lässt sich statistisch überprüfen, ob diese Abweichung vom behaupteten Wert signifikant ist oder durch Zufall erklärt werden kann.

Zwei-Stichproben-t-Test

Der Zwei-Stichproben-t-Test, auch unabhängiger t-Test genannt, kommt zum Einsatz, wenn zwei voneinander unabhängige Gruppen miteinander verglichen werden. Dies ist beispielsweise der Fall, wenn die Blutdruckwerte zweier unterschiedlicher Patientengruppen untersucht werden. Eine wichtige Voraussetzung für diesen Test ist, dass die beiden Gruppen normalverteilt sind und ähnliche Varianzen aufweisen. Gibt es große Unterschiede in der Varianz, muss eine korrigierte Testvariante verwendet werden, etwa der Welch-Test.

Beispiel:
Ein Forscher möchte wissen, ob ein neues Medikament den Blutdruck besser senkt als ein Placebo. Er teilt die Teilnehmer zufällig in zwei Gruppen auf: Eine Gruppe erhält das Medikament, die andere ein Placebo. Nach vier Wochen werden die Blutdruckwerte beider Gruppen verglichen. Der unabhängige t-Test zeigt, ob der Unterschied zwischen den Gruppen signifikant ist oder ob er auch ohne Wirkung des Medikaments entstehen könnte.

Gepaarte t-Test

Der gepaarte t-Test hingegen dient dem Vergleich von Messwerten, die paarweise zugeordnet sind. Typisch ist der Einsatz bei Vorher-Nachher-Vergleichen, bei denen dieselben Probanden unter zwei Bedingungen getestet werden. Der Test berücksichtigt die Abhängigkeit der Messwerte und ist dadurch besonders sensitiv gegenüber kleinen Veränderungen. Auch bei Zwillingsstudien oder wiederholten Messungen bei denselben Versuchspersonen findet er Anwendung.

Beispiel:
Ein Sportwissenschaftler misst die Sprintzeit von Athleten vor und nach einem sechswöchigen Trainingsprogramm. Da die Messung an denselben Personen durchgeführt wird, sind die Daten gepaart. Der gepaarte t-Test analysiert, ob sich die durchschnittliche Sprintzeit nach dem Training signifikant verbessert hat, indem er die Differenzen der Vorher-Nachher-Werte je Person berücksichtigt.

Allen drei Formen gemeinsam ist, dass sie auf der t-Verteilung basieren und bei kleineren Stichproben zuverlässige Aussagen ermöglichen. Der jeweils berechnete t-Wert wird mit einem kritischen Schwellenwert verglichen, aus dem sich über den p-Wert die Signifikanz des Ergebnisses ableiten lässt. Der t-Test ist somit ein zentrales Werkzeug in der Statistik, das fundierte Aussagen über Unterschiede zwischen Mittelwerten ermöglicht – unabhängig vom Fachbereich oder Anwendungskontext.

Umrechner

Bruttorechner

Inflationsrechner

Mehrwertsteuer Rechner

Prozentrechnung

Verweise

Universität Köln – T-Test für Mittelwertunterschiede zwischen zwei unabhängigen Stichproben