Hypothesentests und t-Statistiken in STATS 101G/108

Hypothesentests und t-Statistiken in STATS 101G/108: Ein Leitfaden mit aktuellen Beispielen aus dem Jahr 2026

Ob du nun die durchschnittliche Punktzahl in einem Gaming-Turnier analysierst oder die Akzeptanz einer neuen KI-App misst – Hypothesentests sind das Herzstück der Statistik. In diesem Tutorial lernst du die wichtigsten Testverfahren aus STATS 101G und STATS 108 kennen: den t-Test für Mittelwerte, den Chi-Quadrat-Test für Anteile und den F-Test für Varianzen. Wir verwenden aktuelle Beispiele aus dem Jahr 2026, um die Theorie greifbar zu machen.

1. Der t-Test für einen einzelnen Mittelwert

Die t-Statistik für einen einzelnen Mittelwert berechnet sich als:

t0 = (x̄ - μ0) / (s / √n)

Dabei ist x̄ der Stichprobenmittelwert, μ0 der hypothetische Populationsmittelwert, s die Standardabweichung und n die Stichprobengröße. Die Freiheitsgrade sind df = n - 1.

Beispiel 2026: Eine KI-Lern-App behauptet, dass Nutzer im Durchschnitt 45 Minuten pro Tag lernen. Eine Stichprobe von 30 Nutzern ergibt x̄ = 48 Minuten, s = 10 Minuten. Berechne die t-Statistik:

t0 = (48 - 45) / (10 / √30) ≈ 3 / 1,826 ≈ 1,643

Mit df = 29 und einem zweiseitigen Test auf dem 5%-Niveau vergleichst du t0 mit dem kritischen Wert aus der t-Tabelle. So entscheidest du, ob die App ihre Behauptung einhält.

2. t-Test für die Differenz zweier Mittelwerte (unabhängige Stichproben)

Bei zwei unabhängigen Gruppen lautet die Teststatistik:

t0 = (x̄1 - x̄2) / SE

Der Standardfehler (SE) hängt von den Stichprobenvarianzen und -größen ab. Die Freiheitsgrade werden mit der Welch-Approximation berechnet.

Beispiel 2026: Vergleiche die durchschnittliche Reaktionszeit von E-Sport-Spielern (Gruppe 1) und Gelegenheitsspielern (Gruppe 2). Gruppe 1: n1=25, x̄1=150ms, s1=20ms. Gruppe 2: n2=30, x̄2=170ms, s2=25ms. Berechne den Standardfehler:

SE = √(s1²/n1 + s2²/n2) = √(400/25 + 625/30) = √(16 + 20,83) ≈ √36,83 ≈ 6,07

t0 = (150 - 170) / 6,07 ≈ -20 / 6,07 ≈ -3,295

Ein so extremer t-Wert spricht für einen signifikanten Unterschied – Profis reagieren schneller.

3. t-Test für die Differenz zweier Anteile

Für zwei unabhängige Stichproben mit Anteilen p1 und p2:

t0 = (p̂1 - p̂2) / √(p̂(1-p̂)(1/n1 + 1/n2))

wobei p̂ der gepoolte Anteil ist.

Beispiel 2026: Eine Umfrage zeigt, dass 60% der FinTech-App-Nutzer (n1=200) und 45% der traditionellen Bankkunden (n2=150) mit mobilen Zahlungen zufrieden sind. Ist der Unterschied signifikant? Berechne p̂ = (0,6*200 + 0,45*150)/(200+150) ≈ 0,536. Dann:

SE = √(0,536*0,464*(1/200 + 1/150)) ≈ √(0,2487*(0,005+0,00667)) ≈ √0,00290 ≈ 0,0539

t0 = (0,60 - 0,45) / 0,0539 ≈ 2,78

Mit df = n1+n2-2 = 348 ist t0 signifikant auf dem 1%-Niveau.

4. Der Chi-Quadrat-Test

Der Chi-Quadrat-Test prüft, ob beobachtete Häufigkeiten von erwarteten abweichen. Die Teststatistik:

χ² = Σ (beobachtet - erwartet)² / erwartet

Die erwartete Häufigkeit in Zelle (i,j) einer Kontingenztafel ist: erwartet = (Zeilen-Summe * Spalten-Summe) / n.

Beispiel 2026: Ein Streaming-Dienst untersucht, ob die Vorliebe für Genres (Action, Comedy) unabhängig vom Geschlecht ist. Stichprobe: n=200. Beobachtet: Männer mögen Action 60, Comedy 40; Frauen mögen Action 30, Comedy 70. Erwartet für Männer/Action: (100*90)/200 = 45. Berechne χ² für alle Zellen:

χ² = (60-45)²/45 + (40-55)²/55 + (30-45)²/45 + (70-55)²/55 ≈ 5,0 + 4,09 + 5,0 + 4,09 ≈ 18,18

Mit df = (2-1)*(2-1)=1 und α=0,05 ist der kritische Wert 3,84 – also hochsignifikant. Geschlecht und Genrepräferenz sind abhängig.

5. Der F-Test für Varianzen

Der F-Test vergleicht zwei Varianzen:

f0 = s1² / s2²

wobei s1² die größere Varianz ist. Freiheitsgrade: df1 = n1-1, df2 = n2-1.

Beispiel 2026: Zwei KI-Startups messen die Varianz ihrer Prognosefehler. Startup A: n1=20, s1²=16. Startup B: n2=25, s2²=9. f0 = 16/9 ≈ 1,778. Mit df1=19, df2=24 und α=0,05 liegt der kritische Wert bei etwa 2,11 – also nicht signifikant. Die Varianzen sind homogen.

6. Regression: Inferenz für Achsenabschnitt und Steigung

In der einfachen linearen Regression testen wir, ob die Steigung β1 = 0 ist. Die t-Statistik für β1:

t0 = b1 / SE(b1)

mit df = n-2. Analog für den Achsenabschnitt β0.

Beispiel 2026: Ein Social-Media-Trend untersucht den Zusammenhang zwischen Werbeausgaben (x) und Klickrate (y). Aus 50 Beobachtungen ergibt sich b1 = 0,8 und SE(b1) = 0,2. t0 = 0,8/0,2 = 4,0. Mit df=48 ist dies hochsignifikant – mehr Werbung steigert die Klickrate.

Zusammenfassung

Mit diesen Werkzeugen kannst du statistische Hypothesentests in STATS 101G und STATS 108 sicher anwenden. Ob t-Test, Chi-Quadrat oder F-Test – die Formeln folgen einem klaren Schema. Übe mit aktuellen Daten aus Gaming, KI-Apps oder FinTech, um das Verständnis zu vertiefen. Denke daran: Die Freiheitsgrade und der Standardfehler sind der Schlüssel zur korrekten Interpretation.