Hypothesentest

Hypothesentests sind statistische Verfahren, die verwendet werden, um Annahmen über eine Population zu testen, basierend auf einer Stichprobe von Daten. Sie können verwendet werden, um zu bestätigen oder zu widerlegen, ob eine bestimmte Behauptung über eine Bevölkerungsparameter (z. B. Mittelwert, Proportion) wahr ist.

Hypothesentests folgen einem standardisierten Prozess:

  1. Nullhypothese (H0) und Alternativhypothese (HA) festlegen: Die Nullhypothese ist die Annahme, die wir testen wollen. Die Alternativhypothese ist das Gegenteil der Nullhypothese und stellt das Ergebnis dar, das wir erwarten oder hoffen zu finden.

  2. Teststatistik berechnen: Diese Statistik variiert je nach Art des Tests und den verfügbaren Daten. Sie könnte beispielsweise ein t-Test oder ein Chi-Quadrat-Test sein.

  3. P-Wert berechnen: Der P-Wert ist die Wahrscheinlichkeit, dass wir unsere beobachteten Ergebnisse (oder extremere) erhalten haben, wenn die Nullhypothese wahr ist.

  4. Entscheidung treffen: Wenn der P-Wert kleiner als unser Signifikanzniveau (üblicherweise 0.05) ist, lehnen wir die Nullhypothese ab und akzeptieren die Alternativhypothese.

Ein einfaches Beispiel für einen Hypothesentest könnte sein:

# Wir importieren die notwendigen Bibliotheken
import numpy as np
from scipy import stats

# Wir erstellen eine Stichprobe
np.random.seed(0)
sample = np.random.normal(loc=10, scale=2, size=100)

# Wir führen einen Ein-Stichproben-t-Test durch
t_statistic, p_value = stats.ttest_1samp(sample, popmean=9)

print("T Statistic: ", t_statistic)
print("P Value: ", p_value)

In diesem Python-Code erstellen wir zunächst eine Stichprobe von 100 Werten, die einer Normalverteilung mit einem Mittelwert von 10 und einer Standardabweichung von 2 folgen. Wir führen dann einen Ein-Stichproben-t-Test durch, um zu testen, ob der wahre Mittelwert der Population gleich 9 ist (das ist unsere Nullhypothese).

Die Ausgabe des Tests sind die Teststatistik und der P-Wert. Die Teststatistik ist ein Wert, der angibt, wie weit unser Stichprobenmittelwert vom hypothetischen Populationsmittelwert (unter der Nullhypothese) entfernt ist. Der P-Wert gibt an, wie wahrscheinlich es ist, einen solchen oder extremeren Wert für die Teststatistik zu erhalten, wenn die Nullhypothese wahr ist.

Wenn der P-Wert kleiner als unser gewähltes Signifikanzniveau (üblicherweise 0.05) ist, lehnen wir die Nullhypothese ab und akzeptieren stattdessen die Alternativhypothese.

Hypothesentests sind ein zentraler Bestandteil vieler Arten von statistischen Analysen und werden in vielen verschiedenen Bereichen eingesetzt, darunter Psychologie, Medizin, Wirtschaft und Sozialwissenschaften. Sie sind ein mächtiges Werkzeug zur Beantwortung von Fragen über Populationen auf Basis von Stichprobendaten.