연구 질문에 따라 적절한 통계 검정법을 선택하는 것이 분석의 첫걸음이다. 변수 유형(연속/범주), 집단 수, 정규성 충족 여부에 따라 모수/비모수 검정을 선택한다.
용어 설명
모수 검정 (Parametric test): 데이터가 특정 분포(주로 정규분포)를 따른다고 가정하고, 그 분포의 모수(평균, 분산)를 기반으로 검정하는 방법. t-test, ANOVA 등이 해당
비모수 검정 (Non-parametric test): 분포 가정 없이 데이터의 **순위(rank)**나 부호를 이용하는 검정. 정규성이 깨지거나 순서형 데이터일 때 사용
정규성 (Normality): 데이터가 종 모양의 정규분포(Normal distribution)를 따르는지 여부. 모수 검정의 핵심 전제 조건
등분산성 (Homogeneity of variance): 비교하는 집단들의 분산(데이터가 흩어진 정도)이 서로 비슷한지 여부
종속변수 (Dependent variable, DV): 연구에서 측정하는 결과 변수 (예: 시험 점수)
독립변수 (Independent variable, IV): 연구자가 조작하거나 분류 기준으로 삼는 변수 (예: 교수법 종류)
검정 통계량 (Test statistic): 데이터로부터 계산된 하나의 숫자(t, F, χ², U 등). 이 값이 충분히 크면 귀무가설을 기각
자유도 (Degrees of freedom, df): 통계량 계산 시 자유롭게 변할 수 있는 값의 수. 표본 크기와 집단 수에 따라 결정
통계 검정법 개요
의사결정 플로우차트
flowchart TD
A["연구 질문"] --> B{"종속변수 유형?"}
B -->|연속형| C{"집단 수?"}
B -->|범주형| K["[[Chi-square test]]"]
C -->|1집단| D{"정규성?"}
C -->|2집단| E{"대응 여부?"}
C -->|3+집단| F{"정규성?"}
D -->|Yes| D1["One-sample t-test"]
D -->|No| D2["Wilcoxon signed-rank<br/>(1집단)"]
E -->|독립| G{"정규성?"}
E -->|대응| H{"정규성?"}
G -->|Yes| G1["Independent t-test"]
G -->|No| G2["[[Mann-Whitney U test]]"]
H -->|Yes| H1["Paired t-test"]
H -->|No| H2["[[Wilcoxon signed-rank test]]"]
F -->|Yes| I{"공변량?"}
F -->|No| J["[[Kruskal-Wallis test]]"]
I -->|없음| I1["[[ANOVA]]"]
I -->|있음| I2["[[ANCOVA]]"]
I1 -->|"반복측정"| I3["RM-ANOVA / [[Linear Mixed Effects Model|LMM]]"]
from scipy import statsimport pingouin as pg# Shapiro-Wilk teststat, p = stats.shapiro(data)print(f"W={stat:.4f}, p={p:.4f}")# p > 0.05 → 정규성 가정 유지# Levene's test (등분산성)stat, p = stats.levene(group1, group2)print(f"F={stat:.4f}, p={p:.4f}")# p > 0.05 → 등분산 가정 유지# 정규성 검정 (pingouin)pg.normality(df, dv='score', group='condition')