Summary

연구 질문에 따라 적절한 통계 검정법을 선택하는 것이 분석의 첫걸음이다. 변수 유형(연속/범주), 집단 수, 정규성 충족 여부에 따라 모수/비모수 검정을 선택한다.

용어 설명

  • 모수 검정 (Parametric test): 데이터가 특정 분포(주로 정규분포)를 따른다고 가정하고, 그 분포의 모수(평균, 분산)를 기반으로 검정하는 방법. t-test, ANOVA 등이 해당
  • 비모수 검정 (Non-parametric test): 분포 가정 없이 데이터의 **순위(rank)**나 부호를 이용하는 검정. 정규성이 깨지거나 순서형 데이터일 때 사용
  • 정규성 (Normality): 데이터가 종 모양의 정규분포(Normal distribution)를 따르는지 여부. 모수 검정의 핵심 전제 조건
  • 등분산성 (Homogeneity of variance): 비교하는 집단들의 분산(데이터가 흩어진 정도)이 서로 비슷한지 여부
  • 종속변수 (Dependent variable, DV): 연구에서 측정하는 결과 변수 (예: 시험 점수)
  • 독립변수 (Independent variable, IV): 연구자가 조작하거나 분류 기준으로 삼는 변수 (예: 교수법 종류)
  • 검정 통계량 (Test statistic): 데이터로부터 계산된 하나의 숫자(t, F, χ², U 등). 이 값이 충분히 크면 귀무가설을 기각
  • 자유도 (Degrees of freedom, df): 통계량 계산 시 자유롭게 변할 수 있는 값의 수. 표본 크기와 집단 수에 따라 결정

통계 검정법 개요

의사결정 플로우차트

flowchart TD
    A["연구 질문"] --> B{"종속변수 유형?"}

    B -->|연속형| C{"집단 수?"}
    B -->|범주형| K["[[Chi-square test]]"]

    C -->|1집단| D{"정규성?"}
    C -->|2집단| E{"대응 여부?"}
    C -->|3+집단| F{"정규성?"}

    D -->|Yes| D1["One-sample t-test"]
    D -->|No| D2["Wilcoxon signed-rank<br/>(1집단)"]

    E -->|독립| G{"정규성?"}
    E -->|대응| H{"정규성?"}

    G -->|Yes| G1["Independent t-test"]
    G -->|No| G2["[[Mann-Whitney U test]]"]

    H -->|Yes| H1["Paired t-test"]
    H -->|No| H2["[[Wilcoxon signed-rank test]]"]

    F -->|Yes| I{"공변량?"}
    F -->|No| J["[[Kruskal-Wallis test]]"]

    I -->|없음| I1["[[ANOVA]]"]
    I -->|있음| I2["[[ANCOVA]]"]

    I1 -->|"반복측정"| I3["RM-ANOVA / [[Linear Mixed Effects Model|LMM]]"]

모수 vs 비모수 검정 비교표

상황모수 검정 (Parametric)비모수 검정 (Non-parametric)
가정정규성, 등분산성분포 가정 없음
검정 통계량평균 기반 (t, F)순위 기반 (U, W, H)
검정력가정 충족 시 높음가정 위반 시에도 robust
적용연속형, 충분한 n순서형, 소표본, 비정규

대응 관계

상황모수비모수Effect Size
독립 2집단Independent t-testMann-Whitney U testCohen’s d, r
대응 2집단Paired t-testWilcoxon signed-rank testCohen’s d, r
독립 3+집단One-way ANOVAKruskal-Wallis testη²
반복측정 3+집단RM-ANOVA / LMMFriedman testKendall’s W
공변량 통제ANCOVAQuade testpartial η²
범주형 연관Chi-square testCramer’s V

정규성 검정 방법

검정법 선택 전에 데이터의 정규성을 확인해야 한다.

방법특징
Shapiro-Wilk test소표본(n < 50)에서 가장 검정력 높음
Kolmogorov-Smirnov test대표본에 적합
Q-Q plot시각적 확인 — 직선에서 벗어나면 비정규
왜도/첨도|skewness| < 2, |kurtosis| < 7 이면 대략 정규

Implementation

from scipy import stats
import pingouin as pg
 
# Shapiro-Wilk test
stat, p = stats.shapiro(data)
print(f"W={stat:.4f}, p={p:.4f}")
# p > 0.05 → 정규성 가정 유지
 
# Levene's test (등분산성)
stat, p = stats.levene(group1, group2)
print(f"F={stat:.4f}, p={p:.4f}")
# p > 0.05 → 등분산 가정 유지
 
# 정규성 검정 (pingouin)
pg.normality(df, dv='score', group='condition')

등분산성 검정

방법적용
Levene’s test정규성 가정 불필요, 가장 범용적
Bartlett’s test정규 분포일 때 검정력 높음
Brown-Forsythe testLevene의 중위수 버전, 비대칭에 강건

등분산 위반 시 대처

  • t-test → Welch’s t-test 사용 (scipy 기본값)
  • ANOVA → Welch’s ANOVA 또는 Games-Howell post-hoc

관련 문서