Summary
Power analysis를 통해 연구 시작 전에 필요한 최소 표본 크기를 결정한다. α, power(1-β), effect size 세 가지를 설정하면 필요 n이 결정된다. 이를 생략하면 underpowered 연구 → 재현 불가 위험.
용어 설명
- Power analysis (검정력 분석): 연구 시작 전, 원하는 검정력을 확보하기 위해 필요한 최소 표본 크기를 계산하는 절차
- Underpowered study: 표본이 너무 적어 실제 효과를 탐지할 확률이 낮은 연구. 결과를 신뢰하기 어렵고 재현이 어려움
- Cohen’s f: ANOVA용 효과 크기 지표. η²에서 변환하여 사용:
- SESOI (Smallest Effect Size Of Interest): 연구자가 “실용적으로 의미 있다”고 판단하는 최소 효과 크기. Cohen 관례보다 정교한 기준
- G*Power: 표본 크기 계산에 가장 널리 쓰이는 무료 소프트웨어
Sample Size Determination
기본 원리
수식 변수 풀이
- : 필요한 표본 크기 (구하고자 하는 값)
- : 유의수준 — Type I Error 허용 한계 (보통 0.05)
- power: 검정력 (1 − β) — 효과를 탐지할 확률 (보통 0.80 또는 0.90)
- effect size: 예상 효과 크기 — 선행 연구나 파일럿에서 추정 (예: d = 0.5)
- 검정 유형: t-test, ANOVA, χ² 등 사용할 통계 검정에 따라 공식이 달라짐
3개를 고정하면 나머지 1개가 결정된다. → Statistical Power 4원 관계 참조
일반적 설정:
- α = 0.05
- Power = 0.80 (또는 0.90)
- Effect size = 선행 연구, 파일럿, 또는 이론적 근거로 설정
검정별 표본 크기 계산
1. Independent t-test
| Effect size (d) | α | Power | n (per group) |
|---|---|---|---|
| 0.2 (small) | 0.05 | 0.80 | 394 |
| 0.5 (medium) | 0.05 | 0.80 | 64 |
| 0.8 (large) | 0.05 | 0.80 | 26 |
| 0.5 (medium) | 0.05 | 0.90 | 86 |
구체적 시나리오
“두 교수법의 시험 점수 차이를 medium effect (d=0.5)로 예상하고, 80% power, α=0.05로 검정하려면?”
→ 각 집단 64명, 총 128명 필요
2. Paired t-test
대응 설계는 개인 간 변동을 제거하므로 더 적은 n 필요:
| Effect size (dz) | α | Power | n (pairs) |
|---|---|---|---|
| 0.3 | 0.05 | 0.80 | 90 |
| 0.5 | 0.05 | 0.80 | 34 |
| 0.8 | 0.05 | 0.80 | 15 |
3. One-way ANOVA
Cohen’s f 사용:
수식 변수 풀이
- : Cohen’s f — ANOVA용 효과 크기 지표. η²를 변환하여 얻음
- : Eta-squared — 독립변수가 종속변수 분산의 몇 %를 설명하는지 (예: 0.06 = 6%)
- 변환 예시: η² = 0.06 → ≈ medium 효과
| f | η² | α | Power | k groups | n (per group) |
|---|---|---|---|---|---|
| 0.10 (small) | 0.01 | 0.05 | 0.80 | 3 | 322 |
| 0.25 (medium) | 0.06 | 0.05 | 0.80 | 3 | 53 |
| 0.40 (large) | 0.14 | 0.05 | 0.80 | 3 | 22 |
4. Chi-square test
Cramer’s V 사용:
| Cramer’s V | df | α | Power | n (total) |
|---|---|---|---|---|
| 0.1 (small) | 1 | 0.05 | 0.80 | 785 |
| 0.3 (medium) | 1 | 0.05 | 0.80 | 88 |
| 0.5 (large) | 1 | 0.05 | 0.80 | 32 |
5. 상관 분석
| r | α | Power | n |
|---|---|---|---|
| 0.1 (small) | 0.05 | 0.80 | 782 |
| 0.3 (medium) | 0.05 | 0.80 | 85 |
| 0.5 (large) | 0.05 | 0.80 | 29 |
Effect Size 설정 전략
effect size 설정이 가장 어려운 부분
| 방법 | 설명 | 권장도 |
|---|---|---|
| 선행 연구 | 유사 연구의 effect size 참조 | ★★★ |
| 파일럿 연구 | 소규모 예비 실험으로 추정 | ★★★ |
| 이론적 근거 | 최소 의미 있는 차이(MCID) 기반 | ★★★ |
| Cohen’s 관례 | small/medium/large 기준 | ★☆☆ (최후 수단) |
SESOI (Smallest Effect Size Of Interest)
“이 정도 차이 이하는 실용적으로 의미가 없다”를 정의하고, 그 효과를 탐지할 power를 확보하는 접근. Cohen의 관례적 기준보다 우수.
실제 계산 예시
Implementation
from statsmodels.stats.power import ( TTestIndPower, TTestPower, FTestAnovaPower, GofChisquarePower ) # === Independent t-test === tt = TTestIndPower() n = tt.solve_power(effect_size=0.5, alpha=0.05, power=0.8, alternative='two-sided') print(f"Independent t-test (d=0.5): n={n:.1f} per group") # → 63.8 → 64명/집단 # === Paired t-test === tp = TTestPower() n = tp.solve_power(effect_size=0.5, alpha=0.05, power=0.8, alternative='two-sided') print(f"Paired t-test (dz=0.5): n={n:.1f} pairs") # → 33.4 → 34쌍 # === One-way ANOVA === fa = FTestAnovaPower() n = fa.solve_power(effect_size=0.25, alpha=0.05, power=0.8, k_groups=3) print(f"ANOVA (f=0.25, k=3): n={n:.1f} per group") # → 52.4 → 53명/집단 # === Chi-square === chi = GofChisquarePower() n = chi.solve_power(effect_size=0.3, alpha=0.05, power=0.8, n_bins=2) print(f"Chi-square (w=0.3, df=1): n={n:.1f}") # === η² → Cohen's f 변환 === import numpy as np eta_sq = 0.06 f = np.sqrt(eta_sq / (1 - eta_sq)) print(f"η²={eta_sq} → f={f:.3f}") # → 0.253 (≈ medium)
보고 형식
논문 보고 예시 (APA)
“A priori power analysis using G*Power (Faul et al., 2007) indicated that a minimum sample size of 128 participants (64 per group) was required to detect a medium effect (Cohen’s d = 0.5) with 80% power at α = .05 (two-tailed) for an independent-samples t-test.”
관련 문서
- Statistical Power — power와 표본 크기의 관계
- Effect Size 개요 — effect size 분류 및 기준값
- Cohen’s d — t-test용 effect size
- Eta-squared — ANOVA용 effect size (η² → f 변환)