Summary

p-value는 “차이가 있는가?”만 답하고, effect size는 “차이가 얼마나 큰가?”를 답한다. 표본 크기가 충분히 크면 사소한 차이도 유의하게 나오므로, 실질적 중요성을 판단하려면 effect size 보고가 필수적이다.

용어 설명

통계적 유의성 (Statistical significance): p-value가 기준(보통 0.05) 이하일 때, “우연이 아니라 실제 차이가 있다”고 판단하는 것. 표본이 크면 작은 차이도 유의해질 수 있음

실질적 유의성 (Practical significance): 통계적으로 유의하더라도 현실에서 의미 있을 만큼 큰 차이인지. Effect size가 이를 판단하는 지표

분산 (Variance): 데이터가 평균으로부터 얼마나 흩어져 있는지를 나타내는 수치. 클수록 데이터가 넓게 퍼져 있음

표준화 (Standardization): 단위가 다른 변수들을 동일한 척도로 변환하는 것. Effect size는 표준편차 단위로 표준화하여 연구 간 비교를 가능하게 함

SS (Sum of Squares, 제곱합): 각 데이터 값과 평균의 차이를 제곱하여 모두 더한 값. 분산을 계산하는 기초 단위

Effect Size 개요

p-value vs Effect Size

구분	p-value	Effect Size
질문	”차이가 있는가?” (유/무)	“차이가 얼마나 큰가?” (크기)
표본 크기 영향	크게 받음 (n↑ → p↓)	거의 안 받음
실용적 의미	통계적 유의성 (statistical significance)	실질적 중요성 (practical significance)
단독 보고	불충분 — 크기 정보 없음	p-value와 함께 보고 권장
해석 예시	p < 0.05 → “유의한 차이 있음”	d = 0.8 → “큰 효과”

흔한 오해

“p < 0.001이면 효과가 크다” → 틀림. p-value가 작다고 효과가 큰 것이 아니라, 표본이 클 수도 있다. 반드시 effect size를 함께 확인해야 한다.

Effect Size의 분류

1. 차이 기반 (Difference-based)

두 집단의 평균 차이를 표준화한 지표.

지표	수식	적용 맥락
Cohen’s d	$d = \frac{X ˉ _{1} - X ˉ _{2}}{s _{p}}$	독립/대응 t-test
Hedges’ g	Cohen’s d에 소표본 보정	n < 20일 때 권장
Glass’s Δ	통제 집단 SD 사용	실험 vs 통제 비교

2. 분산 설명 기반 (Variance-accounted-for)

독립변수가 종속변수 분산의 **몇 %**를 설명하는지.

지표	수식	적용 맥락
Eta-squared (η²)	$η^{2} = \frac{S S _{between}}{S S _{total}}$	ANOVA
Partial η²	$η_{p}^{2} = \frac{S S _{effect}}{S S _{effect} + S S _{error}}$	Factorial ANOVA
R²	$R^{2} = 1 - \frac{S S _{res}}{S S _{tot}}$	회귀 분석
ω² (Omega-squared)	η²의 편향 보정 버전	모집단 추정 시

3. 연관성 기반 (Association-based)

변수 간 관계의 강도.

지표	적용 맥락
Pearson’s r	연속 × 연속
Cramer’s V	범주형 × 범주형 (Chi-square test)
Standardized Beta (β)	다중 회귀 계수 비교
Point-biserial r	이분 × 연속

Cohen의 해석 기준 (Benchmarks)

지표	Small	Medium	Large
d	0.2	0.5	0.8
r	0.1	0.3	0.5
η²	0.01	0.06	0.14
Cramer’s V (df=1)	0.1	0.3	0.5

주의

Cohen 자신도 이 기준이 “임의적(arbitrary)“이라고 강조했다. 분야별 맥락에 따라 small effect도 실질적으로 중요할 수 있다 (e.g., 의학 중재의 사망률 감소).

신뢰구간과 함께 보고

Effect size도 점추정(point estimate)이므로 **신뢰구간(CI)**을 함께 보고해야 한다.

$d = 0.65, 95% CI [0.32, 0.98]$

→ 효과가 0이 아니며, small~large 범위에 있다고 해석할 수 있음.

→ Confidence Interval 참조

Implementation

import pingouin as pg
 
# independent t-test with effect size
result = pg.ttest(group1, group2, paired=False)
print(result[['T', 'p-val', 'cohen-d', 'CI95%']])
 
# ANOVA with effect size
aov = pg.anova(data=df, dv='score', between='group')
print(aov[['Source', 'F', 'p-unc', 'np2']])  # np2 = partial eta-squared

Juhyeon's Blog

탐색기

Effect Size 개요

Effect Size 개요

p-value vs Effect Size

Effect Size의 분류

1. 차이 기반 (Difference-based)

2. 분산 설명 기반 (Variance-accounted-for)

3. 연관성 기반 (Association-based)

Cohen의 해석 기준 (Benchmarks)

신뢰구간과 함께 보고

관련 문서

그래프 뷰

목차

Properties

백링크