024 - The Central Limit Theorem, Clearly Explained!!!

통계에서 매우매우 중요한 정리 중 하나.

예시를 통해 이해해보자.

Central Limit Theorem Notes Screenshot.png

uniform distribution: 상수함수 → 확률 값이 일정한(uniform) 분포

여기서 20개 random sampling

Transclude of Central_Limit_Theorem_Notes_Screenshot_(1
.png)

위 샘플들의 mean을 계산하고, 이를 히스토그램으로 오른쪽에 그려보면,

Transclude of Central_Limit_Theorem_Notes_Screenshot_(2
.png)

하지만, 값이 한 개라 별로 흥미롭지는 않겠지.

근데 더 샘플을 모아서 평균을 구해보면, 점차 분포의 형태를 띄겠지.

Transclude of Central_Limit_Theorem_Notes_Screenshot_(3
.png)

Transclude of Central_Limit_Theorem_Notes_Screenshot_(4
.png)

반복하다보면,

Central Limit Theorem Notes Feb 19.png

Central Limit Theorem Notes Feb 26.png

계속하다보면, 정상 분포에 가까워진다.

사실 이게 중심극한 정리의 다임. → 많은 샘플링을 반복하다가 보면, 결국 정규분포에 가까워진다는.

Transclude of Central_Limit_Theorem_Notes_Screenshot_(5
.png)

이게 아무리 uniform distribution에서 기인했다 하더라도.

exp distribution 등 다른 분포에 적용해도 마찬가지이다.

Transclude of Central_Limit_Theorem_Notes_Screenshot_(6
.png)

이게 왜 중요할까?

Central Limit Theorem Notes May 22.png

우리가 실험을 할 때, 우리는 데이터 분포가 어디서 기인했는가 알지 못한다.
근데 중심 극한 정리에 의해 → 결국 샘플링을 충분히 하면, 정규분포가 될거야라는 것 알려주니 이걸 사용하면 됨.

Transclude of Central_Limit_Theorem_Notes_Screenshot_(7
.png)

우리가 할 일은 표본평균들의 분포가 정규분포를 따른다는 것을 알고 있으니, 이를 이용해서 신뢰도 구간을 계산하면 된다.

Transclude of Central_Limit_Theorem_Notes_Screenshot_(8
.png)

t-test, ANOVA 로

Transclude of Central_Limit_Theorem_Notes_Screenshot_(9
.png)

Transclude of Central_Limit_Theorem_Notes_Screenshot_(10
.png)

중심 극한 정리가 사용되기 위한 최소 요건은 N이 30이상이여야 한다.

Transclude of Central_Limit_Theorem_Notes_Screenshot_(12
.png)