024 - The Central Limit Theorem, Clearly Explained!!!
통계에서 매우매우 중요한 정리 중 하나.
예시를 통해 이해해보자.

uniform distribution: 상수함수 → 확률 값이 일정한(uniform) 분포
여기서 20개 random sampling
Transclude of Central_Limit_Theorem_Notes_Screenshot_(1.png)
위 샘플들의 mean을 계산하고, 이를 히스토그램으로 오른쪽에 그려보면,
Transclude of Central_Limit_Theorem_Notes_Screenshot_(2.png)
하지만, 값이 한 개라 별로 흥미롭지는 않겠지.
근데 더 샘플을 모아서 평균을 구해보면, 점차 분포의 형태를 띄겠지.
Transclude of Central_Limit_Theorem_Notes_Screenshot_(3.png)
Transclude of Central_Limit_Theorem_Notes_Screenshot_(4.png)
반복하다보면,


계속하다보면, 정상 분포에 가까워진다.
사실 이게 중심극한 정리의 다임. → 많은 샘플링을 반복하다가 보면, 결국 정규분포에 가까워진다는.
Transclude of Central_Limit_Theorem_Notes_Screenshot_(5.png)
이게 아무리 uniform distribution에서 기인했다 하더라도.
exp distribution 등 다른 분포에 적용해도 마찬가지이다.
Transclude of Central_Limit_Theorem_Notes_Screenshot_(6.png)
이게 왜 중요할까?

우리가 실험을 할 때, 우리는 데이터 분포가 어디서 기인했는가 알지 못한다.
근데 중심 극한 정리에 의해 → 결국 샘플링을 충분히 하면, 정규분포가 될거야라는 것 알려주니 이걸 사용하면 됨.
Transclude of Central_Limit_Theorem_Notes_Screenshot_(7.png)
우리가 할 일은 표본평균들의 분포가 정규분포를 따른다는 것을 알고 있으니, 이를 이용해서 신뢰도 구간을 계산하면 된다.
Transclude of Central_Limit_Theorem_Notes_Screenshot_(8.png)
t-test, ANOVA 로
Transclude of Central_Limit_Theorem_Notes_Screenshot_(9.png)
Transclude of Central_Limit_Theorem_Notes_Screenshot_(10.png)
중심 극한 정리가 사용되기 위한 최소 요건은 N이 30이상이여야 한다.
Transclude of Central_Limit_Theorem_Notes_Screenshot_(12.png)