044 - Sampling from a Distribution, Clearly Explained!!!

Sampling from a Distribution Notes Screenshot.png

Transclude of Sampling_from_a_Distribution_Notes_Screenshot_(1
.png)

histogram을 보면, 가장 y축 값이 높은(빈도가 많은) 부분이 자주 관찰된다는 거고, 반대로 양끝은 그만큼 극단적인 값이라 자주 관찰되지 않는 것을 볼 수 있다.

이 히스토그램을 가지고 연속함수에 근사시킬 수 있다.

Transclude of Sampling_from_a_Distribution_Notes_Screenshot_(2
.png)

여기서 알고 싶은 건, “분포에서 표본은 가져오는 것”의 의미이다.
사실 그냥 뽑으라는 것.

Transclude of Sampling_from_a_Distribution_Notes_Screenshot_(3
.png)

예시로,

Transclude of Sampling_from_a_Distribution_Notes_Screenshot_(4
.png)

Transclude of Sampling_from_a_Distribution_Notes_Screenshot_(5
.png)

보이다 싶이, 빈도 수가 가장 많은, 즉, y 축값이 가장 큰 부분에서 뽑힐 확률이 높겠지.

그렇다면, 왜 표본을 뽑고 싶은데?

Sampling from a Distribution Notes Feb 11.png

Transclude of Sampling_from_a_Distribution_Notes_Screenshot_(6
.png)

Sampling from a Distribution Notes Mar 17.png

→ 결국 샘플 사이즈를 결정하는데 기능할 수 있다.