044 - Sampling from a Distribution, Clearly Explained!!!

Transclude of Sampling_from_a_Distribution_Notes_Screenshot_(1.png)
histogram을 보면, 가장 y축 값이 높은(빈도가 많은) 부분이 자주 관찰된다는 거고, 반대로 양끝은 그만큼 극단적인 값이라 자주 관찰되지 않는 것을 볼 수 있다.
이 히스토그램을 가지고 연속함수에 근사시킬 수 있다.
Transclude of Sampling_from_a_Distribution_Notes_Screenshot_(2.png)
여기서 알고 싶은 건, “분포에서 표본은 가져오는 것”의 의미이다.
사실 그냥 뽑으라는 것.
Transclude of Sampling_from_a_Distribution_Notes_Screenshot_(3.png)
예시로,
Transclude of Sampling_from_a_Distribution_Notes_Screenshot_(4.png)
Transclude of Sampling_from_a_Distribution_Notes_Screenshot_(5.png)
보이다 싶이, 빈도 수가 가장 많은, 즉, y 축값이 가장 큰 부분에서 뽑힐 확률이 높겠지.
그렇다면, 왜 표본을 뽑고 싶은데?

Transclude of Sampling_from_a_Distribution_Notes_Screenshot_(6.png)

→ 결국 샘플 사이즈를 결정하는데 기능할 수 있다.