023 - The Binomial Distribution and Test, Clearly Explained!!!
binomial distribution: 이항분포
→ e.g. 동전 앞 뒷면 분포
식으로 보자면 아래와 같이,

위 식을 조금 더 간단히 해보면,
이걸 오렌지 포도 환타 선호도로 이해해보자.
두개를 후보군으로 하여 선호도 조사를 한다고 가정했을 때, 결과가 2:1으로 나왔다고 하자. 그렇다면, 오렌지쪽이 선호도가 더 높다고 할 수 있을까? 신뢰도가 부족하잖아.(집단의 크기가 작으니) 이 신뢰도를 어떻게 검증할 것인가
만약 둘 중 선호도가 더 없다고 가정하면, 사람들이 두 환타를 각각 고를 확률은 .5로 동일할거다.
그렇다면 위의 경우가 펼쳐질 확률은
따라서 이 결과는, 둘 간 우열이 없을 때, 이 상황이 펼쳐질 확률이 .375 라는 것이다.
이 논리로, 4:3 경우까지 생각해보면,
요정도로 나온다. 위 2:1 경우보다 확률이 낮아졌지. 즉, 신뢰도가 올라갔다고 해석할 수 있겠지.
p-value가 현재 구한 특정 통계치보다 더 극단적인 통계치를 얻을 확률이니, 위 경우에서는 7 개중 4개가 기준이라고 가정해보자. 그렇다면 한쪽이 4,5,6,7 개가 나오는 경우에 대한 확률을 계산해야하고, 이때 또하나 고려해야 할 것은 one-side냐 two-side냐이다. two-side일 경우, 개수만 고려하여 누가 더 많은지는 고려하지 않아야 할 것이고, one-side라면, 누가 더 한쪽으로 쏠렸는지 고려해야 할 거다.
