012 - How to calculate p-values
2 types of p-value: one-sided or two-sided
일반적으로는 2-sided 다룬다.
동전 2번 연속 던져서 앞면 2번 나오는 사건에 대한 p-value를 계산해보자.


Transclude of P-Value_Calculation_Notes_Screenshot_(1.png)
→ two-sided이니까, 양쪽 고려하고, 더 극단적인 값의 확률들을 계산
→ pdf 혹은 pmf에서 생각해보면, 경계값 기준에서 양 극단으로 적분한 형태.
결국 생각해보면, “확률분포상에서 더 극단적인 사건들의 확률 총합“ 정도로 설명할 수 있겠네.
만약, 연속적 값에 대한 p-value를 구하고 싶다면?

분포 사용해야지 뭐.
Transclude of P-Value_Calculation_Notes_Screenshot_(11.png)
우리가 랜덤 추출시 95%의 확률로 키가 저 구간에 속한다.
해석이 매우 중요하다.
Transclude of P-Value_Calculation_Notes_Screenshot_(2.png)
Transclude of P-Value_Calculation_Notes_Screenshot_(3.png)
설명: 현재 검정량이 파란색 분포 상에서 관찰하기 힘든 값이기 때문에, 그들이 조금 더 왼쪽 분포에서 나왔을 것으로 추정하는 것이 더 옳다. → 다른 분포에서 왔으므로, 다르다.
반대로 검정치가 분포 중앙에 위치한다면,
Transclude of P-Value_Calculation_Notes_Screenshot_(4.png)
이러한 상황이 되고,
Transclude of P-Value_Calculation_Notes_Screenshot_(5.png)
현재 검정치를 더 잘 설명할 수 있는 분포가 존재하지 않으므로, 다른 모집단에서 온 통계치라 생각하기 어렵다. → 영가설 기각 불가능.
One-sided p-value: 왜 잠재적 위험을 포함하고 있나.
Transclude of P-Value_Calculation_Notes_Screenshot_(6.png)
더 “극단적”이라는 해석에 의해, 방향을 설정할 수 있는 경우가 두 가지여서 이상한 해석이 가능하다. 또한, two-sided에 비해 덜 보수적이다.