012 - How to calculate p-values

2 types of p-value: one-sided or two-sided
일반적으로는 2-sided 다룬다.

동전 2번 연속 던져서 앞면 2번 나오는 사건에 대한 p-value를 계산해보자.

P-Value Calculation Notes Screenshot.png

P-Value Calculation Notes May 21.png

Transclude of P-Value_Calculation_Notes_Screenshot_(1
.png)

→ two-sided이니까, 양쪽 고려하고, 더 극단적인 값의 확률들을 계산
→ pdf 혹은 pmf에서 생각해보면, 경계값 기준에서 양 극단으로 적분한 형태.

결국 생각해보면, “확률분포상에서 더 극단적인 사건들의 확률 총합“ 정도로 설명할 수 있겠네.

만약, 연속적 값에 대한 p-value를 구하고 싶다면?

분포 사용해야지 뭐.

Transclude of P-Value_Calculation_Notes_Screenshot_(1
1.png)

우리가 랜덤 추출시 95%의 확률로 키가 저 구간에 속한다.

해석이 매우 중요하다.

Transclude of P-Value_Calculation_Notes_Screenshot_(2
.png)

Transclude of P-Value_Calculation_Notes_Screenshot_(3
.png)

설명: 현재 검정량이 파란색 분포 상에서 관찰하기 힘든 값이기 때문에, 그들이 조금 더 왼쪽 분포에서 나왔을 것으로 추정하는 것이 더 옳다. → 다른 분포에서 왔으므로, 다르다.

반대로 검정치가 분포 중앙에 위치한다면,

Transclude of P-Value_Calculation_Notes_Screenshot_(4
.png)

이러한 상황이 되고,

Transclude of P-Value_Calculation_Notes_Screenshot_(5
.png)

현재 검정치를 더 잘 설명할 수 있는 분포가 존재하지 않으므로, 다른 모집단에서 온 통계치라 생각하기 어렵다. → 영가설 기각 불가능.

One-sided p-value: 왜 잠재적 위험을 포함하고 있나.

Transclude of P-Value_Calculation_Notes_Screenshot_(6
.png)

더 “극단적”이라는 해석에 의해, 방향을 설정할 수 있는 경우가 두 가지여서 이상한 해석이 가능하다. 또한, two-sided에 비해 덜 보수적이다.