014 - False Discovery Rates, FDR, clearly explained
์ฅ์ RNA ์์ด์ ๋ถ์ํ ๊ฑฐ๋ค. โwildโ : โnormalโ
์ธก์ ์ ํญ์ ์ ํํ ์ ์๊ธฐ์, ์กฐ๊ธ๋ผ ๋ค๋ฅผ ๊ฒ์ด๋ค.

๋ฐ๋ณตํด์ ํด๋ณด๋ฉด,

๊ทธ๋ฆฌ๊ณ ์ฌ๊ธฐ์ ๊ฐ๊ฐ์ ๋ฐ์ดํฐ๋
์ด๋ฌํ ์ ์ฒด ๋ถํฌ์์ ๊ฐ๊ฐ์ ๋ถ๋ถ์ ํด๋นํ๊ฒ ์ง.
Transclude of False_Discovery_Rates_FDR_Notes_Screenshot_(1.png)
์ด์ 3๋ง๋ฆฌ์ ์ฅ์์ RNA-sequencing์ ํ๋ค๊ณ ํด๋ณด์.
์ ๋ถ ํ๊ท ์ ๋น์ทํ๋, ๋ถํฌ์ ์ค์์์ ๊ธฐ์ธํ๋ค๊ณ ๋ณผ ์ ์๊ฒ ์ง.

์ถ๊ฐ๋ก ๋ค๋ฅธ ์ธ ๋ง๋ฆฌ์ ๋ํด ์คํ์ ํ๋ค๊ณ ํด๋ณด์.
์ญ์ ๋ง์ฐฌ๊ฐ์ง๋ก, ๋ถํฌ ์ค์์์ ๊ธฐ์ธํ๋ค๊ณ ๋ณผ ์ ์์ ๊ฒ์ด๋ค.


๋ง์ฝ ์ด ๋ ์ํ๋ค(sample 1 & 2, ๊ฐ ์ธ ๋ง๋ฆฌ)์ ๋ํด ํต๊ณ ๊ฒ์ฆ์ ํด๋ณด๋ฉด, p-value๋ ํด ๊ฒ์ด๋ค.
๋ ์ง๋จ์ ํ๊ท ์ด ๋ชจํ๊ท ์ ๊ทผ์ฒ์ ์์นํ์ฌ, ํ๊ท ๊ฐ๋ง์ผ๋ก๋ ๋ ๊ฐ์ด ๊ฐ๊ฐ ๋ค๋ฅธ ๋ถํฌ์์ ๊ธฐ์ธํ๋ค๊ณ ๋ณด๊ธด ์ด๋ ค์ธ ํ
๋.

์์ฃผ ์ฐ์ฐํ๊ฒ๋ ์๋์ ๊ฐ์ด ์ํ๋ค์ด ๋ฝํ, ํ๋ณธ ํ๊ท ๊ฐ ์ฐจ์ด๊ฐ ๊ฐ๊ฐ ๋ค๋ฅธ ๋ ์ง๋จ์์ ๊ธฐ์ธํ๋ค๊ณ ๋ณผ ์ ์์ ๋งํผ ์ฐจ์ด๊ฐ ๋ ์๋ ์๋ค. ์ด๋, p-value๋ ์์ ๊ฒ์ด๋ค. ์ด๋ฌํ ๊ฒ์ false-positive๋ผ๊ณ ํ๋ค. (type I error) : 5% ์ ์ ์์ค์ผ๋ก ๊ฒ์ฆ์ ํ๋ค๋ฉด, ๊ทธ 5%์ ์ค์ ํด๋นํ๋ ์ผ์ด์ค
Transclude of False_Discovery_Rates_FDR_Notes_Screenshot_(11.png)

.05 ์์ค ํต๊ณ ๊ฒ์ฆ์ ํ๋ค๋ฉด, false-positive๋ 5% ๋ด์ด๊ฒ ์ง.
์ผ๋ฐ์ ์ผ๋ก๋ ํฌ์ง ์์ ์์น์ด์ง๋ง, ์ธํฌ์ ์๋ฅผ ์ค์ ๊ณ ๋ คํ๋ฉด ๊ฝค ์๋นํ ์์ด๋ค.
โ domain์ ๋ฐ๋ผ์ 5%์ ์์น๋ critical ํ ์ ์๋๋ฐ, ์ด๋ฅผ ์ค์ด๊ธฐ ์ํด ์ฌ๋ฌ ๋ฐฉ๋ฒ๋ค์ด ์กด์ฌ.

-
FDRํ๋ฉด ๋น์จ ๊ทธ ์์ฒด๋ฅผ ๋งํ๋ ๊ฑฐ๋ผ, ์ค์ ๋ก๋ false positive์ ๋น์จ์ ๋งํ๋ ๊ฒ์ด์ง๋ง, ๊ด๋ก์ ์ผ๋ก ์ด๋ฅผ ๋ฅผ ์ค์ด๊ธฐ ์ํ ๋ฐฉ๋ฒ์ ๋งํ๊ธฐ๋ ํ๋ค.
e.g. Benjamini-Hochberg method(BH method) ๋ฑ -
์ค๊ฐ ๋ณต์ต

๋น์ทํ ๋ฐฉ๋ฒ์ผ๋ก ์ด๋ฅผ ๋ฐ๋ณตํด์ p-value๋ฅผ ๋ง์ด ๋ฝ์๋ณด๋ฉด..
์ด๋ฅผ histogram์ผ๋ก ํํํ๋ฉด,
Transclude of False_Discovery_Rates_FDR_Notes_Screenshot_(1
2.png)p-value๊ฐ .05 ์์ค์์ ์ ์ํ, .05๋ณด๋ค ์์ ๊ฒฝ์ฐ๊ฐ 510 ๊ฒฝ์ฐ(1๋ง p-value ์ค)
20๊ฐ์ bin ์์๋ ๊ฐ๊ฐ 5%์ฉ ๋ค์ด๊ฐ ์๋ค. (uniform distribution)

Transclude of False_Discovery_Rates_FDR_Notes_Screenshot_(2
.png)distribution์ด uniformํ๊ธฐ ๋๋ฌธ์, p-value๋ฅผ ๋ง๋ค ๋, ๊ฐ bin์ ๋ค์ด๊ฐ ํ๋ฅ ์ด ๋์ผํ๋ค.(20๊ฐ์ bin์ด๋, ๋๋ต 5%)
์ด๋ฒ์๋ ๋ฐ๋๋ก, ๊ฐ ์ํ๋ค์ ๋ค๋ฅธ ๋ถํฌ์์ ๋ฝ์ p-value๋ฅผ ๊ตฌํด๋ณด์.
(์ค์ ๋ก ๊ฐ์ด ๋ฎ๊ฒ ๋์ค๊ฒ ์ง. ์ง์ง ๋ค๋ฅธ ๋ถํฌ์์ ๋ฝ์ ์์ผ๋.)
๊ทธ๋ฌ๋ฉด p-value ์์ฒด์ ๋ถํฌ๋ ์๋์ ๊ฐ์ด ๋ ๊ฒ์ด๋ค.(p-value๊ฐ ์์์ง ๊ฒฝ์ฐ๊ฐ ๋ ๋ง๋ค.)


p-value๊ฐ ์ ์ ์์ค๋ณด๋ค ํฌ๋ค : ๋ ์ํ์ด ๊ฐ์ ๋ถํฌ์์ ๊ธฐ์ธํ๋ค. โ ์ค์ ๋ก๋ ๊ทธ๋ ์ง ์์๋ฐ(True) ์๊ฐ์ค์ ๊ธฐ๊ฐํ์ง ๋ชปํ์ผ๋, false negative : type II error
Transclude of False_Discovery_Rates_Notes_Screenshot_(1
.png)
์ด์ ์ฝํจ๋ฅผ ํ๊ฐํ๊ธฐ ์ํ ์คํ์ ๊ฐ์ ํด๋ณด์.
1๋ง๊ฐ์ ์ ์ ์๋ฅผ ๊ด์ฐฐํ ๊ฑฐ๋ค.

black: control / red: treat group
๋ง์ฝ, ์ค์ ๋ก ์ฝ์ด 1์ฒ๊ฐ์ ์ ์ ์์๋ ์์ฉ์ ํ๊ณ , ๋๋จธ์ง 9์ฒ๊ฐ์๋ ์์ฉํ์ง ์์๋ค๋ฉด,
๊ฐ๊ฐ์ ์๋์ ๊ฐ์ ๋ถํฌ๋ฅผ ๋ฐ๋ฅผ๊ฑฐ๊ณ ,

์ค์ ์ฐ๋ฆฌ๊ฐ ์ป์ ์ ์๋ ๋ถํฌ๋ ์๋์ ๊ฐ์ด ๋ ๋ถํฌ๊ฐ ํฉ์ณ์ง ํํ์ผ ๊ฑฐ๋ค.
Transclude of False_Discovery_Rates_FDR_Notes_Screenshot_(13.png)
์ ์ฒด p-value ๋ถํฌ๋


์ด๋ ๊ฒ ๊ฐ ๋ถ๋ถ์์ ๊ธฐ์ธํ ๊ฑฐ๊ณ .
๊ทธ๋์ ์ด๋ ๊ฒ cutoff ํ ์ง์ ์ผ๋ก ์ฌ์ฉํ ์ ์๋ค.(eye-ball method)

์ค์ ์ฌ์ฉํ๋ ์ ์ ์์ค์ธ .05์์๋ ์ด ๋ถ๋ถ์ด ์ค์ํ๊ฒ ์ง.
Transclude of False_Discovery_Rates_Notes_Screenshot_(11.png)
Transclude of False_Discovery_Rates_FDR_Notes_Screenshot_(14.png)

์์์ .05 bins์ ํด๋นํ๋(์๊ฐ์ค ๊ธฐ๊ฐ) p-value๋ค์ true positive์ false positive์ธ๋ฐ, ์ด๊ฑธ ๋ถ๋ฆฌํ๋ ๋ฐฉ๋ฒ์ ๋จ์ํ ๋ ๋ฎ์ ๊ฐ๋ค๋ง ์ทจํ๋ ๊ฒ.
-
์ด๊ฒ ์ ๊ฐ๋ฅํ์ง?
Transclude of False_Discovery_Rates_Notes_Screenshot_(2
.png)

-
BH method
Transclude of False_Discovery_Rates_Notes_Screenshot_(3
.png)Transclude of False_Discovery_Rates_FDR_Notes_Screenshot_(3
.png)Transclude of False_Discovery_Rates_FDR_Notes_Screenshot_(4
.png)Transclude of False_Discovery_Rates_Notes_Screenshot_(4
.png)
Transclude of False_Discovery_Rates_FDR_Notes_Screenshot_(1
5.png)
Transclude of False_Discovery_Rates_FDR_Notes_Screenshot_(3
1.png)current p-value: 0.81 / total #: 10 / rank: 9
Transclude of False_Discovery_Rates_FDR_Notes_Screenshot_(4
1.png)๋ฐ๋ณตโฆ
Transclude of False_Discovery_Rates_Notes_Screenshot_(1
2.png)Transclude of False_Discovery_Rates_FDR_Notes_Screenshot_(5
.png)