051 - Quantile Normalization, Clearly Explained!!!

유전자 발현 패턴을 분석하는 기술로, DNA 침 등으로 불리는 기술.
Transclude of Quantile_Normalization_Notes_Screenshot_(1.png)

Transclude of Quantile_Normalization_Notes_Screenshot_(2.png)
Transclude of Quantile_Normalization_Notes_Screenshot_(3.png)


-
GPT
Quantile normalization은 여러 샘플 간의 분포를 일치시켜 비교 가능하게 만드는 데 사용됩니다. 보통 다음과 같은 상황에서 유용합니다:
- 다양한 실험 환경과 배치 효과:
• RNA-Seq나 마이크로어레이 데이터처럼, 서로 다른 실험 조건이나 배치(batch)에서 생성된 데이터를 비교해야 할 때, 각 데이터 세트의 분포가 다를 수 있습니다.
• 예를 들어, 특정 실험에서는 어떤 조건 때문에 데이터가 전반적으로 높은 값으로 나타나고, 다른 실험에서는 낮은 값으로 나타날 수 있습니다. 이 경우 원래의 차이가 실제 생물학적 차이인지, 아니면 실험적 요인 때문인지 불명확해집니다. Quantile normalization은 각 샘플의 분포를 동일하게 만들어 이러한 영향을 최소화합니다.
- 데이터 비교성 향상:
• 여러 샘플 간에 표현량의 순위를 기준으로 데이터를 정렬하고 분포를 동일하게 맞추면, 같은 유전자가 샘플 간에 비슷한 상대적 위치를 가지게 됩니다.
• 이를 통해 서로 다른 샘플의 데이터가 동일한 기준에서 비교 가능해지고, 실제 생물학적 변화만을 비교하는 데 유리합니다.
- 이상치 완화:
• 데이터 분포를 정규화하는 과정에서 일부 극단적인 값(아웃라이어)이 평균적으로 조정됩니다.
• 이로 인해 개별 샘플 간의 불균형이 줄어들고, 분석의 신뢰도를 높일 수 있습니다.
결론적으로, quantile normalization은 실험적 노이즈와 배치 효과를 줄이고, 샘플 간 비교를 가능하게 하며, 데이터 분석의 일관성을 높이기 위해 필요한 상황에서 주로 사용됩니다.