Gene Set Enrichment Analysis 해석 / GSEA 해석 / Gene Set Enrichment Analysis (GSEA)

GSEA 는 유전자들이 두 가지의 조건에서

통계적으로 의미 있는 연관성이 있는지 확인하는 실험 방법이다.

1. Gene Set Enrichment Analysis (GSEA) 의 목적

이 실험 방법은 우리가 흔히 말하는 bench work이 아니다. Bench work은 우리가 실험대에 앉아서 하는 실험들을 주로 bench work이라고 한다. 하지만 GSEA와 같은 실험 방법은 in silico 라고 한다.  in silico란 컴퓨터를 이용해서 하는 실험을 말한다. Microarray data나 RNA sequencing data 를 분석하여 우리가 관심 있는 gene set과 연관성이 있는지 확인하는 실험 방법이다.

2. GSEA의 이론 및 원리

GSEA 는 pathway, GO (Gene Ontology) 와 같이 하나의 생물학적인 특성에 관련된 유전자들이 두 가지의 조건 (control vs knock down / 정상세포 vs 암세포 등) 에서 통계적으로 의미 있는 차이를 보이며 발현되는지, 발현되는 특성이 서로 비슷 한지를 동시에 평가해주는 알고리즘이다.

3. Gene Set Enrichment Analysis 해석 / GSEA 해석

Gene Set Enrichment Analysis 해석 / GSEA 해석 / Gene Set Enrichment Analysis (GSEA)
그림출처: Nature Cancer 1, 345–358, 202

Gene set enrichment analysis의 해석은 그렇게 어렵지 않다. Analysis의 결과는 위 그림과 같이 나타내진다. 일단 Gene set enrichment analysis를 수행 하기 위해선 microarray나 RNA-seq같은 macro data가 하나 필요하다. 위 그림에서 보면 붉은색에서 파란색까지 표시된 선이 보일 것이다. 그것이 이 macro data에서 발현이 증가하는 것부터 감소하는 것까지 쭉 줄을 세워 놓았다고 생각하자.

그리고 그림 위쪽에 intestinal stem signature 혹은 KEGG wnt signaling 이라고 쓰여있는 것이 보일 것이다. 이것이 gene set이며 아까 줄을 세운 붉은색부터 파란색의 데이터에서 이 gene set들이 어디에 표시되는지 검정색 bar형태로 표시한 것이다 (바코드처럼 생긴 것).

그리고 이 bar형태의 gene들이 어느 쪽에 많이 몰려 있는지를 표시한 것이 초록색 선이 되겠다. 즉 내가 관심 있는 이 pathway의 유전자들이 특정 조건에서 (이곳에서는 control vs αKG 처리 조건) 유전자 발현이 증가하는 쪽에 존재하는지 감소하는 쪽에 존재하는지 확인하는 것이다.

이것이 통계적으로 유의미한 값이 증가하는 쪽에 몰려있으면 postive correlation 감소하는 쪽에 몰려있으면 negative correlation 이라고 하는 것이다.