Post

SuperCell-MEGENA: Optimal G value 찾기

SuperCell-MEGENA 돌리기

SuperCell-MEGENA pipeline {.:prompt-tip}

지난번에 SuperCell로 Pseudobulk 만들고, MEGENA돌리는 코드 공유 했었는데 이 코드에서 유저가 결정해야하는 파라미터가 gamma 값이다.

이전에 SuperCell 소개글에서 언급했듯이

Gamma(g)

graining level (γ, G), the ratio between the number of single cells in the initial data and the number of metacells

이 g 값을 너무 작게 한다면 supercell의 효과가 미미할 것이고, 너무 크게 설정한다면 데이터의 heterogeneity를 무리하게 무시하는 결과를 얻을 수 있기 때문에 Optimal 값을 정하는 것이 중요하다고 할 수 있다.

오늘은 다양한 g 값으로 SuperCell-MEGENA를 돌리고, 결과로 얻은 network중에 어떤 g값으로 생성한 결과가 가장 informative한지, 네트워크의 구조적인 부분까지 고려한 optimal G finding 방법을 정리해보려고 한다.

Method 1. Neighborhood enrichment analysis

MEGENA 결과 전체로 Network만들고, LINCS에서 target gene 주변 neighborhood 선택해서 enrichment analysis하는 코드

Neighbor 는 directly 연결된 gene, level 4까지 보통 봄.

This post is licensed under CC BY 4.0 by the author.

© Subin Cho. Some rights reserved.

Using the Chirpy theme for Jekyll.