Post

R: Gene name list에서 Mitochondrial, Ribosomal gene 제거하기

grepl()

DEG를 구하고 나서나, 아니면 feature selection을 할때부터 uninformative gene은 아예 배제하고 분석하고 싶을 수도 있으니

그럴때 패턴을 사용해서 유전자리스트에서 제거하는 코드

1
2
3
# gene_list = rownames(Seurat.obj)
pattern <- "^MT-|^ND|^COX|^ATP|^CYTB|^RPL|^RPS|^RPLP|^MRPS|^MRPL"
genes_filtered <- gene_list[!grepl(pattern, gene_list)]

다른 tip

만약 DEG구할때, MT/Ribo genes의 영향을 regress out하고 싶다면 scale 단계에서 해야한다

1
2
3
4
5
6
7
8
9
10
GEX.seurOBJ[["percent.mt"]] <- PercentageFeatureSet(GEX.seurOBJ, pattern = "^MT.")
GEX.seurOBJ[["percent.Rptn"]] <- PercentageFeatureSet(GEX.seurOBJ, pattern = "^RPL.|^RPS.")

DefaultAssay(GEX.seurOBJ) <- 'RNA'
GEX.seurOBJ <- NormalizeData(GEX.seurOBJ)
GEX.seurOBJ <- FindVariableFeatures(GEX.seurOBJ)
GEX.seurOBJ <- ScaleData(GEX.seurOBJ,vars.to.regress = c("percent.mt","percent.Rptn"))
GEX.seurOBJ <- readRDS("GEX.seurOBJ_reg.out_MtRptn.rds")

FindMarkers(GEX.seurOBJ,...)

이런식

This post is licensed under CC BY 4.0 by the author.

© Subin Cho. Some rights reserved.

Using the Chirpy theme for Jekyll.