Post

SRA에서 single cell 데이터 다운 받기

참고하면 좋은 포스트

👉 SRA 기본 설명
👉 SRA toolkit 설치
👉 SRA 다운받은 이후 분석

원래 fastq-dump --split-files SRRXXXXX -v 이런식으로 하면 paired end 파일이 받아지는데

알다시피 single-cell sequencing data는 paired end(R1, R2)를 넘어서 index 파일까지 있어서 많게는 4개의 fastq파일이 생성된다.

그리고 원래의 방법으로 시도하면 4개가 다 안받아지는 사태가 발생함.

index 파일까지 모두 다 SRA에서 다운 받는 방법

SRR넘버는 알고 있다는 가정하에

1
2
prefetch SRRxxxxxx
fasterq-dump -S --include-technical SRRxxxxx -v 

prefetch를 붙여주면 전체 fastq를 얻을 수 있다.

받아진 fastq파일들의 head 확인하면

This post is licensed under CC BY 4.0 by the author.

© Subin Cho. Some rights reserved.

Using the Chirpy theme for Jekyll.