SRA에서 single cell 데이터 다운 받기
참고하면 좋은 포스트
원래 fastq-dump --split-files SRRXXXXX -v
이런식으로 하면 paired end 파일이 받아지는데
알다시피 single-cell sequencing data는 paired end(R1, R2)를 넘어서 index 파일까지 있어서 많게는 4개의 fastq파일이 생성된다.
그리고 원래의 방법으로 시도하면 4개가 다 안받아지는 사태가 발생함.
index 파일까지 모두 다 SRA에서 다운 받는 방법
SRR넘버는 알고 있다는 가정하에
1
2
prefetch SRRxxxxxx
fasterq-dump -S --include-technical SRRxxxxx -v
prefetch를 붙여주면 전체 fastq를 얻을 수 있다.
받아진 fastq파일들의 head
확인하면
This post is licensed under CC BY 4.0 by the author.