GEO data submission: SRA에 미리 제출한 상황
이미 SRA에 raw fastq file은 업로드 마친 상황. GEO accession number받기 위해 processed file 도 준비해봄.
보통 Bulk RNA-seq의 경우, raw_count.txt matrix / single-cellRNA-seq의 경우 cellranger 결과물 (barcodes, features, matrix 세개 파일) 또는 seurat object 많이 올림.
prerequisites
- 업로드할 파일 (한폴더에 몰아둔다,
dir = /upload라고 하겠음) - meta data 엑셀 파일 (GEO홈페이지에서 🔗다운로드 가능)
Step 01. login & new submission
- NCIBI 홈페이지에서 로그인해준다.
- My NCBI 페이지로 넘어갈텐데 맨 왼쪽 상단 NIH 로고부분 눌러서 홈페이지로 돌아오기 >
Submit클릭
- Submission portal 페이지가 나오고 아래로 스크롤해서 쭉 내리면 > GEO가 나옴 클릭
…

-
GEO submission 홈페이지가 나오고 보통 sequencing data는 High-Throughput Sequence (HTS) Data. 클릭

-
Metadata spreadsheet 작성 나는 이미 SRA에 제출해서 BioProject 넘버나, SRP, SRR 넘버가 다 있는 상황이라. 아래꺼 다운받음. 본인 상황에 맡게 다운받아서 작성하자. 안에 설명이나 예시가 잘 나와있어서 어려울건 없었음.

-
Metadata까지 완성됐으면 파일 업로드해야함. 같은페이지에서 아래로 쭉 내리면
Uploading your submission섹션 나옴 >Transfer files부터 클릭
-
File transfer 하는 방법도 자세하게 나와있음. New submission이니까 골라주고.. 아래에는 credential 정보가 나옴 이거로 file upload하면 되는데. OS별로/사용하는 tool별로 업로드 방법 아래에 더 자세하게 나와있으니까 참고
새 submission할때마다 따로 folder 만들어서 진행해야하는듯. + accept되면 만들었던 folder는 자동으로 사라짐.

