Search
Duplicate
✍️

GEO 데이터 업로드 방법

공동 연구 시, 생산된 raw sequencing data 및 processed data를 GEO에 업로드해야 할 경우가 있다.
참고) GEO는 raw data와 해당 raw data의 프로세싱을 통해 얻은 processed data를 함께 업로드해야 하며, raw data만 업로드 할 경우에는 SRA를 이용한다.

요구사항

NCBI 계정을 만들고, GEO 계정을 만들자. GEO 계정은 업로드 전용으로 사용한다.
GEO 계정 정보를 잘 작성할 것. GEO 데이터 업로드 시 contact information으로 활용된다.
계정 정보 변동에 따라 해당 계정으로 업로드된 모든 데이터의 contact information이 연동되어 바뀐다고 한다.

업로드 프로세스

Metadata table을 채우자. 예시는 아래에.
ATAC-seq_metadata.xlsx
90.6KB
(1) Raw data, (2) Processed data (peak이나 expression table), (3) metadata를 하나의 폴더 안에 준비하자. 폴더 이름은 대충 구분 가능한 폴더명으로 정하자. GEO 측에서는 geo_submission_oct24 와 같은 폴더명을 추천한다.
Submit을 시작하면, FTP login 정보와 개인에게 할당된 디렉토리 위치를 준다.
리눅스 ncftplftp 로 파일을 옮길 수도 있고, 윈도우의 경우 FileZilla client를 이용해서 옮길 수 있다.
그 디렉토리에 데이터를 올린 뒤에 GEO 측에 notify 하면 된다. 데이터 전송 속도는 매우 느리다 (~1MB/s). 이 속도는 상황에 따라 더 빨라질 수도 있을 것 같지만, 여유를 두고 준비하자.