유전체 정보 연계 시스템 Genome InfraNet

분석 프로그램 검색

Study : 1711074419

연구과제 정보

accession,
2014M3C9A3064552
1711074419
대용량 전장유전체 생명정보 분석 서비스 시스템 구축 및 운용
과학기술정보통신부
한국생명공학연구원
김남신
2018
2018-06-01 ~ 2019-03-31
김남신
deepreds@kribb.re.kr
0428798162

등록 프로그램 / 파이프라인 / 웹 서비스 정보

accession,

1. 분석 파이프라인   2. 전장 유전체 분석

한글명칭 WDL 전사체 변이분석 및 주석추가 워크플로우 (Docker)
영문명칭
프로그램 WDL 전사체 변이분석 및 주석추가 워크플로우 (Docker) 프로그램.zip
매뉴얼 WDL 전사체 변이분석 및 주석추가 워크플로우 (Docker).zip
모식도 프로그램 전체 모식도 없음
웹 서비스 주소
주요 내용 특징 본 워크프로우는 전사체의 변이를 호출하고, 호출된 변이에 대하여 현재까지 보고된 정보를 주석처리한다. STAR를 이용한 alignment 와 GATK의 best practice를 참고하여 사용한 총 25개의 호출과정을 한번의 명령어로 수행하며, 변이분석에 활용되는 모든 소프트웨어를 설치하는 것뿐만 아니라, 전사체 발현과 관련한 splice site 예측과 각 과정의 각종 통계량, 엄격한 필터링, 그리고 9개의 데이터베이스에 보고된 변이들의 정보들을 주석처리 한다. 이 워크플로우는 기존 워크플로우에서 업데이트된 소프트웨어를 적용하여 다수의 샘플에서도 적용되도록 하였으며, 다수 샘플에서 적용시 단일 샘플과 같은 프로세스를 진행한 후, 다수의 샘플을 하나의 변이호출파일로 결합하는 과정을 수행한다. 마지막으로, 이 워크프로우는 java 기반의 cromwell로 작성되어, 기존의 shell script보다 세부적인 수정과 변경이 용이한 특징을 나타낸다.
주요 기능 Mnt 디렉토리는 hAnnotation, hReads, hReference, hResults로 구성되어 있으며, hAnnotation은 주석처리를 위한 데이터베이스의 정보파일, hReads는 변이호출을 수행할 paired-end 파일들, hReference는 변이호출시 사용할 human reference 파일, hResults는 변이호출과정의 각 step에 대한 결과물들과 최종 결과물이 저장된다. Opt 디렉토리는 변이호출과정에 필요한 software인 star, samtools, picard, gatk, snpeff 등이 포함되어 있다.
사용방법 sudo docker run -v ${PWD}:/mnt -w /mnt centos7-essential-plus-genomics-software-installed-custom-python3:0.5 /usr/bin/java -Dconfig.file=/mnt/application.conf -jar /opt/cromwell-41.jar run /mnt/rnaseqPipeline.wdl -i /mnt/rnaseqPipeline.json
LINUX
JAVA