유전체 정보 연계 시스템 Genome InfraNet

분석 프로그램 검색

Study : 1711074419

연구과제 정보

accession,
2014M3C9A3064552
1711074419
대용량 전장유전체 생명정보 분석 서비스 시스템 구축 및 운용
과학기술정보통신부
한국생명공학연구원
김남신
2018
2018-06-01 ~ 2019-03-31
김남신
deepreds@kribb.re.kr
0428798162

등록 프로그램 / 파이프라인 / 웹 서비스 정보

accession,

1. 분석 파이프라인   2. 전장 유전체 분석

한글명칭 WDL 전장유전체 변이분석 및 주석추가 워크플로우 (Docker)
영문명칭
프로그램 WDL 전장유전체 변이분석 및 주석추가 워크플로우 (Docker) 프로그램.zip
매뉴얼 WDL 전장유전체 변이분석 및 주석추가 워크플로우 (Docker).zip
모식도 프로그램 전체 모식도 없음
웹 서비스 주소
주요 내용 특징 본 워크플로우는 전장유전체의 변이를 호출하고, 호출된 변이에 대하여 현재까지 보고된 정보를 주석처리한다. GATK의 best practice를 참고하여 구축 되었으며, 변이분석에 이용되는 소프트웨어들이 포함 및 설치 되어 있고, 한 번의 명령어로 총 22개의 분석과정을 한번에 수행한다. 분석은 위양성결과를 최소화 하기 위해 엄격한 필터링을 적용하였으며, 사용자가 확인 할 수 있는 각종 통계량을 제시하고, 최종적으로 주석처리된 변이들을 제시한다. 이 워크플로우는 단일 샘플뿐만 아니라, 다수의 샘플에서도 적용되며, 다수 샘플에서 적용시, 단일 샘플과 같은 프로세스가 진행된 후, 다수의 샘플을 하나의 변이호출파일로 결합하는 과정이 수행된다. 마지막으로, 이 워크프로우는 java 기반의 cromwell로 작성되었고 Docker Image로 배포되기때문에, 기존의 shell 워크플로우보다 세부적인 수정과 변경이 용이하고 다양한 소프트웨어들의 개별적인 설정없이 손쉽게 구동 가능하다.
주요 기능 본 워크플로우는 Docker Image로 구축되어 있으며, 크게 작업이 수행되는 Result 디렉토리, 분석을 위한 Reference 디렉토리, software가 포함된 opt 디렉토리를 갖는다. Reference 디렉토리는 hAnnotation, hReads와 hReference로 구성되어 있으며, hAnnotation은 주석처리를 위한 데이터베이스의 정보파일, hReads는 변이호출을 수행할 paired-end 파일들, hReference는 변이호출시 사용할 human reference 파일이 구성되어 있다.
사용방법 sudo docker run -v ${PWD}:/mnt -w /mnt centos7-essential-plus-genomics-software-installed-custom-python3:0.5 /usr/bin/java -Dconfig.file=/mnt/application.conf -jar /opt/cromwell-41.jar run /mnt/exomeseqPipeline.wdl -i /mnt/exomeseqPipeline.json
LINUX
JAVA