유전체 정보 연계 시스템 Genome InfraNet

분석 프로그램 검색

Study : 1711074419

연구과제 정보

accession,
2014M3C9A3064552
1711074419
대용량 전장유전체 생명정보 분석 서비스 시스템 구축 및 운용
과학기술정보통신부
한국생명공학연구원
김남신
2018
2018-06-01 ~ 2019-03-31
김남신
deepreds@kribb.re.kr
0428798162

등록 프로그램 / 파이프라인 / 웹 서비스 정보

accession,

1. 분석 파이프라인   2. 전장 유전체 분석

한글명칭 WDL 체세포 변이분석 및 주석추가 워크플로우 (Docker)
영문명칭
프로그램 WDL 체세포 변이분석 및 주석추가 워크플로우 (Docker) 프로그램.zip
매뉴얼 WDL 체세포 변이분석 및 주석추가 워크플로우 (Docker).zip
모식도 프로그램 전체 모식도 없음
웹 서비스 주소
주요 내용 특징 본 워크프로우는 GATK에서 기반한 mutect2를 이용하여 체세포 (암샘플) 변이의 발굴을 목표로 하고있다. 암 유전학에서의 암세포(샘플)의 변이의 발굴은 매우 중요하며 이에 mutect2를 활용한 변이 발굴 후 주석을 추가하여 정보를 제공하고자 한다. GATK의 best practice를 참고하여 구축하였으며, 변이 발굴 및 분석에 이용되는 소프트웨어들이 포함되어있고 한번의 명령어로 총 21개의 분석과정을 한번에 수행하게 된다. 이 워크플로우에서는 정상샘플과 암샘플 두가지의 샘플의 데이터를 적용하게끔 되어있으며, 사용자가 확인 할 수 있는 각종 통계량을 제시하며 최종적으로 주석처리된 변이들을 제공한다. 마지막으로, 이 워크프로우는 Dockwer image로 제공되며 java 기반의 cromwell로 작성되어 있어 기존의 shell script 워크플로우보다 세부적인 수정과 변경이 용이하고 분석에 필요한 소프트웨어의 개별설정없이 손쉽게 구동 가능하다.
주요 기능 본 워크플로우는 Docker image로 구축되어, 작업에 필요한 소프트웨어와 파일을 불러와 결과를 기록하는 mnt 디렉토리와 software가 포함된 opt 디렉토리를 갖는다. Mnt 디렉토리는 hAnnotation, hReads, hReference, hResults로 구성되어 있으며, hAnnotation은 주석처리를 위한 데이터베이스의 정보파일, hReads는 변이호출을 수행할 paired-end 파일들, hReference는 변이호출시 사용할 human reference 파일, hResults는 변이호출과정의 각 step에 대한 결과물들과 최종 결과물이 저장된다. Opt 디렉토리는 변히호출과정
사용방법 sudo docker run -v ${PWD}:/mnt -w /mnt centos7-essential-plus-genomics-software-installed-custom-python3:0.5 /usr/bin/java -Dconfig.file=/mnt/application.conf -jar /opt/cromwell-41.jar run /mnt/mutect2Pipeline.wdl -i /mnt/mutect2Pipeline.json
LINUX
JAVA