유전체 정보 연계 시스템 Genome InfraNet

분석 프로그램 검색

Study : 1711074419

연구과제 정보

accession,
2014M3C9A3064552
1711074419
대용량 전장유전체 생명정보 분석 서비스 시스템 구축 및 운용
과학기술정보통신부
한국생명공학연구원
김남신
2018
2018-06-01 ~ 2019-03-31
김남신
deepreds@kribb.re.kr
0428798162

등록 프로그램 / 파이프라인 / 웹 서비스 정보

accession,

1. 분석 파이프라인   2. 전장 유전체 분석

한글명칭 WDL 집단유전체 정보분석 워크플로우 (Docker)
영문명칭
프로그램 WDL 집단유전체 정보분석 워크플로우 (Docker) 프로그램.zip
매뉴얼 WDL 집단유전체 정보분석 워크플로우 (Docker).zip
모식도 프로그램 전체 모식도 없음
웹 서비스 주소
주요 내용 특징 본 워크플로우는 변이호출파일을 기반으로 하며, 각 집단 및 여러 집단에 대한 분석을 수행하고, 분석 결과를 시각화한다. 각 집단에 대해서는 Nucleotide diversity와 LD decay를 계산하고, 두 집단에 대해서는 XP-CLR과 XP-EHH, Fst를 계산하고, 다수의 집단에 대해서는 PCA, Phylogenetic tree, Structure 분석을 수행한다. 각 분석에 이용되는 소프트웨어들은 워크플로우 내부에 포함 및 설치되어 있으며, 한번의 명령어로 각각의 분석들을 한번에 수행할 수 있다. 각 분석들은 위양성 결과를 최소화하기 위해 엄격한 통계적 컷오프가 적용되었으며, 사용자가 확인 할 수 있는 각종 통계량과 함께 분석결과가 제시된다. 이 워크플로우는 java 기반의 cromwell로 작성되었고, Docker Image로 배포되기 때문에, 사용자가 손쉽게 수정 및 변경할 수 있으며, 개별적인 작업환경설정 없이 구동 가능하다.
주요 기능 본 워크플로우는 Docker Image로 구축되어 있으며, 다음과 같은 총 7개의 집단 분석을 수행한다: 1) 두 집단간 Fst 분석, 2) 두 집단간 XP-CLR 분석, 3) 두 집단간 XP-EHH 분석, 4) 각 집단의 Pi 분석, 5) 각 집단의 LD decay 분석, 6) 다수 집단에 대한 PCA와 Phylogenetic tree 분석, 7) 다수 집단에 대한 Structure 분석. 사용자는 위 7가지 분석을 한번에 전부 수행할 수도 있고, 특정 원하는 분석만 수행할 수도 있다.
사용방법 sudo docker run -v ${PWD}:/mnt -w /mnt centos7-essential-plus-genomics-software-installed-custom-python3:0.5 /usr/bin/java -Dconfig.file=/mnt/application.conf -jar /opt/cromwell-41.jar run /mnt/mutect2Pipeline.wdl -i /mnt/mutect2Pipeline.json
LINUX
JAVA