Power with Simplicity

Sequencher는 DNA 서열 데이터를 빠르게 분석하여 결과를 제공하는 소프트웨어입니다. 특히, sanger sequencing 데이터로부터 assembly 후 variation 정보를 찾아주는데 포커싱 되어 있어 특정 영역의 SNP 분석에 굉장히 유용하게 평가되고 있습니다. 최근 5버전대로 업그레이드가 되면서 NGS 데이터까지 분석이 가능하도록 기능이 확장되었고, 커맨드라인으로만 분석 가능했던 퍼블릭 툴들을 초보자들도 사용하기 쉽도록 GUI를 제공하여 편의성을 더해주었습니다.



그럼 NGS 데이터를 이용하여 실제적으로 어떤 분석이 가능한지 살펴볼까요?


Next-Gen Sequencing

[Reference assembly]

Sequencher에서는 NGS 데이터를 이용하여 reference assembly 시 이용하는 3개의 큰 알고리즘(Maq, GSNAP, BWA-MEM)이 있습니다. Maq이나 GSNAP을 통해 assemgbly 분석을 진행하면 SNP 분석도 함께 가능하며, 그 결과 값은 Tablet이나 Maqview를 이용하여 확인할 수 있습니다. 커맨드라인으로 제공하던 BWA-MEM도 GUI를 통해 다양한 옵션값을 손쉽게 설정할 수 있습니다. GSNAP이나 BWA-MEM로부터 얻은 VCF 포맷의 variant 정보는 SAMtools를 이용하여 분석할 수 있습니다.





[De novo assembly]

Reference 정보가 없는 de novo assembly의 경우에는 Velvet 알고리즘을 지원하고 있습니다. Velvet 또한 GUI를 제공함으로써, Tablet으로 결과값을 확인할 수 있고, 다양한 옵션값을 쉽게 설정할 수 있습니다.




[RNA-seq]

최신버전에서는 Differential Gene Expression(차등유전자발현) 연구를 위해 가장 많이 이용되는 RNA-seq 툴 중 하나인 Cufflinks를 플러그인으로 사용할 수 있습니다. Cufflinks 는 SAM 파일로부터 align된 reads를 가지고 GTF annotation 파일을 이용해 다시 align 하며, 다른 isoform과 transcript를 찾아줍니다. 이후 Cuffmerge를 통해 Cufflinks에서 나온 두 개의 transcript 파일을 하나의 transcript consensus 파일로 만들어 줍니다. 이 파일은 차등유전자발현 분석을 하는 Cuffdiff에 사용됩니다. Sequencher는 Cuffdiff에서 나오는 최종파일들(volcano plot, scatter plot, bar chart)을 다루며 발현 레벨에서 차이점을 그래픽으로 보여줍니다.







Connections
[BLAST & primer-BLAST]
Sequencher Connections는 Sequencher의 통합 웹 확장 툴이며, 이를 이용하여 2개 이상의 분석들을 동시에 진행할 수 있습니다. 다중 BLAST를 진행할 수 있어, 각 서열의 분석 결과를 실시간으로 빠르게 얻을 수 있습니다. 같은 서열로 다른 파라미터 조건을 주어 BLAST가 가능하며, 동시에 Local BLAST 까지도 수행할 수 있습니다. 또한 primer design을 위한 primer-BLAST를 할 수 있고, 해당 서열의 특정 영역을 확인 후 Sequencher Project에 예측된 primer를 저장할 수 있습니다. BLAST 검색 결과를 Web view 탭을 통해 뷰어할 수 있고, 이는 36시간 내에 다시 불러올 수 있으며, 그 이후로는 접근이 어렵습니다.



[MUSCLE alignment]
만일 여러 개의 서열로 그룹 분석을 하고 있다면, 다중서열정렬 알고리즘 중 가장 빠른 MUSCLE을 가지고 alignment를 할 수 있습니다. Sequencher Connections에서는 MUSCLE alignment를 다양한 옵션값으로 할 수 있고, alignment 이 후 phylogenetic tree도 생성할 수 있어 서열간의 유연관계도 확인할 수 있습니다.



이렇게 Sequencher에서는 NGS 분석까지 가능하도록 툴들이 확장되고 있습니다. 특히나 커맨드라인의 툴들을 사용하기 어려운 일반 생물학자들도 쉬운 인터페이스를 가진 Sequencher를 이용하여 NGS assembly를 진행할 수 있습니다. 그럼 Sequencher를 통해 NGS의 다양한 분석을 진행해 보세요.


작성자 : Codes실 Consulting팀
송하나 주임 컨설턴트

Posted by 人Co

2016/09/07 13:21 2016/09/07 13:21
Response
No Trackback , No Comment
RSS :
https://post-blog.insilicogen.com/blog/rss/response/220

Inova Genomes : Sequenced Whole Genome Data

최근 QIAGEN Bioinformatics에서는 다양한 인종 및 질병/환자/가계 정보들이 포함된 Whole Genome Database를 런칭하였습니다. 이는 Inova Translational Medicine Institute 라는 의학연구소에서 병원과 함께 환자들의 medical history 및 genome sequence를 수집하였으며 이러한 데이터들이 기존의 질병 유전체 연구 또는 임상연구의 한계를 극복해줄 것이라 생각되어집니다.

Inova Translational Medicine Institute
Inova Translational Medicine Institute(ITMI)는 비영리 연구기관으로 다양한 분야의 연구자들이 유전체와 임상적 데이터를 사용 할 수 있도록 하는 것을 목표로 개인의 유전체와 임상 정보를 이용하여 맞춤의료를 위한 혁신적인 방법 개발에 힘쓰고 있습니다. ITMI는 2011년 2월 1일에 설립되어 clinical, bioinformatics, laboratory 세 분야로 나누어 100명의 과학자와 임상의사, 간호사, 유전자 카운슬러, 실험실 기술자들이 배치되어 있습니다.

Inova Genomes
ITMI에서 선보인 Inova Genomes는 다양한 인종 및 다양성을 가지는 human whole genome 시퀀싱 결과와 개개인의 진료 기록 정보(진료기록 정보 외에는 모두 기밀)가 함께 수집된 데이터베이스이며 약 2,100건의 가계 정보 및 약 7,000명의 whole genome sequence를 가지고 있으며 매 년 2,500명 정도의 데이터들이 추가되고 있습니다. 환자의 식별은 불가능하지만 각 정보가 Electronic Health Record와 연결이 되어있으며 증상에 대한 문진데이터, demographics, 처방이나 가계에 대한 정보들도 포함되어 있습니다. 또한 환자와 환자 가족들의 동의하에 등록이 되어 있고 시간이 지남에 따라 동일 환자의 데이터 업데이트가 가능합니다. 또한 100개 이상의 국가에서 다양한 가족의 정보 및 모든 주요 기관계의 다양한 phenotype 데이터를 보유하고 있습니다. 뿐만 아니라 RNA-seq, miRNA이나 methylation 데이터 같은 실험데이터들도 포함하여 유전체 레벨 외의 분석을 위한 데이터셋으로도 활용이 가능하며, 양질의 pre-annotated, pre-computed 실험적 데이터를 제공합니다.


표 1. Study별 Inova Genomes 데이터 통계(2015년 7월 30일 기준)



표 2. 질병/나라별 Inova Genomes 데이터 통계


Data-set

전체 데이터의 30%는 Complete Genomics 데이터 셋(coverage=60X)이며, 나머지 70% 데이터는 Illumina 데이터 셋(coverage=40X)으로 구성되어 있습니다. 그 중 Trio 데이터셋 62개, quartet 데이터 2개는 Complete Genomics나 Illumina 두 개의 플랫폼에서 모두 진행하였습니다. 아래 그림1 에서 보시면 320만개의 SNP가 공통적으로 발견이 되어 데이터의 높은 신뢰성을 보여줍니다.



그림 1. Inova Genomes SNP 데이터 퀄리티


Data-field
해당 데이터베이스 내에는 생 후 1000일 간의 종적연구를 위해 아래와 같은 다양한 데이터필드도 존재합니다.

- Demographics : age, gender, ethnic background
- Personal & family health history : family history cancer/diabetes/cardiac types
- Treatment/pharmaceutical records : drug name, dose, frequency
- Laboratory & diagnostic test results : glucose level, CBCs
- Clinical data : BMI, height
- Clinical encounter : Admission to NICU
- Etc.

지금까지 Inova Genomes의 특징에 대해서 알아보았습니다. Inova Genomes과 다른 데이터베이스를 비교해보면 먼저, Personal Genomes Project는 300명 미만의 genome 정보를 가지고 있지만 Inova Genomes는 약 7,000명의 genome 정보를 가지고 있어 human의 genome 정보를 수집하는데 필요한 시간과 비용을 상당히 줄일 수 있습니다. 그리고 1000 Genome Project의 경우 7X coverage를 가지고 있어 정확도가 낮지만 Inova Genomes의 경우에는 최소 40X의 coverage로 높은 정확도를 가지고 있습니다. Kaviar나 EVS는 유럽인들에 대해 집중이 되어 있는 반면, Inova Genomes는 다양한 인종들에 대한 정보를 다수 포함하고 있습니다. 그 밖에도, 데이터의 수집에 대한 환자의 동의가 있어 지속적으로 follow up이 가능하여 분석 결과의 지속적인 업데이트가 가능하고, 2,100건 이상의 혈연 정보가 등록이 되어있어 trio 분석이 가능하여 가계도 내 유전적 질병을 파악하거나 분석하는데 용이하다는 뛰어난 장점을 가지고 있으며, Inova Genomes 에 있는 데이터를 이용하여 cohort를 마음껏 구성하여 비교분석도 가능합니다.
점점 더 저렴해지고 있는 시퀀싱 비용으로 규칙 없이 시퀀싱 데이터만 빠르게 생산되는 현재 시대에 공개되어 있는 데이터는 많은데 비해 자세한 정보가 없어 활용하기 힘든 의미 없는 데이터들뿐인 요즘. 특히나 다양한 케이스의 trio 데이터를 찾기는 더더욱 힘드셨을 거라고 생각됩니다. Inova Genomes에서는 지금 우리가 겪고 있는 고민들을 해결해 줄 수 있도록 데이터 정보에 대한 체계화 및 데이터의 계속적인 업데이트, 다양한 trio 데이터셋의 제공으로 human 분야의 유전체 연구에 날개를 달아드릴 것입니다.


작성자 : Codes실 Consulting팀
서지혜 컨설턴트

Posted by 人Co

2016/09/07 10:42 2016/09/07 10:42
Response
No Trackback , No Comment
RSS :
https://post-blog.insilicogen.com/blog/rss/response/219

개요
생물정보 전문기업인 ㈜인실리코젠에서는 미래창조과학부의 지원을 받아 국가생명연구자원정보센터(KOBIC)의 위탁과제로 “대용량 바이오데이터분석 전문 인력 양성을 위한 교육 프로그램 개발”을 2014년 6월부터 2016년 5월까지 진행하였습니다. 저희 회사가 생물정보 전문인력 역량 강화에 관심을 가지고 자체적으로 사업을 운영한 것은 2012년부터였습니다. 人CoEDUCATION라는 명칭 아래 다년간의 사업 경험을 바탕으로 KOBIC의 차세대 생명정보학 인력 양성 사업도 효율적으로 운영할 수 있었습니다. 지난 2년간 수행했던 교육사업 내용에 대해 소개하고자 합니다.

차세대 생명정보학 교육의 필요성
NGS 시대의 인간 유전체를 포함한 다양한 유전체 연구가 급진적으로 발전하고 있으며, 이에 따른 차세대 유전체 정보 분석 전문가의 양성이 요구되고 있습니다. 따라서 KOBIC과 공동으로 유전체 연구 관련 생명정보학 지식과 프로그램을 개발하며 정기적인 워크샵을 통해 대학, 국가 연구기관 및 기업체에 유용한 유전체 정보 분석 전문가를 양성하고자 교육 프로그램을 진행하게 되었습니다.

차세대 생명정보학 교육 내용
1차년도 커리큘럼은 리눅스와 파이썬 등 최신 생물정보 분석을 수행하기 위한 기초 분석 교육에서 점진적 향상된 교육 진행을 목표로 하였습니다. 따라서 일반적인 NGS 분석과 동/식물 기반의 종 특이적 NGS 분석에 대한 교육 내용에 포커싱하여 커리큘럼을 설계하였습니다.
  • 제22회 : 리눅스 및 파이썬을 이용한 생물정보 이해 (2014년 10월 6일~8일)
    - Linux와 Python의 기본 이론을 확립하고 실습을 통한
      생물정보 기초 분석 능력을 습득
  • 제23회 : NGS 개요 및 RNA-Seq 분석 (2014년 11월 26일~28일)
    - NGS의 기본 개념을 이해하고 실습을 통하여 NGS 데이터 분석 및
      RNA-seq 분석에 대한 기초 분석 능력 습득
  • 제24회 : Public 온라인 툴을 이용한 NGS 분석 및 네트워크 분석 (2015년 2월 25일~27일)
    - Public 온라인 툴을 사용하여 NGS 데이터를 가지고 variant 분석,
      RNA-seq, 네트워크 분석을 이론과 실습을 통하여 익힐 수 있도록 함
  • 제25회 : R을 활용한 공개 및 NGS 기반 유전체 자료 분석 실습 (2015년 4월 1일~3일)
    - R을 활용하여 실제 유전체 자료 분석을 수행할 수 있도록 함
  • 제26회 : Transcriptome assembly 분석 (2015년 5월 6일~8일)
    - NGS 데이터를 이용한 전사체 풀 구성과 유전자 기능 분석 방법을 습득

2차년도 커리큘럼은 미생물, 식물, 동물 및 인간을 대상으로 하는 연구에 직접적인 활용이 가능하도록 테마별 교육 진행을 목표로 하여 각 연구대상별 생물정보 이슈사항을 반영하여 커리큘럼을 설계하였습니다.

  • 제27회 : Linux 및 Python을 이용한 생물정보 이해 (2015년 8월 17일~20일)
    - Linux와 Python의 기본 이론을 확립하고 실습을 통한
      생물정보 기초 분석 능력을 습득
  • 제28회 : 미생물 유전체 및 대사회로 분석 (2015년 10월 12일~14일)
    - 미생물 유전체 분석에 대한 전반적인 이해 및
      분석 전략 습득과 실습 (중/고급과정)
  • 제29회 : 식물 유전체 데이터 분석 및 활용 (2015년 12월 14일~16일)
    - 식물 유전체 분석에 대한 전반적인 이해와 분석 전략 및 실습
  • 제30회 : 미생물 유전체 및 대사회로 분석 (2016년 2월 22일~24일)
    - 미생물 유전체 분석에 대한 전반적인 이해 및
      분석 전략 습득과 실습 (초급과정)
  • 제31회 : 유전체 데이터 분석과 질병 연구 (2016년 4월 20일~22일)
    - 인간 유전체 데이터 분석과 질병 연구에 대한 전반적인 이론과
      실습을 통해 분석 능력 습득





차세대 생명정보학 교육 홈페이지

연구과제를 수행하면서 생물정보 교육을 위한 별도의 홈페이지 구축(KOBIC 차세대 생명정보학 교육 홈페이지 운영, http://kobicedu.labkm.net/labkm/)을 통하여 효과적인 교육 일정의 관리와 수강신청의 편의성, 교육 자료의 공유 및 수강생과의 커뮤니케이션이 가능하도록 하였습니다.




차세대 생명정보학 교육 만족도

총 10회의 교육 설문을 분석한 결과 교육의 이해정도 및 만족도, 교육생의 실력향상, 기대한 목표치의 부합성이 모두 70~80% 이상으로 높게 나타났으며 강사진의 능력, 수업분위기, 설명, 교육 자료 등도 높은 평가 결과를 보였습니다.

교육만족도


강사만족도

교육진행 만족도


기대효과
생물정보전문 인력양성 사업에 지속적으로 참여하면서 느낀 점은 사업의 질적 고도화가 필요하다는 것입니다. 실무능력 향상을 위한 교육기간 연장, 등급 체계의 교육, 실습시간 강화, 산학협력 프로젝트 수행 등이 병행되어야 하고, 배출된 인력이 어떠한 활동을 하고 있는지 학계 및 산업계의 기여도와 추적 조사도 병행되어야 할 것 입니다. 또한 맞춤형 인력 양성 체계를 구축하여 수요자의 요구에 부응하는 인력이 양성되어야 할 것으로 판단됩니다.

또한 이러한 교육 과정들을 통하여 국내 생물정보학을 위한 표준 교육과정 개발의 기초자료를 제공하여 국내 유전체 연구의 성장을 촉진하고, 생물정보 분석 인력 확보를 통한 국내 유전체 연구 효율성과 경쟁력을 향상시키는데 도움이 되었으면 합니다.

이번 연구과제는 완료되었지만 정기적인 생물정보 교육은 계속 이어서 진행될 예정입니다. 앞으로도 많은 관심과 참여 부탁드리겠습니다.



<주관부처>                            <주관기관>
   


Posted by 人Co

2016/09/06 17:52 2016/09/06 17:52
Response
No Trackback , No Comment
RSS :
https://post-blog.insilicogen.com/blog/rss/response/218

제4회 人Co PLAY 후기



여름의 시작! 6월의 첫 번째 금요일.
선선한 아침공기를 맞으며 人Co PLAY의 막이 올랐습니다. 모두가 즐거운 행사로 만들기 위해 일찍부터 모인 준비위원들, 새벽같이 출발하여 오신 대전지사분들, 그리고 늦지 않게 집결해주신 본사분들까지 人Co인의 단결이 있어 기분 좋게 시작할 수 있었습니다. 장소는 회사 앞 영덕레스피아 풋살경기장! 무려 48명의 人Co인이 한자리에 집결했습니다.

첫 순서인 사장님의 개회사와 추억의 국민체조로 몸과 마음 가짐을 다 잡았습니다. 단합대회 행사는 대중을 압도하는 이상민 주임님께서 맡아 주셨습니다.

두 번째 순서로 백만년 만에 다시 해보는 2인 3각!! 박빙의 랠리 속에서 요놈의 콩은 왜 이리도 미끄러운지... 그릇을 기울여도 보고... 결과는 C팀의 승리~!!

다음 게임인 짝 피구에 앞서 휴식 시간~ 휴식 시간인데... 분명히 휴식 시간인데~!! 경기시간 10분, 거친 남자들, 그들만의 리그가 시작되었습니다!

세 번째 게임, 짝 피구시간! 농구장으로 이동하였습니다. 남자는 공격 No~!! 여자를 보호해야 한다는 사명을 띠고 경기가 진행되었습니다. 관중들의 시선까지 집중시키는 피구왕...이 아닌 피구여왕들의 불꽃 슛~!! 첫 경기는 C, D팀이 공동 1위, A, B팀이 공동 2위로 끝났습니다. 순위를 가르기 위한 人Co 남직원들의 추가 경기가 진행되었습니다. 피구왕들의 치열한 경기 끝에 1, 2위전에서 C팀의 승리~! 3, 4위전은 B팀의 승리로 끝났습니다.

마지막 순서는 기다리고 기다리던 보물찾기 시간~! 人Co인 초유의 탐색전이 시작 되었습니다. 곳곳에서 찾은 이의 만족과 못찾은 이의 시무룩함이 관찰 되었습니다.

마지막은 人Co 가족 모두가 한대 모여 단체사진을 찍음으로써 단합대회 대단원의 막을 내렸습니다~

업무가 있으신 분들을 제외하고 삼삼오오 모여 제 각기 좋아하는 활동을 하였습니다~~ 평소 자리가 떨어져 있어 같이 하지 못했던 사원분들과 시간을 보낼 수 있어 의미있었습니다.



각자의 친목 활동을 즐겁게 마치고 人Co PLAY의 마지막을 장식할 하이라이트인 저녁 회식! 人Co 가족 모두가 함께 하였습니다. 특히 파견 업무 때문에 단합대회를 함께하지 못했던 분들도 함께 할 수 있어서 더욱 즐거웠습니다. 먼저 신입인턴들의 축하 메시지와 사장님의 거국적인 건배 제의를 통해 기분 좋게 회식이 시작되었습니다.


人Co PLAY를 마치며...

경동수
人Co PLAY의 기획, 준비, 그리고 진행까지, 전 과정에 참여할 수 있었던 점이 가장 좋았습니다. 또 브랜드위원회, 박우진, 서정한 선배님, 그리고 인턴동기들, 다수의 생각이 모여 실제가 되어지는 과정을 몸소 느낄 수 있는 좋은 기회 였습니다.

박선영
사무실을 벗어나 활동적인 게임들을 하고 다른 팀원분들과도 함께 하며 일상의 리프레쉬[!]가 되었습니다. 처음으로 회사 행사를 준비하며 설렘도 있었고 어려움도 있었는데, 동기들, 박우진 선배님, 서정한 선배님 그리고 많은 지도를 해주신 브랜드위원회 분들, 사장님의 도움으로 무사히 그리고 즐겁게 잘 마칠 수 있었습니다. 함께 고생한 동기들과 열심히 참여해주신 모든 人Co인 분들- 모두 감사합니다.!

박원
人Co PLAY를 준비하면서 회사의 행사 기획을 함에 있어 많은 분들의 협업을 통해 하나하나 일이 이루어져 감을 알게 되었고, 그 과정이 많은 분들의 고민과 의견 공유를 통해 이루어져 간다는 것을 깨달았습니다. 일을 진행하면서 그 가운데 어려움도 있었고 모르는 부분도 많았지만 브랜드위원회 분들의 많은 도움과 동기인턴들과 함께여서 극복할 수 있었습니다. 또한 人Co PLAY 당일에 많은 분들의 적극적인 참여를 통해서 준비했던 것보다 훨씬 더 즐거운 분위기에서 무사히 모든 일정을 마칠 수 있게 되어 감사드립니다.

백영민
지난 일주일 동안 기획, 준비 그리고 진행을 하면서 사내 행사 하나를 추진하는것이 얼마나 쉽지 않은 일인지 깨닫게 되었던 시간이었습니다. 동기들 뿐만 아니라 브랜드위원회, 박우진, 서정한 선배님의 의견을 조율하고 선배님들의 조언을 실행으로 만들어가는 과정이 정말 값진 경험이었습니다. 또한 더운 날씨속에서도 최선으로 참여해 주신 인코분들이 있었기에 人Co PLAY 행사를 무사히 그리고 뜻깊게 보낼 수 있지 않았나 생각합니다.

이승주
人Co PLAY를 준비하면서 동기들과 이야기 할 수 있는 시간을 가질 수 있어 좋았습니다. 개인업무와 함께 人Co PLAY 준비도 꼼꼼하게 수행했던 동기들! 처음 행사를 기획하고 준비하는 데 있어 항상 옆에서 조언해주신 브랜드위원회, 우진선배, 정한선배! 마지막으로 쨍쨍한 햇볕아래에서 人Co PLAY에 즐겁게 참여해주신 사장님, 人Co인 분들에게 다시 한번 감사인사 드리고 싶습니다.

Posted by 人Co

2016/09/06 17:08 2016/09/06 17:08
, ,
Response
No Trackback , No Comment
RSS :
https://post-blog.insilicogen.com/blog/rss/response/217

A Superior Solution for Microbial Genomics - 5



일반 미생물에서부터 난배양성 미생물들까지 모두 확인할 수 있는 방법으로 샘플을 자연상태에서 직접 채취하여 시퀀싱 하는 방법을 metagenome이라고 합니다. NGS가 발전하면서 간단하게 샘플의 16s rRNA를 추출 후 시퀀싱을 하여 해당 샘플내에 존재하는 미생물의 종류와 존재 비율을 알 수 있습니다.
CLC Microbial Genomics Module은 16s rRNA 데이터베이스를 다운로드 하는 것부터 OTU clustering, alpha/beta diversity, PERMANOVA 분석까지 가능하게 해주며 미리 구성되어져 있는 워크플로우를 이용해 시퀀싱 raw data를 넣어주는 것만으로 분석이 완료가 됩니다.

지금부터 보여드릴 데이터는 용의자의 신발 두 켤레에서 나온 흙과 범행현장이라고 예측되는 곳의 토양 샘플의 16s rRNA를 시퀀싱하여 metagenome 분석을 응용한 것입니다. 시퀀싱 데이터를 모듈에 내장되어 있는 'Data QC and OTU Clustering'이라는 워크플로우에 넣어주면 trimming부터 OTU clustering까지 자동으로 진행되게 됩니다.



OTU clustering을 위한 워크플로우



이 워크플로우의 분석 결과로 data trimming report와 OTU clustering 결과를 볼 수 있는데 이 결과는 sunburst chart나 bar chart로 제공됩니다. 각 샘플별 clustering 결과에 metadata를 추가하여 특정 그룹으로 묶어 그룹간의 비교가 가능합니다.




그룹간의 OTU clustering bar chart

이후 OTU clustering 결과를 가지고 데이터의 taxonomy가 충분히 맵핑 되었는지 확인하기 위해 alpha diversity 분석을 수행하고, 샘플간 혹은 그룹간의 유사도를 보기 위해 beta diversity를 수행하게 됩니다. 그리고 MUSCLE 알고리즘을 이용한 alignment를 진행하고 phylogeny tree를 그려서 각 시퀀스간의 연관성을 확인합니다.



 

Diversity 확인 및 phylogeny tree 분석을 위한 워크플로우



두번째 워크플로우 분석 결과중 하나인 beta diversity의 결과를 함께 봅시다. Metadata를 이용하여 그룹을 지어주면 같은 그룹끼리 같은 색상으로 바뀌게 되며 그룹간 샘플간의 비교분석이 가능합니다. 아래의 그림에서 파란색 동그라미와 노란색 동그라미는 각각 다른 그룹을 의미하지만 유사도의 거리를 따졌을 경우 비슷한 것을 확인 할 수 있습니다 (일치라도 해도 될 정도로 유사함). 따라서 파란색과 노란색은 같은 토양 샘플이라고 잠재적 결정을 내릴 수 있으며, 용의자는 A 부츠를 신고 1번 site에 간 적이 있었다고 결론을 지을 수가 있겠습니다.




Beta diversity 분석 결과



1
6s rRNA를 이용한 metagenome 분석은 이러한 범인을 찾는데에 응용하는 것 외에도 특정 질병이 잘 걸리는 장내 환경을 조사해볼 수도 있고, 특정 작물이 잘 자라거나 특별히 잘 자라지 않는 토양에서의 미생물 분포를 알아볼 때도 사용할 수 있습니다.

CLC Microbial Genomics Module을 이용하여 우리눈에 보이지 않는 미생물들의 구성과 그 microbial community의 역할 및 특징들을 알아보고 싶으시면 지금 바로 trial 해보세요!


 <  이전화 보기  >

(문의) Consulting팀 (대표전화 : 031-278-0061, 이메일 : consulting@insilicogen.com)

Posted by 人Co

2016/08/30 09:55 2016/08/30 09:55
Response
No Trackback , No Comment
RSS :
https://post-blog.insilicogen.com/blog/rss/response/215



« Previous : 1 : ... 30 : 31 : 32 : 33 : 34 : 35 : 36 : 37 : 38 : ... 75 : Next »