HGMD professional

Next generation sequencing의 발달로 인한 personal genomics가 가능해지면서 더욱 관심을 보이고 있는 데이터베이스가 있다. Biobase HGMD 데 이터베이스가 바로 그것으로 Human의 유전적 돌연변이에 의한 질병정보를 약 100,000만개 정도 담고 있다.

사용자 삽입 이미지

Figure 1. Biobase HGMD. Human의 유전적 변이에 의한 질병 정보 데이터베이스

HGMD는 현재 유전체 서열상의 변이로 인한 질병의 병변 및 유전자의 이름 그리고 유전체상의 위치 정보를 문헌정보에 근거하여 서비스하고 있다. 이러한 정보는 OMIM, Entrez Gene 그리고 Human Gene Nomenclature Committee를 포함한 대표 web-base 데이터들과 링크를 통해 변이에 의한 표현형, 구조적 정보들이 함께 제공되고 있다. 그 자세한 내용은 아래와 같다.


Feature


  • Up-to-date Mutation Data

  • Full Coverage of PubMed journals
  • Gene Centric Search
  • Mutation Centric Search
  • Reference Centric Search
  • Boolean Full Text Searching
  • View Mutation Data by Type
  • View Mutation Data by Disease/Phenotype
  • cDNA Sequences
  • Extended cDNA Sequences
  • Expanded Gene-specific Information
  • Expanded Mutation-specific Information
  • Advanced Search Tools
  • Mutation Viewer/Maps
  • Genomic Coordinates for Missense/Nonsense Mutations
  • Search for Functional Polymorphisms
  • HGVS Nomenclature for Missense/Nonsense Mutations
  • Links to Entrez dbSNP (using rs numbers)
  • Provision of Additional Literature References
  • Search/Display of Gene Ontology Terms
  • Downloadable Version

 HGMD Professional은 위와 같이 변이 정보에 대한 서열 정보, SNP정보, HGVS nomenclature 정보를 링크를 통해 서비스하고 있으며 이들의 조절 메카니즘과 관련된 transcription factor 정보도 함께 지원하고 있다. 더욱이 이러한 모든 정보의 근간이 되는 문헌정보를 함께 제공하고 있어 그 신뢰성이 매우 높다 하겠다.


HGMD tutorial


Expanded Search Engine : 최신의 데이터를 사용자 편의에 의한 주제 중심의 인터페이스로 제공하고 있다. 키워드 방식을 이용한 특정 유전자, 질병의 상태, 변이정보, 문헌정보를 통한 검색이 가능하며 알파벳 인덱싱을 통한 검색도 가능하다.


 

사용자 삽입 이미지

 Figure 2. HGMD advance search. 유전자명, 질병, 변이정보 등을 이용한 keyword 검색이 가능하다. 또한 특정 chromosome내에 존재하는 변이정보를 한 번에 검색 할 수도 있다.


또한 특정 chromosome 내에 존재 하는 모든 변이정보를 한 번에 확인 할 수 도 있으며 이들 정보는 모두 다운 로드 기능을 통해 local PC에 저장이 가능하여 필요할 때 언제든지 활용이 가능 하다(Figure 2).


키워드 검색을 통한 유전자 검색의 경우 Figure 3에서 보여 지는 것과 같이 관련 유전자에서 동반 되는 모든 변이 정보를 확인할 수 있다. Splicing에 의한 변이정보, small deletion, small insertion 그리고 SNP에 의한 정보도 함께 검색 할 수 있다. 또한 transcription factor 정보도 링크되어 다양한 원인에 의해 유발되는 유전적 질환의 생화학적 정보를 통합적으로 확인 할 수 있다.


사용자 삽입 이미지

Figure 3. 유전자 검색. 유전자 검색을 통한 다양한 변이 정보 및 질병의 병변, 유전체상의 위치정보, 유전자 발현 조절 정보를 확인 할 수 있다.


Biochemical information : Human의 변이 정보는 구분된 카테고리 정보에서 keyword로 검색이 가능하며 이들의 정보는 이후 모두 다운로드가 가능하다. 질병의 phenotype을 비롯한 유전체 상의 위치 정보, dbSNP와 같은 기존 참조 데이터베이스의 정보, motif, regulation, 참조 문헌 정보까지 한 번에 확인할 수 있다.


사용자 삽입 이미지

Figure 4. 변이 정보 검색 결과. 유전적 변이에 의한 DNA서열의 변화, 단백질 서열 변이, 참조 데이터베이스, phenotype, gene ontology, 참조 문헌 정보를 모두 다운 받을 수 있다.


Personal genomics 시대에 가장 필수적인 데이터베이스중 하나인 Biobase HGMD는 개인의 잠재적인 유전적 질환의 탐색부터 현재 발병중인 질환에 대한 치료 연구를 위해 많은 기초 데이터를 제공할 것으로 여겨진다. 많은 논문과 데이터베이스를 집대성하여 유전적 질환의 통합적 정보를 제공하고 있는 HGMD는 앞으로 더 많은 연구자들에게 도움이 될 것이다.






Posted by 人Co

2010/05/13 19:17 2010/05/13 19:17

연재 순서

   1. Assembly
   2. Variation study
   3. Expression study
   4. Epigenomics
   5. Genome Annotation
   6. Next Generation Bioinformatics
   7. Data Management for web 2.0 Era
   8. Semantic Network for Integrated Biology Data
   9. Gene Network Discovery by Text-mining
  10. Centralization for High-throughput Data Analysis


이번 연재에서는 Next Generation Sequencing의 첫 번째 Application인 Variation study 중에  다양하게 구축되어 운영되고 있는 SNP 및 variation 데이터베이스에 대해 알아보도록 하겠습니다.


2-1-4. Variation Database


 다양하게 얻어진 각종 variation 데이터들은 기존에 구축되어진 데이터베이스와 비교하거나 이미 알려진 유전자 구조 정보를 활용함으로써 조금 더 유용한 정보를 얻을 수 있다. 따라서 대량의 유전변이형 정보를 체계적으로 수집하고 일반 연구자에게 전달하기 위해서는 다양한 variation 데이터베이스를 구축하여 언제든 활용할 수 있는 시스템으로 서비스 되어져야 한다. 현재 다수의 연구기관 및 연구그룹에서 SNP 및 여러 variation 관련 데이터베이스가 만들어져 운영되고 있다(표 3).

사용자 삽입 이미지
dbSNP는 미국 NCBI에서 관리하는 세계 최대의 SNP 데이터베이스로 rs#를 부여받은 human의 SNP만해도 7,344,853개(build130, 2009년 12월)가 수록되어 있다. 따라서 이렇게 축적된 대량의 SNP 데이터가 연구자들에게 제공됨에 따라 새롭게 특정 후보 유전자의 SNP를 다시 발굴할 필요 없이 대부분의 SNP 정보를 데이터베이스를 통하여 쉽게 이용할 수 있다(그림 6).

사용자 삽입 이미지
또한 좀 더 나아가 HGMD는 문헌에 보고된 모든 생식세포내의 질병을 유발하는 돌연변이들과 질병관련/기능성 다형성들을 기록하고 있다. 사실상 이는 학계에서 이용 가능한 중추적인 질병관련 돌연변이 데이터베이스로써, 암호화 시의 단일 염기쌍 치환(예, 미스센스 돌연변이와 넌센스 돌연변이), 인간 핵 유전자의 조절 및 접합관련 부위, 미세결실과 미세삽입, 결실과 삽입(indels), 반복 확장, 그리고 심한 유전자 손상(결실, 삽입 그리고 복제) 및 복합적 유전자 재배열에 관한 자료들을 제공하고 있다. 학술적으로 또는 비영리적인 목적으로 사용자 등록 후 무료로 이용 가능하다. 단, 이 돌연변이의 정보들은 데이터베이스에 최초로 추가된 후 2년 6개월 후에 공용 웹사이트에서 제공되기 때문에 최신 버전을 이용하려면 BIOBASE GmbH사로부터 인증을 받아 상업적 및 학술적 이용자에게 제공된다. 최신 돌연변이 자료 이외에도, HGMD Professional은 공용 사이트에서 제공하지 않는 첨단 검색 도구와 유전자 및 돌연변이에 대한 특별한 정보를 부가적으로 제공하고 있다(그림 7). HGMD Professional은 3개월 단위로 업데이트된다.

그 외 variation 정보를 위한 데이터베이스는 앞서 소개한 몇몇 큰 데이터베이스와 수백 가지의 유전자 각각에 대한 특화된 데이터베이스로 다원화 하여 존재하고 있다. 이들 정보의 통합 필요성이 인식 되면서 2006년 6월부터 전 인류의 유전자 변이에 대한 정보를 모으고 이를 카달로그화 하여 제공하고자 하는 국제적인 Human Variome Project(HVP, http://www.humanvariomeproject.org)가 출범되었고, 이를 통해 variome 연구는 개인의 유전적 차이 및 질병과의 관련성이 더 정확하게 밝혀져 질병에 대한 개인 간 차이 발생에 대해 더 세밀하고 진보한 해답을 얻을 수 있을 것으로 전망하고 있다.



참고문헌

 1. 이종극 (2006) 질병유전체분석법(Genetic Variation and Diseases)
 2. Eck SH, Benet-Pagès A, Flisikowski K, Meitinger T, Fries R, Strom TM. (2009) Whole genome sequencing of a single Bos taurus animal for single nucleotide polymorphism discovery. Genome Biol. 10(8), R82.
 3. Ganal MW, Altmann T, Röder MS. (2009) SNP identification in crop plants. Curr Opin Plant Biol. 2, 211-217
 4. Xie C, Tammi MT. (2009) CNV-seq, a new method to detect copy number variation using high-throughput sequencing. BMC Bioinformatics. 10, 80
 5. Illumina : SNP Genotyping and CNV Analysis
  (http://www.illumina.com/documents/products/datasheets/datasheet_genomic_sequence.pdf)
 6. Bentley DR. et al. (2008) Accurate whole human genome sequencing using reversible terminator chemistry. Nature. 2008 456, 53-59
 7. Ng SB. et al. (2009) Targeted capture and massively parallel sequencing of 12 human exomes. Nature. 461, 272-276
 8. Koboldt DC, Miller RD, Kwok PY. (2006) Distribution of human SNPs and its effect on high-throughput genotyping. Hum Mutat. 3, 249-254.
 9. 박종화 (2009) 변이체학을 위한 생정보학 분석도구. Medical POSTGRADUATES. 3(37), 131-133
 10. 유향숙, 김선영 (2009) Variome 국제연구동향. Medical POSTGRADUATES. 3(37), 134-137
 11. 임선희, 정연준. (2009) 새로운 유전체 변이의 등장 : 유전자 복제수 변이. Medical POSTGRADUATES. 3(37), 149-153

Posted by 人Co

2010/02/21 19:19 2010/02/21 19:19
, , , , , , , , ,
Response
No Trackback , No Comment
RSS :
https://post-blog.insilicogen.com/blog/rss/response/44