« Previous : 1 : 2 : 3 : 4 : 5 : 6 : 7 : 8 : 9 : ... 10 : Next »

ISMB 2014 참석 후기

어느덧 22번째 ISMB2014



하버드와 MIT로 유명한 미국의 대표적인 교육 도시, 랍스터의 천국, 미국 보스턴에서 생물정보학자들의 큰 축제, ISMB(International Conference on Intelligent Systems for Molecular Biology)가 진행되었습니다. 이번 ISMB2014는 어느덧 22번째를 맞이했습니다. (세계에서 가장 큰 생물정보학/전산생물학 관련 학회)



ISMB는 Intelligent Systems for Molecular Biology 라는 주제로 매년 개최되고 있습니다. 2014년 7월 11일 부터 15일까지 4박 5일 동안 열린 이번 ISMB2014는 미국 보스턴의 John B. Hynes Memorial Convention Center 에서 진행되었습니다. ISMB는 ISCB (International Society for Computational Biology)에서 주최하는데, 70개의 나라에서 모인 3,000 명 이상의 멤버들이 꾸려나가는 모임으로 바이오인포메틱스(Bioinformatics) 저널과 PLoS(Public Library of Science) 라는 오픈 엑세스 저널을 통해 편찬 작업을 진행하고 각종 미팅과 컨퍼런스 교육 등 다양한 활동을 합니다.



총 5일 동안 진행된 이번 학회는 11~12일 이틀 동안은 교육자, 학생을 위한 프리-컨퍼런스, 13~15일까지는 메인 컨퍼런스로 구성되었습니다. 메인 컨퍼런스는 총 8개의 프리젠테이션 타입이 있고, 키노트를 제외한 나머지 7개 타입이 동시다발적으로 진행되었습니다. 키노트는 ISCB 멤버중 당해 년도에 가장 업적이 좋은 6분이 나와서 발표를 하였고, 페이퍼 프리젠테이션은 ISCB를 통해 발표된 논문 중 선별된 내용이었습니다. 이번 학회의 주요 주제는 다음의 내용과 같습니다.

  • Sequence analysis
  • Comparative genomics
  • Gene regulation and transcriptomics
  • Systems biology
  • Databases and data integration
  • Text mining and information extraction
  • Human health


"생명은 유전자가 아니라 정보의 흐름으로 이해해야 한다"

먼저, 컨퍼런스의 시작을 알리는 키노트의 주제는 Good things come in small packages – replicators and innovators 입니다. 연사는 이스라엘 예루살람에 있는 히브루대학에 생화학 전공으로 재직 중인 Michal Linial 박사입니다. NGS 분야 논문을 자주 접하시는 분들은 아시겠지만, 문두에 항상 나오는 "오늘날 NGS의 발달로 많은 데이터가 쏟아진다"라는 어쩌면 이젠 굳은 살처럼 박혀버린 멘트로 발표가 시작됐습니다. 이 멘트로 인해 식상한듯 했지만 이내 지속된 스토리는 굉장히 도전적인 내용이었습니다. Michal Linial 박사의 연구 특성상 UniProt Database를 주로 이용하는데 시간이 지남에 따라 데이터베이스는 점차 거대해지고 데이터 핸들링이 어려워졌다고 합니다. 거대화의 주된 요인 중 데이터의 중복이 가장 큰 문제였는데, 동일한 정보에 비슷한 서열을 가진 데이터가 굉장히 많았습니다. 실제로 짧은 길이의 서열 조각을 공통으로 가진 단백질들 묶음을 발견할 수 있었습니다. 처음엔 이러한 데이터의 중복을 제거하기 위해 Protein classification algorithm 제작을 팀에서 함께 시작했지만, 이것이 다른 방향으로 확장되어 ProtoNet 이라는 툴을 만들게 됩니다. 처음 의도와 다르게 발전한 ProtoNet은 결국 하나의 맵을 만들고 연관된 단백질을 묶어 네비게이터를 만들어 단백질 레벨에서의 계층구조와 진화구조를 연구하는 툴이 됐습니다. 실제로 자신의 단백질 서열을 집어넣으면 트리를 그려주는 것을 확인할 수 있었습니다.

두번째로는, 이쪽 생물정보 분야의 연예인인 Eugene Myers 입니다. 서열을 다루는 생물학자라면 누구나 한번은 사용해봤을 법한 NCBI의 BLAST가 이분을 통해서 만들어졌습니다. 그것만으로도 대단한데 Human Genome Project 당시 셀레라 지노믹스의 샷건 시퀀싱 기술을 Eugene Myers 가 만들었다고 합니다. 물론 다국적팀이 3일 먼저 완료했다는 보고 덕에 과학계에서는 큰 의미없는 아쉬운 2등을 했지만, 굉장히 짧은 시간에 지놈을 완성할 수 있는 알고리즘을 개발했다는 측면에서 다국적팀의 Jim Kent 보다 더 유명해지지 않았나 싶습니다. DNA assembly 라는 주제로 긴 시간동안 많은 고견을 들을 수 있었습니다. 앞으로는 low fold 의 시퀀싱을 가지고 어셈블리를 할 것이고, PacBio 같은 long read 를 가지고 퀄리티가 좋은 어셈블리를 하는 시대를 예견했습니다. Long reads 를 준비하는 이유는 먼 훗날 언젠간 어셈블리가 필요 없어질 것이라는 이야기도 했는데 PacBio에서 이번에 새로 출시되는 시퀀서에서는 한방에 complete transcripts가 시퀀싱 된다고 합니다. 현재의 난제인 지놈도 언젠간 가능하지 않을까라는 생각을 해봅니다.

더불어 생물정보학의 중요성을 다시 한 번 깨닫게 해 주었던 키노트 중 하나는 스탠포드 대학교의 Russ Altman 박사가 발표한 " Informatics for understanding drug response at all scales " 입니다. 그는 분자, 집단, 종 등 다양한 drug response 에 대해서 발표했습니다. 약에 대한 연구에서 가장 중요한 것 중 한 가지는 다양한 레벨에서의 반응을 이해해야 한다는 것입니다. 한두 가지 특정 상황이 아니라 성질, 반응, 상호 작용, 구조, 유전자와의 상호 반응, 3차 구조 등 모든 다양한 분야에서의 정보 융합이 필요하다고 제창하였습니다. 즉, 가용할 수 있는 모든 정보가 개인 맞춤의학에 대해서 도움을 줄 수 있으며, 이제 "생명은 유전자가 아니라 정보의 흐름으로 이해해야 한다" 라는 큰 틀을 이야기했습니다.



  1. Good things come in Small Packages – Replicators and Innovators – Michal Linial
  2. DNA Assembly : Past, Present, and Future – Eugene(Gene) Myers
  3. Biomedical Quants of the world Unite! We only have our disease burden to lose – Isaac(Zak) Kohane
  4. Biomaterials and biotechnolgy: From the discovery of the first angiogenesis inhibitors to the development of controlled drug delivery systems and the foundation of tissue engineering – Rober Langer
  5. Informatics for understanding drug response at all scales – Russ Altman
  6. Multidimensional single cell approach to understand cellular behavior – Dana Pe’er

생물학자들을 위한 생물정보 어플리케이션

또한, 기술적인 부분에서는 생물학을 연구하는 다양한 학자들을 위하여 많은 어플리케이션이 소개되었습니다. 일본의 리켄에서 제공하는 가루다 시스템과 NGS 분석에서 한 번쯤은 사용해 본 적이 있는 Bioconductor 패키지에 대한 자세한 설명과 사용법에 대해서도 소개하는 세션이 있었습니다. BioConductor에서는 800여개가 넘는 다양한 분석 모듈을 제공함으로써 손쉽게 생물데이터를 다룰 수 있도록 했고 교육, 메뉴얼, 동영상 등 초보자도 쉽게 따라서 할 수 있도록 많은 정보를 제공하고 있다는 것을 소개해주었습니다. 그리고 웹에서 NGS 데이터를 분석할 수 있는 환경을 만들어 주는 Galaxy에서는 기본 설치에서부터 사용법, API 등의 사용법 다양한 정보를 제공해주었습니다. 특히 그들 그룹에서는 현재 제공되는 Galaxy 뿐 만 아니라 다양한 주요 분석 패키지를 취합해 하나의 어플리케이션으로 제공할 계획을 세우고 있다고 합니다. 그런 부분에서 그들의 도전 정신을 깊이 배울 수 있는 계기가 되었습니다.



메인컨퍼런스의 한 꼭지인 포스터 발표장입니다.


Human & Disease & Bioinformatics

이번 학회의 포스터장에서는 총 515개의 포스터가 등록됐습니다. 역시나 학회장의 전체적인 분위기를 대변해 주듯 Bioinformatics of disease and treatment 분야의 포스터가 가장 많은 14%를 차지하고 있습니다. 그 뒤로는 Systems biology and networks, Protein structure and function prediction and analysis 가 각각 14%, 12%로 많은 비중을 보였습니다.

각 분야에서도 특히 human 쪽의 연구가 많이 진행되고 있는 것을 확인할 수 있었습니다. 이에 발맞춰 human에 특화된 RNA-seq normalization 방법을 소개한 포스터도 있었습니다. 펜실베니아 대학의 한 연구팀은 서로 다른 샘플간 같은 feature에 대한 비교에 사용된 기존의 normalization 방법의 8가지 문제점을 나열하고 이를 반영한 새로운 normalization 방법을 고안했습니다. 대부분의 문제점은 분석 목적에 맞는 RNA-seq normalization 방법에 분명 필요한 것들이고, 당사의 RNA-seq normalization 방법에도 반영되고 있는 부분이었습니다. 하지만 한가지 눈길을 끄는 새로운 방법이 눈에 띄었습니다. 앞서 말씀드린 대로 다른 샘플간의 같은 feature를 보고자 한다면 그 비교의 범위를 좀 더 명확하게 볼 필요가 있습니다. 이를 위해서 dominant gene 을 제거합니다. 이러한 gene들은 house keeping gene 이나 special case gene 을 말하는데 이와 같은 very high expressed gene 을 제거함으로써 보고자 하는 대상을 좀 더 세밀하게 관찰할 수 있도록 합니다. 또한, transcript 단위가 아닌 exon 단위별 mapped reads 개수를 categorization 하여 RPKM 편차를 줄이는 방법을 사용하는데 이를 통해 좀 더 유의한 비교가 가능하다고 설명합니다. 이런 방법들은 연구의 목적에 따라 개연성에 맞게 적용되어야 하는 부분이지만 새로운 normalization 기법을 생각해 볼 수 있었습니다.



미국에서 개최된 학회라서 그런지 많은 연구자의 소속이 미국소재지였습니다. 물론, 다양한 국가출신의 연구자들이 함께한 학회였지만, 그들이 자리한 자유와 기회의 땅으로 불리는 미국의 기운을 받아 자유로운 생각과 창의적인 아이디어로 연구를 진행하고 리드한다는 느낌을 받았습니다. 미국문화의 내면과 외면에는 많은 차이가 있겠지만, 이런 공부와 연구에 대한 환경을 제공하는 시스템은 우리가 본받을 점이라고 생각합니다.

이번 ISMB에서는 학회 주제에 맞는 다양한 주제들을 접할 수 있었습니다. 특히 휴먼에 대한 질병과 치료연구들이 많이 진행되고 있었고 BIOBASE와 EMBL 쪽에서도 cancer 연구에 특화된 데이터베이스를 준비하고 있었습니다. 한편 제 2의 genome이라 불리는 microbiome 연구 또한 탄탄한 펀드를 기반으로 활발히 연구되고 있습니다. NIH에서 2007년부터 시작된 HMP (Human Microbiome Project)뿐만이 아니라 유럽에서는 개개인의 microbiome 을 이용한 치료를 목적으로 5,000명의 데이터베이스를 준비하고 있다고 합니다. Microbiome 연구는 앞으로 전 세계적으로 확장될 분야라는 확신을 얻었고 앞으로 국내에도 많은 연구결과 소식을 접할 수 있기를 기대합니다.

작성자 : Codes 사업본부 Development팀 이규열 팀장,
           Research실 유승일 컨설턴트


Posted by 人Co

2014/09/03 17:54 2014/09/03 17:54
Response
No Trackback , No Comment
RSS :
https://post-blog.insilicogen.com/blog/rss/response/160


[모집분야]
1. 생물정보 분석
컨설팅(신입 또는 경력 0명)
2. 생물정보 모듈 개발(신입 또는 경력 0명)

[업무내용]
1. 생물정보 분석 컨설팅
   1) NGS 데이터 분석 및 컨설팅
   2) 생물정보 분석 컨설팅 및 제반업무

2. 생물정보 모듈 개발
   1) 생물정보 웹 프로젝트 지원
   2) 생물정보 업무 분석/설계 및 데이터 처리 지원

[자격 및 우대조건]
1.
생물정보 분석컨설팅
   ① 석사 이상의 생물정보학 및 생물학 관련 전공자
   ② Python 혹은 Perl 등 스크립트 언어 경험자 우대
   ③ 리눅스 경험자 우대
   ④ Genomics(NGS) 데이터 분석 경험자 우대
   ⑤ 경력 : 해당업무 경력 5년 이상
   ⑥ 프레젠테이션(발표) 능통자
   ⑦ 영어회화 및 작문/독해 가능자


2. 생물정보 모듈 개발
   ① 석사 이상의 생물정보학 및 생물학 관련 전공자 우대
   ② Python 혹은 Perl 등 스크립트 언어 경험자 우대
   ③ 경력 : 해당업무 경력 2년 이상
   ④ 리눅스 경험자 우대
   ⑤ 졸업예정자 입사 후 병역특례 전환가능
(신입)

[채용형태]
1. 정규직(신입 또는 경력) 각 0명
   1) 신입 : 인턴 계약 6개월 후 정규직 전환(인턴 평가 진행)
   2) 경력 : 정규직(계약직 3개월 포함)


[채용일정]

1. 서류전형 : 2014.07.21.(월) ~ 2014.07.31.(목)
2. 면접전형 : 2014.08.04.(월) ~ 2014.08.07.(목)- 서류전형 합격자에 한하여 개별 통지
3. 최종 합격자 발표 : 2014.08.11.(월)
4. 입사예정일 : 2014.09.01.(월)  면접 시 자기소개
(경력위주 5분 분량 PT준비) 발표 포함

[전형방법]

1차 서류전형 : 당사 입사지원서를 기한내 recruit@insilicogen.com로 제출
2차 면접전형(서류전형 합격자에 한하여 개별통보)
    - 면접 시 자기소개(경력위주 5분 분량 PT준비) 발표 포함

[제출서류]
- 입사지원서 및 자기소개서 : 당사 양식(파일명 : ‘입사지원서_성명.docx’으로 저장)
- 서류전형 합격자는 PPT(경력위주, 자기소개, 5분분량)




[근무환경 및 복지
]
- 주5일 근무
- 4대 보험
- 퇴직연금
- 경조사휴가 및 경조금 지원
- 성과급, 석식제공
- 자기계발지원
- 주차비 지원
- 체력단련 지원

[기타사항]
1. 근무지 : 수원 본사
2. 급여조건은 회사내규에 따름
3. 남자의 경우 병역필 또는 면제자
4. 기타자격요건
   ① 기본예의 등 소양이 되어 있는자
   ② 해외출장이나 개인 신용에 결격사유가 없는자
   ③ 운전 가능자 우대
5. 제출된 서류는 일체 반환하지 않습니다.
6. 채용 합격 및 입사 후에라도 입사지원서 및 제출서류 내용이 거짓으로 확인될
   경우에는 합격 및 입사를 취소 할 수 있습니다.
7. 절차별 합격자는 E-mail을 통해 개별 안내해 드립니다.





Posted by 人Co

2014/07/21 17:38 2014/07/21 17:38
Response
No Trackback , No Comment
RSS :
https://post-blog.insilicogen.com/blog/rss/response/158



[모집분야]
생물정보 분석 컨설턴트
(신입/경력)

[업무내용]
1. NGS 데이터 분석 및 컨설팅
2.
생물정보 분석 컨설팅 및 제반업무
3.
기타 일반업무


[채용형태]
1. 정규직
(신입/경력) 0
1)
신입 : 인턴계약직 6개월 후 검증통과자 정규직 전환
2)
경력 : 수습계약직 3개월 후 정규직 전환


[자격요건]
1. 공통자격요건(신입/경력)
석사 이상의 생물정보학 및 생물학 관련 전공자
Python 혹은 Perl 가능자
프레젠테이션(발표) 능통자
영어회화 및 작문/독해 가능자
해외여행에 결격사유가 없는 자

2. 경력자 추가 자격요건(생물정보 분석 컨설턴트)
생물정보 데이터 분석 경력 5년 이상
Genomics(NGS) 데이터 분석 경험자 우대


[
채용일정]

1.
서류전형 : 2014.06.23.() ~ 2014.07.02.()
2.
면접전형 : 2014.07.08.() ~ 2014.07.11.() - 서류전형 합격자에 한하여 개별 통지
3.
최종 합격자 발표 : 2014.07.14.()
4.
입사예정일 : 2014.08.01.()


[
전형방법]

- 1차 서류전형 : 당사 입사지원서를 기한내 recruit@insilicogen.com로 제출
- 2
차 면접전형(서류전형 합격자에 한하여 개별통보)
   면접 시 자기소개
(경력위주 5분 분량 PT준비) 발표 포함


[제출서류]
- 입사지원서 및 자기소개서 : 당사 양식(파일명 :‘입사지원서_성명.docx’으로 저장)
-
서류전형 합격자는 PPT(경력위주, 자기소개, 5분분량)

 


[근무환경]

- 주5일 근무
- 4
대 보험
- 퇴직연금
- 경조사휴가 및 경조금 지원
- 성과급
, 석식제공
- 자기계발지원

- 주차비 지원
- 체력단련 지원


[기타]
1. 근무지 : 수원 본사
2.
급여조건은 회사내규에 따름
3.
남자의 경우 병역필 또는 면제자
4.
제출된 서류는 일체 반환하지 않습니다.
5.
채용 합격 및 입사 이후라도 입사지원서 및 제출서류 내용이 거짓으로 확인 될 경우에는
    합격 및 입사를 취소할 수 있습니다
.
6.
절차별 합격자는 E-mail 또는 휴대전화를 통해 개별 안내해 드립니다.
7.
문의사항은 메일로 문의해 주십시오. (recruit@insilicogen.com)


 

 

 

 

Posted by 人Co

2014/06/23 19:09 2014/06/23 19:09
Response
No Trackback , No Comment
RSS :
https://post-blog.insilicogen.com/blog/rss/response/155

지난 11일, CLC bio사에서는 Drug discovery를 위한 새로운 솔루션을 릴리즈 하였습니다. 그 이름은 바로 "CLC Drug Discovery Workbench" 입니다. 기존의 Workbench들은 NGS를 비롯한 시퀀싱 데이터의 분석을 촛점으로하여 계속적으로 업그레이드가 되고 있지만, 이전 Molegro사의 합병을 통해 Molegro virtual docker라는 솔루션을 리뉴얼하여 새로운 타입의 Workbench로서 출시 하였습니다.


CLC Drug Discovery Workbench는 이름 그대로 새로운 약물 개발을 위한 스크리닝 도구로서 활용할 수 있습니다. 타겟 단백질과 리간드의 결합 모델을 분석함으로서 interaction 및 docking 분석을 수행하여 단백질의 3D 구조를 확인하고 기존 Workbench의 protein 서열 분석 툴도 포함되어 있어 binding되는 서열 구조도 함께 확인할 수 있다고 합니다.

그럼 CLC Drug Discovery Workbench로 어떻게 분석되는지 살펴 볼까요?













또한 CLC bio는 "CLC Cancer Research Workbench"라는 새로운 Workbench도 곧 출시할 예정입니다.



CLC Cancer Research Workbench는 암 연구에 포커싱된 informatics 솔루션으로 NGS를 기반으로 한 amplicon, exom, whole genome sequencing 데이터를 이용하여 체세포 돌연변이 및 유전적인 질환과 약물반응, 또는 새로운 oncogene 등을 분석할 수 있으며, 돌연변이 관련 reference database를 이용하여 직접 분석한 돌연변이 데이터들과 비교 분석이 가능하도록 설계되었습니다.



그리고 일반 생물학자들도 쉽게 분석할 수 있도록 GUI 형태의 인터페이스를 제공하므로 암과 관련한 모든 연구자분들이 보편적으로 사용할 수 있는 솔루션으로서 자리매김 할 수 있을 것이라 생각됩니다.



올 4월에 릴리즈 될 예정이니 많은 관심 부탁드리며, 구체적인 기능 등은 공식 릴리즈 후에 소식 전해드리도록 하겠습니다.

그 외 생물정보 소프트웨어에 대한 문의사항도 언제나 (주)인실리코젠 마케팅팀(marketing@insilicogen.com)으로 연락주십시오.

감사합니다.









작성자 : Codes사업부 Consulting팀

김경윤 팀장


Posted by 人Co

2014/02/21 16:43 2014/02/21 16:43
Response
No Trackback , No Comment
RSS :
https://post-blog.insilicogen.com/blog/rss/response/147

2013 NGS market survey!

CLC bio사에서 지난 1월에 2013년도 NGS market survey 결과를 발표하였습니다.
NGS 시장 동향을 파악하는데 유용한 자료로 함께 공유하고자 소개해드립니다.
총 231명을 대상으로 NGS 시장조사를 실시한 결과입니다.



- Response rate: 미국이 23.4%로 가장 많은 비중을 차지하고 있습니다.
- Organization type : 2012년도와 비교한 결과 Academic organization은 7.5% 감소, Governmental은 37.5% 증가, Industry는 25.6% 증가하였습니다.


주로 여떤 연구를 수행하는가?
 


Primary application focus
- Basic research : 25.5% (가장 많은 비율을 차지)
- Microbial research : 18.6%
- Bioinformatics : 17.7%

응답자의 86%가 NGS 분석을 수행하고 있으며, 이는 2012년도(73%)보다 증가하였습니다.

2011년도(57%) -> 2012년도(73%) -> 2013년도(86%)


Illumina continues dominance


Illumina의 HiSeq 장비가 가장 많은 부분을 차지하고 있으며, Life Tech의 Ion Torrent PGM 장비가 작년 6위에서 3위로 상승하였습니다.


In-house NGS instruments


각 기관마다 NGS 장비를 얼마나 보유하고 있는지에 대한 통계치를 보여주고 있습니다. 기관의 27.9%가 NGS 장비를 더 구입할 계획을 가지고 있다고 합니다.


Preferred open source tool


UCSC Genome Browser가 여전히 1위를 차지하고 있으며, SAMtools 또한 많이 사용되고 있습니다. 대부분의 open source tool이 증가 추세를 보이고 있음을 확인할 수 있습니다.


Primary application focus


RNA-Seq Expression은 20.1%의 많은 증가율을 보이며 1위를 차지하였습니다.(작년은 whole genome sequencing) De novo sequencing은 작년에 비해 16.7% 증가하여 2위를 차지하였습니다.

해당 내용은 아래의 첨부파일을 통해 다시 보실 수 있습니다.



작성자 : 브랜드마케팅실 Marketing팀
컨설턴트 송하나

Posted by 人Co

2014/02/21 16:26 2014/02/21 16:26
Response
No Trackback , No Comment
RSS :
https://post-blog.insilicogen.com/blog/rss/response/146


관련기사
고추 매운맛 유전자, 국내 연구진이 밝혀냈다 2014.01.22 티브이데일리
고추 유전체서열 국내 독자 기술로 완성 2014.01.21 정책브리핑
고추 유전체서열 국내 독자 기술로 완성 2014.01.20 아시아투데이
고추 표준 유전체 염기서열 국내 기술로 완성 2014.01.20 연합뉴스
좀 더 맵고 맛있는 고추 나온다 2014.01.20 동아사이언스

논문바로보기
http://www.nature.com/ng/journal/vaop/ncurrent/full/ng.2877.html

'고추' 하면 떠오르는 친근감은 비단 우리나라 뿐만이 아닐 것입니다. 고추는 세계적으로 사랑 받고 있고 영양학적인 가치 또한 우수하여 토마토, 감자와 함께 대표적인 작물 중 하나로 꼽히고 있습니다. 그러나 생물학자들에게는 대중적인 선호도 이외에 토마토, 감자와 함께 고추에서 밝히고자 하는 흥미로운 관심 거리가 있습니다. 서로 닮은 듯 아닌 듯 한 이들 세 작물은 모두 가지과 (Solanaceae)에 속하는 것으로 진화와 육종을 통해 얻어진 공통된 특성과 특이적인 특성을 각각 분자적으로 밝히기에 좋은 모델이 되기 때문인데요, 특히 토마토와 고추의 경우 흥미로운 연구거리가 가득합니다.
첫번째, 토마토의 경우 사과나 바나나와 같이 에틸렌 가스에 의해 후숙성이 촉진되는 climateric fruit 인 반면, 고추는 포도와 같이 후숙성이 촉진 되지 않는 non-climateric fruit으로 같은 가지과 작물로써 서로 비슷한 유전자 세트를 가지면서도 서로 다른 형태의 숙성과정을 거치게 되는 메카니즘은 무엇일까?
두번째, 토마토의 유전체는 약 900Mb정도인데 반해 고추는 약 3Gb에 달하는 거대한 유전체 사이즈를 갖는 이유는 무엇일까?
세번째, 고추의 대중적인 인기의 근간이 되는 매운맛 성분인 캡사이신의 생합성 경로는 어찌 될까? 이 런 모든 질문에 대한 해답이 최근 생물정보 컨설팅 전문기업인 (주)인실리코젠에서도 참여한 서울대 최도일 교수님 연구팀에서 Nature genetics 에 발표한 논문 Genome sequence of the hot pepper provides insights into the evolution of pungency in Capsicum species http://www.nature.com/ng/journal/vaop/ncurrent/full/ng.2877.html 에서 모두 해결되었습니다.


논문에 많은 내용들이 있지만 그 중 후숙성 과실인 토마토와 그렇지 않은 고추와의 과실 숙성 메카니즘의 차이를 보여주는 마지막 메인 figure를 살펴보면, ripening 관련 유전자는 두 종 모두에서 보존되어 있으나 그림에서 보여지는 것과 같이 mRNA상의 발현의 차이로 (group I) 표현형의 차이가 유발된 것으로 나타났습니다. 이 중 주요 유전자는 ethylene이 생성되는 과정에 수반되는 유전자들의 발현이 고추에서 모두 저하되어 ethylene 생성이 저하되고 그로 인해 ethylene에의해 repression되는 CCS(capsanthin-capsorubin synthase)의 발현이 tomato에 비해 월등히 높게 나타나고, 결국 pepper-specific carotenoids인 Capsanthin, capsorubin의 합성이 높아 tomato와는 다른 표현형을 나타냈습니다. 반면, tomato에서는 CCS와 ortholog 관계를 갖는 CYC-B(chromoplast-specific lycopene beta-cyclase) 유전자의 발현이 ripening 과정 동안 ethylene의 높은 합성으로 인해 억제됨을 나타냄으로써 그 메커니즘을 밝혔습니다.


Comparative fruit ripening



이 외에도 고추에 많은 비타민 함량의 메커니즘이라던가, 토마토와 고추의 과실이 물러지는 차이의 원인 메커니즘과 같은 유전체 전문가가 아니더라도 흥미를 가질 만한 많은 내용이 담겨 있습니다. 물론 유전체 전문가(?)의 입장에서도 소중한 정보가 가득합니다. 사실 제가 마지막 figure만을 소개한 이유는 이 하나의 figure를 위해 수행되어야 하는 genome assembly(유전체 서열 완성), gene structure분석(유전자의 서열 및 구조, 유전자 기능, 유전체내 전체 유전자 세트), gene family분석(ortholog, paralog분석) , genome expansion분석( repetitive sequence분석), gene expression 분석(transcription factor분석, RNAseq 분석, pathway 분석), genome variant 분석(SNP, indel 분석), phylogeny 분석과 같은 많은 분석이 수반되어야 하고, 이러한 정보는 supplementary information에서 제공하고 있는 table 54개, figure 49개에 고스란히 담겨져 있음을 알려드리고 싶어서 입니다. 이들 데이터는 마지막 figure와 같은 많은 생물학자들에게 실마리를 제공할 리소스 데이터로 제공이 될 것이기에 그 잠재력이 더욱 큽니다.

Gene structure분석 파이프라인

유전자 구조 분석 파이프라인으로 고추 유전체 분석을 위해 고추의 mRNA(RNAseq, ESTs)서열,  단백질 서열, 토마토 및 감자의 단백질 서열, 애기장대, 포도 및 가지과 작물의 단백질 서열을 이용한 Evidence gene modeling과 여러개의 ''ab initio'' gene modeling (gene prediction)이 함께 수행되어 이들의 공통된 유전자 모델을 선정하는 combined gene modeling이 수행되었습니다. - (주)인실리코젠 지원


마지막으로 이번 연구의 가장 큰 성과라면, 순수 국내 연구진의 기술로 이뤄졌다는 점과 생물정보의 학문적 발전입니다. 식물의 유전체에는 유전자 영역 이외에 repeat 영역이 포유류나 균류, 미생물에 비해 매우 많이 존재하기 때문에 실제 유전체 서열을 완성하기에 매우 까다로운 조건을 갖고 있습니다. 단적으로 토마토, 감자의 경우 국제 컨소시엄을 통해 전세계 연구진의 협업에 의해 이뤄진 점만 보더라도 고추 유전체의 완성은 의미가 크다고 할 수 있습니다. 더욱이 유전체 크기가 토마토에 비해 3배이상 커지고 커진 대부분이 repetitive sequence에 해당하는 LTR retrotransposons 임을 감안하면 유전체 서열 어셈블리만 보더라도 많은 노력이 수반됐음을 알 수 있습니다. 실제, 오픈 소스 프로그램(SOAPdenovo, SSPACE, FLAKE)과 상용 프로그램(CLC Assmebly Cell; CLCbio사, 서울대, (주)인실리코젠의 공식 MOU를 통한 지원)이 모두 이용되었으며, 시퀀싱 또한 다양한 플랫폼/디자인으로 여러번의 수정과 시도를 반복하며 현재의 결과를 얻어냈습니다. 뿐만 아니라 유전자 구조 분석 또한 세계적인 수준의 분석이 진행되었으며 genome expansion, gene expression, 진화적론적인 phylogenetic 분석 모두 국내 연구진들의 몰입적인 연구를 수행한 결과라 할수 있습니다.
다시한번, 생물정보 컨설팅을 전문으로 하는 (주)인실리코젠의 입장으로 NGS라는 막강한 도구와 나날이 정신없이 발전하고 있는 생물정보학의 발전을 통해 보다 많은 좋은 소식이 있기를 기대해 봅니다.



Codes사업본부 Research실
선임컨설턴트 신윤희 선임


Posted by 人Co

2014/01/28 22:07 2014/01/28 22:07

차세대 염기서열 분석 기술은 더 짧은 시간에 더 적은 비용으로 더 많은 염기서열을 결정할 수 있는 플랫폼이 계속적으로 업그레이드 되면서, 생물정보 분석은 이제 선택이 아닌 필수가 되었습니다. 또한 NGS 데이터의 분석 단계는 크게 pre-processing, assembly 그리고 assembly를 이용한 이차 분석으로 나누어 볼 수 있는데 이러한 분석 단계들을 하나의 툴에서 모두 진행하고 그 결과를 그래픽하게 확인할 수 있다면 NGS 데이터를 다루는 생물학자들이 훨씬 더 수월하게 연구를 진행할 수 있을 것입니다. 이를 위한 목적으로 개발된 CLC bio사의 CLC Genomics Workbench는 GUI 기반의 데스크탑 솔루션으로 각 NGS 플랫폼에서 제공하는 다양한 데이터셋을 지원하여 assembly를 비롯한 이후 이차분석까지 한번에 수행할 수 있는 통합형 생물정보 분석 도구입니다.

PART 1. Variant Detection

NGS 데이터를 이용한 최근 연구들을 살펴보면 resequencing 분석에 포커싱이 맞춰지고 있으며, 이러한 연구 동향에 발맞추어 CLC Genomics Workbench의 툴들도 resequencing 분석에 초점을 맞춘 SNP, Indel detection 툴이 업그레이드되었습니다.



Variant 분석에 대한 업그레이드 내용을 이야기하기 전에 read mapping 결과를 재조정할 수 있는 툴인 ‘Local realignment’를 먼저 소개합니다. 이전에는 beta 버전으로 제공되었지만 지난 달 업그레이드가 되면서 CLC Genomics Workbench의 정식 툴이 되었습니다. Read mapping을 수행하는 과정에서 align 되지 않았던 끝 부분을 realign하여 보다 정확한 read mapping 결과를 제공해줍니다. 자, 그럼 결과를 직접 눈으로 확인하는 것이 더 신뢰가 가겠죠?



위의 그림에서 [A]는 처음 read mapping을 수행했으며, 1,2,5번째 read의 4개의 염기가 제대로 align 되지 않아 gap이 생겨난 것을 확인할 수 있습니다. [B]는 [A]의 데이터를 가지고 ‘Local realignment’ 결과 화면을 보여주고 있습니다. [A]에서 gap이 발생했던 염기부분이 다시 realign된 것을 확인할 수가 있습니다. 이처럼 realign을 통해 정확한 mapping 데이터를 기반으로 이 후 variant 분석을 수행한다면 분명 고퀄리티의 결과를 얻을 수 있을 것입니다.

CLC Genomics Workbench에서의 SNP detection은 두 가지 알고리즘으로 분석을 수행할 수 있습니다. 하나는 확률을 계산하는 ‘Probabilistic Variant Detection’, 또 하나는 quality를 계산하는 ‘Quality-based Variant Detection’의 분석 툴입니다. 이러한 두 가지 분석 툴 중에 데이터의 특성에 적합한 것으로 선택하여 분석한다면 더욱 정확한 잠재적인 SNP를 발굴할 수 있습니다.

또한 새로운 버전에서는 SNP처럼 단일 염기가 아닌 더 넓은 범위의 영역에 대한 InDel(insertion, deletion)이나 structural variant를 detection 할 수 있는 ‘InDels and Structural Variants’ 툴이 추가되었습니다. 기존 beta 버전에서는 HiSeq 플랫폼의 paired read로 mapping된 데이터만 input으로 지원했던 부분이 Roche 454 플랫폼에서 생산되는 single read의 mapping 데이터도 input으로 지원되어 다양한 데이터셋의 hybrid assembly 결과도 indel 분석이 가능해졌습니다.



그리고 variant 분석 후 발굴된 SNP 후보들이 이미 알려진 variant 정보와 비교하여 필터링 할 수 있는 ‘Filter against known variants’와 이미 알려진 variant 정보를 추가할 수 있는 ‘Annotate from known variants’의 툴 기능도 향상되었습니다.

Read mapping을 통하여 분석된 variation들을 mapping된 서열 단위에서 그 결과를 뷰어할 수 있지만, track이라는 새로운 뷰어를 제공하여 브라우저 형태의 역할을 할 수 있도록 도와주고 있습니다. 이 또한 다양한 기능 업데이트를 통해 더 효율적으로 분석 결과를 확인할 수 있습니다.

이러한 track 툴을 활용하면 위에서 보는 바와 같이 한 종의 genome 내 다양한 정보들(Gene, CDS, Transcript, mRNA, Exon, Variation)을 한 화면에서 확인할 수 있고, 아래의 그림과 같이 Trio analysis 툴을 이용하여 부모에게서 자녀로 유전되는 SNPs 정보나 mutation 정보, 그로 인해 나타나는 질병 등에 대한 분석 후 그 정보를 한번에 확인할 수 있습니다.




PART 2. Workflow

앞서 이야기한 variation 분석은 만약 여러 샘플에 대한 분석을 개별적으로 진행하려면, 단순한 분석을 여러번 수행함으로 시간이 많이 소요됩니다. 이렇게 여러 샘플의 데이터를 각각 동일한 분석 과정을 수행해야할 경우, workflow라는 기능을 이용하면 빠른 시간안에 쉽게 분석을 완료할 수 있습니다. 아래의 그림과 같이 분석해야하는 툴(기능)들을 선택하고, 각 툴을 순서대로 나열한 다음 각 분석단계의 output 파일을 다음 분석과정의 input 데이터로 연결만 시키면 하나의 workflow가 만들어집니다.


이렇게 만들어진 workflow를 이용하여 분석하고자하는 샘플 데이터만 선택해주면 일련의 과정대로 클릭 몇 번 만으로 결과 데이터를 얻을 수 있으며, workflow를 installer로 변환하여 toolbox내에 하나의 툴로써 추가할 수 있어 실험실 내에서 정규화된 분석 파이프라인을 직접 제작할 수 있습니다. 그리고 이러한 workflow를 통해 만들어지는 output 데이터를 원하는 포맷의 파일로 별도의 export가 가능합니다.





PART 3. 3D Molecule Viewing

CLC Genomics Workbench 내에는 NGS 데이터를 분석하는 툴 외에도 일반 서열 데이터를 기준으로 분석할 수 있는 다양한 생물정보 툴들이 통합되어 있습니다. 이 중 Molecule Viewer는 Protein Data Bank(PDB) database에 저장되어 있는 단백질과 다른 분자들의 structure inspection과 visualization을 수행할 수 있도록 합니다. 이 전에는 CLC Genomics Workbench를 이용하면 단백질의 3D 구조의 뷰어만 확인할 수 있었습니다. 하지만 이번 업그레이드를 통하여 3D 구조의 뷰어뿐만 아니라 서열 정보와 연동되어 3D 구조상에서 선택된 영역이 어떤 서열로 이루어져 있는지 함께 뷰어가 가능해졌습니다. Domain 및 binding site 분석하시는 연구자분들이 늘 서열과 함께 분석되어졌음 좋겠다 하셨었는데, 이젠 굉장히 유용하게 사용될 수 있겠지요?

뿐만 아니라 Protein, Ligands, Water molecules, Internolecular bonds 등의 원하는 molecule 정보만을 선택하여 뷰어할 수도 있다고 합니다.





PART 4. Phylogenetic trees


이번에 소개해드릴 기능은 계통분석을 수행하는 실험실에서는 아주 반가운 소식이 아닐까 합니다. 사실 계통분석은 굉장히 어렵고도 다양한 알고리즘이 존재하여 현재는 전문적인 소프트웨어들을 많이 사용하고 있고, CLC Genomics Workbench를 통해서는 서열을 정렬한 후 기본적인 tree까지만 제공하며 분석 결과의 수정이 어려웠던 부분이 있었습니다. 허나 이번 업그레이드를 통하여 Phylogenetic tree module이 plug-in으로 새로 추가되어 좀 더 전문화되고, 분석 결과를 그래픽하게 확인할 수 있게 되었습니다.



Phylogenetic tree module은 Plug-in을 통하여 다운로드 받으신 후 ‘Create Tree’ 툴로 실행합니다. 실행 과정에서는 이전 버전과 달라진 부분은 없으며 뷰어 옵션을 지정할 수 있는 Side panel을 통해 tree 결과의 뷰어 설정을 변경할 수 있습니다.
Tree layout이 아래 그림과 같이 다섯가지로 선택할 수 있어 원하는 형태의 tree구조를 figure 자료로 사용할 수 있게 되었습니다.



또한 이 뿐만이 아니라 메타데이터의 수정도 가능해졌습니다. 이전 버전에서 이 기능을 문의하셨던 사용자분들도 굉장히 많았었는데요, 새 버전에서는 node, label 세팅 기능의 추가로 인해 사용자가 원하는 tree 그림을 그릴 수 있게 되었습니다.

이상으로 CLC Genomics Workbench 프로그램의 주요한 업그레이드 내용을 소개해드렸습니다. 블로그를 통해 모든 정보를 알려드리기가 어려워 아쉬운점이 있지만, 소개해드린 기능 이외에도 업그레이드 및 개선된 기능들이 많이 있으니 아래의 사이트를 방문하시면 더욱 자세한 정보를 확인할 수 있습니다.

http://www.clcbio.com/products/latest-improvements/

그리고 언제든지 생물정보 소프트웨어에 대하여 문의사항이 있으신 분들은
(주)인실리코젠의 마케팅팀(Marketing@insilicogen.com)을 찾아주시기 바랍니다!
감사합니다.


작성자 : Marketing팀 송하나

Posted by 人Co

2013/09/30 16:46 2013/09/30 16:46
Response
No Trackback , No Comment
RSS :
https://post-blog.insilicogen.com/blog/rss/response/139

제3기 人Co INTERNSHIP 수료생 후기

제3기 人Co INTERNSHIP 수료생 이영호



첫째 날~ 수원의 날씨는 생각보다 좋았다. 해가 뜨진 않았지만 습하지 않고 시원한 바람이 불었던 걸로 기억난다. 마을버스(대구에는 없는)에서 시내버스로 환승하며 도착한 수원산업단지 그리고 (주)인실리코젠, 나의 인생에서 첫 번째 인턴십이 시작되던 날이다.
이번 인턴십 제3기의 총 인원은 나를 포함해 4명! 신기하게도 상명대학교 2명, 영남대학교 2명으로 초반부터 대립(?)되는 구도가 형성되었다고 선배님들께서 말씀하셨지만 이상하게도 우리들은 점점 더 가깝게 친해져서 회식도 하고 서로 도와주는 공생 관계로 4주를 함께 지냈다. 어쩌면 우리가 교육 받았던 생물정보 분석 프로그램들이 단합하지 않고 혼자 하기에는 너무 힘든 과정이었기에 서로 지식을 공유하면서 더 친해질 수 있지 않았을까 하는 생각도 든다.
CLC Main Workbench, CLC Genomic Workbench란 DNA, RNA, Protein 서열을 기반으로 여러 가지 정보를 얻어내고 그 정보를 통해 다양한 database를 구축하기 위한 생물정보 분석 프로그램이다. 내가 생각 했을 때 다양하게 분석된 생물정보 데이터는 database 구축을 통해 최종적으로 인간의 수명과 건강을 얻기 위함이 아닐까 싶다. 그런 의미에서 위의 2가지 프로그램들은 우리들이 원하는 목표의 밑거름이 될 수 있는 아주 좋은 도구가 될 것이다.
이런 도구들을 공부하는데 많은 도움을 주신 분들이 계시지만 특히 김경윤 주임님, 심재영 주임님, 송하나 선배님, 김경아 선배님들께 감사의 말씀을 전해드리고 싶다. 또 회사 생활에 대한 진심어린 충고와 조언을 아끼지 않고 해주신 임천안 이사님, 정은미 이사님 두분께도 너무나 감사드린다. 회사일 때문에 너무 바쁜 와중에도 우리 인턴들을 너무 잘 챙겨주시고 신경써주셔서 오히려 우리들이 모든 분들께 피해를 끼치는 게 아닌가 싶어 죄송할 때도 많았다. 조금 아쉬운 게 있었다면 나에 멘토이신 조아영 주임님의 분야는 디자인 쪽이셔서 교육내용에 대한 교류는 하지 못했지만 항상 친절하고 정답게 나를 챙겨주시고 좀 더 쉽게 회사에 적응 할 수 있도록 많은 도움을 주셨다. 마지막으로 (주)인실리코젠 최남우 대표님! 회사에 오기 전에 미리 홈페이지를 통해 사진을 보면서 느꼈었지만 외모도 너무 동안이시고 목소리도 다정다감 하셨다. 그래서인지 대표님과 첫 면담을 할 때 좀 더 편안하게 대화를 나눌 수 있었고 회사에 대한 믿음도 확고해졌다.
그렇게 1주차, 2주차 ,3주차, 4주차 시간이 지나면 지날수록 나 자신이 많이 변화하고 있다는 걸 스스로 느낄 수 있었다. 물론 짧은 인턴십 과정 중에서 배우게 되는 교육이나 회사 업무 등을 다 이해하고 습득하기에는 힘들 것이다. 하지만 난 이번 한 달 과정을 통해서 너무나 많은 경험을 할 수 있었던 것 같다. 첫째, 집을 나와 타지에서 자취하면서 생활하는 능력, 둘째, 규칙적인 식습관과 생활습관, 셋째, 직장에서의 예의범절과 대인관계, 넷째, 프리젠테이션 연습 등 평소에 경험하지 못했던 많은 것들을 여기서 배울 수 있게 되었다. 이 모든 경험들이 내가 앞으로 나아가야 할 방향에서 많은 힘이 될 것이라고 믿는다.
(주)인실리코젠, 그리고 대표님을 비롯한 모든 직원 분들과의 좋은 인연에 감사드립니다. 또 앞으로 더 좋은 인연이 되고 싶고 그렇게 될 수 있을 거라고 믿습니다. 감사드립니다.


제3기 人Co INTERNSHIP 수료생 윤선영



(주)인실리코젠의 人Co INTERNSHIP은 저에게 있어 사회 생활의 첫걸음이며, 한층 성장하는 계기가 되었습니다. 인턴십에 지원하기 위해 처음으로 자기소개서를 작성하고 면접을 보고, 직장 생활이 어떤 것인지도 알게 되었습니다. 조교로 계셨던 유승일 선배님이 석사 졸업후 취직했다는 소식과 함께, 그 회사에서 인턴십 프로그램을 진행한다는 교수님의 소개로 인해 (주)인실리코젠이라는 회사를 처음 접하게 됬습니다. 어떤 일을 하는 회사인지 알고 싶어 먼저 홈페이지를 찾아보게 되었는데, 깔끔한 페이지 구성과 블로그를 통해 회사소식에 대한 여러 내용들을 볼 수 있었습니다. 또한 설립된 지 얼마되지는 않았지만 연혁으로 미루어 봤을 때, 비약적인 발전을 하고 있는 회사라는 점도 눈에 띄였습니다. ‘한 번쯤 이런 회사에서 실무적인 것을 경험하고 배운다면 내 인생에 있어 많은 것이 도움이 되겠구나’ 생각이 들어 망설임 없이 지원했던 기억이 납니다.
일산에서 수원까지 많이 먼 거리는 아니지만 출근시간도 빠르고, 처음으로 하는 사회생활인 만큼 열심히 해보고자 수원역 근처에 방을 얻어 한달 동안의 인턴 생활을 시작하게 되었습니다. 입사 첫 날 가장 먼저 모든 분들께 인사를 드리며 명함을 받았는데, ‘단순히 인턴이라 생각하고 지나칠 수 있었던 부분인데 역시 인실리코젠에서는 사람 사이의 관계를 소중히 생각하는구나’ 라고 느꼈습니다. 한달이라는 짧은 기간 동안 인실리코젠의 人Co 가치체계에 걸맞게 사람을 중요시하는 회사라는 점을 확실히 느꼈습니다.
첫 주에는 회사소개와 사회 생활을 어떻게 해야 하는지에 대한 기본적인 교육을 받았습니다. 면접을 보기 전에 미리 홈페이지를 통해 간략하게 보았던 내용에 대해서 자세한 설명을 들으니, 훨씬 이해도 잘 되었고 무슨 일을 하는 회사인지에 대해 확실하게 알게 되었습니다. 또 사회 초년생에게 필요한 조언과 충고를 해주신 임천안 이사님과 직장 생활에서 꼭 필요한 예절을 가르쳐주신 정은미 이사님의 말씀이 아직도 기억에 납니다. 면접을 볼 당시에도 그리고 한 달동안 저희를 대할 때 항상 웃음을 잃지 않으셨던 정은미 이사님의 모습을 본받아야겠다고 생각했습니다.
일주일 뒤 수요세미나에서 자기소개 발표 시간이 있었는데, 어떻게 하면 지루하지 않은 발표를 할까 고민을 믾이 했었습니다. 첫 발표라 긴장도 많이 되었지만 다행히도 재미있게 들어주셔서 발표하는 동안 떨지 않고 무사히 마무리 할 수 있었습니다. 둘째주와 셋째주는 생물정보 통합 분석 소프트웨어인 CLC Main Workbench와 CLC Genomic Workbench를 통하여 생물정보의 기초에 대해 배웠습니다. 갈수록 어려워지는 내용을 배울 때마다 좌절하는 순간이 왔지만, 그럴수록 저희를 위해 열심히 교육해주시는 분들 때문에 더욱 힘이 났습니다.
인턴십을 시작한지도 벌써 한 달이 다되어갑니다. 인턴십 프로그램에 참가하여 저의 부족한 점이 무엇인지 깨달을 수 있었고, 이런 깨달음을 통해 앞으로 채워나가야 할 점들을 확실히 알았습니다. 어떻게 보면 비록 한 달이라는 짧은 시간 동안 이론과 생물정보분야에 대해 많은 내용을 배우고 가지는 못하지만 사람을 대하는 방법과 사회 생활을 어떻게 해야 하는지에 대해서는 확실히 배우고 가는 것 같습니다. 그리고 한 달동안 같이 공부했던 인턴십 3기 분들과 저희에게 좋은 말씀을 해주시고 이끌어주셨던 (주)인실리코젠의 모든 분들 잊지 못할 것 같습니다. 마지막으로 이런 인턴십 프로그램을 계획하시고 좋은 경험을 할 수 있게 해주셔서 감사합니다.


제3기 人Co INTERNSHIP 수료생 이수민



안녕하세요. 人Co INTERNSHIP 프로그램에 참여한 이수민입니다. 교수님의 추천과 학교의 현장학습 제도를 통해서 (주)인실리코젠의 人Co INTERNSHIP 프로그램을 시작하게 되었습니다. 선배님이 보내 주신 자료와 교수님의 설명을 통해 처음으로 Bioinformatics 분야에 대해서 알게 되었고 가서 한 달 동안 생물정보에 대해 열심히 배우고 막연한 두려움만 가지고 있던 사회생활을 경험하여 성장해서 돌아오겠다고 다짐하였습니다. 그렇게 기대 반, 두려움 반으로 대구에서 수원에 오게 되었습니다. 첫 출근 낯선 출근길, 장소, 사람들, 모든 것이 낯설게 느껴졌습니다. 사실 회사에 오기 전 회사 홈페이지에서 '사람을 중시 한다는 가치' 가 너무 마음에 들었습니다. 아니나 다를까 역시 회사 직원분들 모두 친절하게 대해 주시고 회사 분위기도 제가 평소에 생각해오던 분위기와 다르게 화목했습니다. 그리고 떨렸던 면담시간에 대표이사님께서 저희를 편하게 해주시고 부담감을 줄일 수 있게 해주셔서 그런지 이런 좋은 환경 속에 점차 길도 익숙해지고 금방 적응할 수 있었던 것 같습니다. 그리고 첫주 위키, OJT, 사회생활의 예절 등 익숙하지 않은 것을 접하고 배우게 되었습니다. 또한 사원의 마음가짐이라는 책을 읽게 되었습니다. 사실 저는 지금 배우고 있는 생물정보 분석 툴도 중요하지만 이 첫 주에 읽은 책과 교육도 정말 중요하다고 생각합니다. 저는 책을 읽고 독후감을 쓰면서 제가 잘못 생각하고 있던 마음가짐을 배우게 되었고 정은미 이사님과 임천안 이사님의 사회생활 교육으로 제가 잘못하고 있던, 어쩌면 처음 사회생활을 했다면 독이 되었을 부분을 알게 되었습니다. 아마 사회의 초심자인 인턴에게는 정말 중요한 첫 주 였다고 생각합니다.
두번째 주 - 이제 본격적으로 CLC Main Workbench 프로그램을 통해 생물정보의 기초를 다루고 저희를 회사 모든 분들에게 알리는 자기소개를 준비하게 되었습니다. 나름 창의적이게 하고 싶어서 열심히 준비 하였습니다. 발표 전 이제 다소 지루 할 수 있는 가장 부담되는 마지막 순서였습니다. 그리고 15분 준비했는데 아침에 7분안에 해야된다는 충격적인 소식을 들었습니다. 일단 발표를 하였고 나름 카카오톡 이미지로 신선하게 다가가 처음은 괜찮게 시작하였다고 생각했습니다. 하지만 7분으로 줄이기는 너무 힘들었고 제가 정말 하고 싶었던 저의 가치관 등을 거의 생략하게 되어 아쉬웠지만 여러 사람들 앞에서 발표하고 준비하고 정말 좋은 기회였다고 생각합니다. 그래 두번째주, 세번째주를 걸쳐 배운 CLC Main Workbench 프로그램을 통한 생물정보 분석은 처음에 너무 낯설었고 '과연 내가 해낼 수 있을까'라는 부담이 있었습니다. 하지만 송하나 선배님, 김경윤 주임님, 김경아 선배님에 둘러 쌓인 자리라서 엄청 바쁘신 것을 앉아만 있어도 느낄 수 있었습니다. 그런 와중에도 질문하면 친절하게 잘 설명해주신 덕분에 조금 익숙해지고 압박감에서 벗어 날 수 있었습니다. 정말 감사합니다. 그리고 배우면 배울수록 프로그램이 정말 대단하고 바이오 산업이 급속히 발전 하기위해 꼭 필요한 프로그램이라는 것을 알았습니다. 그리고 매주 금요일 프리젠테이션은 미뤄지기도 했지만 파워포인트 작성 능력과 발표 능력을 키울 수 있는 좋은 기회였습니다. 다른 분야에 가서도 꼭 필요한 교육이라 생각됩니다.
이제 기본기를 다진 후 중요한 CLC Genomics Workbench 프로그램을 접하게 되었습니다. NGS 포맷을 지원해서 NGS 데이터들을 통합적으로 분석하는 프로그램인 CLC Genomics Workbench가 지금 이 생물정보 분야에 중요한 저희에게는 잠깐이나마 이 분야을 조금 경험 할 수 있는 기회였습니다. 이 주에는 김경윤 주임님이 내 주신 과제로 저희가 실제로 무언가 분석을 해볼 수 있다는 것이 흥미롭고 좋았습니다. 물론 제가 원하는 결과는 얻지 못하였지만 이 분야에 매력을 느낄 수 있는 좋은 기회였습니다.
저는 분명 이 한 달이 자기소개에서 발표 한 것처럼 제 인생에 정말 중요한 퍼즐 조각이 될 것이라 확신 합니다. 회사에 대한 저의 마음가짐과 잘못된 습관을 고칠 수 있는 계기가 되었고 생물정보학에 대한 눈을 키우게 되었습니다. 한 달동안 저희 4명이 부족해도 이해해 주시고 친절하게 대해주시고 웃어주신 모든분들께 정말 감사합니다. 한 달이 정말 짧은 기간이었던 것 같습니다. 처음 멘토분들과 점심을 먹은 것이 어제 같은데 벌써 한달이 지나가고 이렇게 후기를 쓰게 되었습니다. 이러한 도움이 헛되지 않게 앞으로 이 마음가짐을 잃지 않고 이 한 달의 기억을 잊지 않겠습니다. 마지막으로 한번 더 모든 (주)인실리코젠 직원분들게 감사하다는 말과 함께 후기을 끝내도록 하겠습니다. 모두들 정말 감사 합니다.


제3기 人Co INTERNSHIP 수료생 이용은



학교 수업 중 지도교수님께서 (주)인실리코젠에서 진행하는 人Co INTERNSHIP에 대해 설명 하시고, 참가 희망자를 말하실 때 첫 번째로 손을 들었던 기억이 납니다. 졸업한 몇몇의 선배님들이 다니고 있고, 생물정보를 하는 회사라는 정도만 알고 있었는데, 회사 홈페이지와 블로그를 보면서 사람을 중심으로 하는 고객 맞춤형 서비스업을 중요시 하는걸 알았습니다. 직접적으로 이력서를 작성 하는 것이 처음이라 어떤 내용을 적을까 고민도 해보고 면접을 볼때 어떤 복장과 어떤 말을 해야 좋을까라는 생각을 했었습니다. 시간이 흘러 저에게 전화 한통이 왔는데, 그것은 바로 (주)인실리코젠에서 걸려온 전화였습니다. 서류가 통과 되었으니 면접을 보러오라는 전화였습니다. 면접 당일 파주에서 새벽 기차를 타고 낯선 수원까지 와서 첫 면접을 보려고 하니 매우 긴장되었지만, 입구 게시판에 welcome이라는 글귀 아래 제 이름이 적혀 있는 것을 보고 괜시리 뿌듯했었습니다. 긴장되었지만 면접에서 당당히 준비했던 말들을 모두 하고 만족스런 면접이 그렇게 끝이 났습니다. 최종결과가 있던 날!! 아침 일찍 부터 합격 통보 전화를 기다리고 또 기다리던 찰나에 전화가 걸려왔는데 인턴십 프로그램에 합격 했으니 7월 4일부터 출근 하라는 전화였습니다. 가벼운 발걸음으로 첫 출근을 하던 날 모든 직원 분들께 인사를 드리고 명함을 받았는데 바쁘신 중에도 웃으면서 인사를 받아주시던 (주)인실리코젠의 모든 분들이 아직도 생생히 기억납니다.
1주차에는 사회생활에 필요한 예절교육과, 안전교육, wiki 사용법 등 교육을 받았고, 2주차 수요세미나 시간에 자기소개 발표가 있으니 준비하라는 얘길 들었습니다. 어떻게 준비해야 나란 사람을 소개할까 생각하면서 발표 준비를 하였고, 드디어 첫 발표를 하던 날 (주)인실리코젠의 모든 직원 분들이 보는 앞에서 발표를 했습니다. 며칠간 발표 연습을 했지만 학교와 다른 분위기에서 첫 발표를 한다는 생각에 떨었습니다. 특히 슬라이드 마지막에 제 이름을 기억해 달라고 했었는데 지금 생각해보면 닭살 돋고 손발이 오글거리는 멘트였습니다.
그리고 2주, 3주차에는 본격적으로 분자생물학 데이터 분석 및 관리를 위한 통합 생물정보 분석 툴인 CLC Main Workbench와 NGS 데이터 분석이 가능한 CLC Genomics Workbench에 대해 배웠습니다. 매주 금요일은 한 주 동안 공부한 것을 파워포인트로 제작하여 발표 했었는데 저에게 자신감도 길러주었고, 다시 한 번 복습 할 수 있는 좋은 시간이었습니다. 어느덧 4주차가 되어 人Co INTERNSHIP이 끝나게 되었지만, 4주 동안의 생활은 앞으로의 생활에 큰 도움이 되었습니다. 평소 아침 잠이 많은 저를 부지런하게 만들어 주었고, 사원의 마음가짐이란 좋은 책을 읽을 수 있는 기회와 여러 교육들을 들으면서 사회생활에서 필요한 예절 및 행동들을 배울 수 있었습니다.
4주의 짧은 시간이었지만 저에게 좋은 말들과 도움을 주셨던 멘토 심재영 주임님을 비롯한 모든 분들에게 감사드리고, 이러한 좋은 추억과 인연을 만들어 주신 최남우 대표님께 감사하단 말 전해드리고 싶습니다.





Posted by 人Co

2013/08/07 16:39 2013/08/07 16:39
Response
No Trackback , No Comment
RSS :
https://post-blog.insilicogen.com/blog/rss/response/137

이번 블로그에서는 NGS 데이터로부터 미지의 유전체 크기 (genome size)를 in silico적인 방법으로 예측하는 것에 대해 얘기해보려고 합니다.



Genome size의 다양성

위 그림에 보이는 것처럼 생물종군에 따라서 유전체 사이즈는 상당히 넓은 범위에 걸쳐있는 것을 알 수 있습니다. 주목할 것은 흔히 생각하듯이 그 생물체의 organismal complexity와 유전체 크기는 큰 상관관계가 없을 수도 있다는 것입니다. 예를 들어 human보다 수십배, 수백배 더 큰 유전체 크기를 자랑하는 Protist, Plant, Amphibian 종들도 존재하는것을 확인할 수 있습니다 ("C value paradox"). 생물종의 복잡도와 유전자 개수, 그리고 유전체 크기등의 상관분석도 재미난 연구 topic이 될 수 있을 것 같고 아마 누군가는 열심히 연구 중에 있을 것 같습니다 (아마도 결과가 나와있을지도??).

생물정보학적인 유전체 분석의 제일 첫 스텝은 아무래도 de novo genome assembly가 아닐까 합니다. 만 약에 어떤 생물종의 유전체 de novo assembly를 진행하고자 할때 사전지식이 없어 분석하고자 하는 그 생물종의 유전체 크기를 알지 못한 상태에서 진행한다면 어떨까요? 염색체가 몇개인지 전체 사이즈가 얼마인지 모른다면 상당히 답답할 것입니다. 시퀀싱을 얼마나 어떻게 해야할지도 막막할테구요. 일 반적으로는 실험적인 방법 (일례로 flow cytometry)을 통해서든 아니면 유전체 크기가 알려진 유사성이 높은 다른 종으로부터 어느정도 사이즈를 예상한 상태에서 NGS 분석을 진행합니다 (실험적인 유전체 사이즈 측정방법들에 대해서는 다음 기회에 다뤄보도록 하겠습니다). 하지만 de novo assembly를 통해 만들어낸 draft genome이 맞게 잘 만들어진 것인지 확인하기 위해서라도 대략적인 유전체 크기를 알면 많은 도움이 될 것입니다.

다행히도 이런 고민을 먼저 했던 사람들이 있고 NGS 데이터만 가지고 in silico적인 방법으로 유전체 크기를 예측하는 방법이 고안되었습니다. 오늘은 그중에서 두가지를 소개할까 합니다.


첫번째: BGI 방법

첫번째는 BGI (Beijing Genome Institute)에서 소개한 방법입니다. 이미 여러편의 논문에서 인용이 되었고 저희팀에서 자주 이용하는 방법입니다. 원리는 간단합니다. Genome shotgun NGS를 통해서 100bp 짜리 short reads 3400만개를 얻었다면 총 total base number는 3.4 x 10^9이 됩니다. 만약 그 종의 유전체사이즈가 200Mb라면 이는 17 fold에 해당하는 양입니다.

만약 genomic sequencing library를 유전체 조각의 유실없이 제대로 잘 만들었고 시퀀싱도 충분한 양 (15-fold 이상)이 되어졌다면 특정 시퀀스들을 대상으로 depth frequency를 plotting 했을때 17-fold에서 peak를 그리는 정규분포의 모양을 할 것이라고 예상할 수 있습니다.

-- 수식 (1)

위 수식을 보면, total_read_num, avg_read_length는 이미 알고 있으므로 coverage_depth를 알면 미지의 genome size를 계산할 수 있게 됩니다.

여기서 특정 사이즈의 k-mer시퀀스를 살펴봅시다. NGS data로부터 만들어질수 있는 전체 k-mer 갯수는 다음과 같습니다.



예를 들어 100-mer짜리 Illumina HiSeq read 하나에서 만들어질 수 있는 17-mer (임의의 k-mer를 17로 정했을경우)의 갯수는, 100 - 17 + 1 (= 84)개가 될 것입니다. 이러한 HiSeq reads가 300백만개가 있다면, average read length는 100-mer, k-mer size는 17-mer로 상정할 경우,



이 됩니다. 이 2억5천2백만개의 k-mer들 중에는 동일한 시퀀스들을 가진것들이 있을 것이고 unique한 k-mer들의 리스트를 작성, 각 k-mer가 몇번씩 관찰되었는지 그 frequency를 계산합니다. 그렇게 해서 depth가 같은 k-mer들이 전체 k-mer pool에서 차지하는 비율을 plotting 합니다 (x축은 k-mer depth, y축은 전체에서 차지하는 frequency, k-mer frequency plot의 example은 아래 giant panda 데이터를 참조).

그리고 다음의 수식도 성립합니다.

위에서 작성한 k-mer frequency plot에서 peak을 보이는 depth point가 k-mer_coverage_depth가 되며 아래 수식에 의해 NGS 시퀀스 전체의 genome coverage depth를 구할 수 있게 됩니다.

여기서 구해진 coverage_depth로부터 전체 genome_size를 위 수식 (1)로 부터 구할 수 있습니다.

-- 수식 (2)

JELLYFISH: k-mer frequency distribution 측정
다음으로 NGS data로부터 k-mer frequency plot을 얻는 방법입니다. 여러개의 프로그램이 논문에 나와있는데 그중에서 저희팀은 BGI와 마찬가지로 JELLYFISH를 이용합니다.


Ref. Marcais and Kingsford (2011) A fast lock-free approach for efficient parallel counting of occurrences of k-mers. Bioinformatics 27:764–770


JELLYFISH는 free software로 여기(http://www.cbcb.umd.edu/software/jellyfish/)에서 다운로드 받을 수 있습니다.

JELLYFISH를 이용해 얻은 k-mer frequency plot을 얻은 일례입니다. BGI에서 분석한 Giant Panda의 경우인데, 17-mer짜리를 이용해서 frequency plot을 얻은 결과입니다.


Ref. Li et al, The sequence and de novo assembly of the giant panda genome. Nat. Genet. (2010) 473:311-317


왜 17-mer인가?

이론적으로는 어떤 k-mer를 사용하든 유사한 결과를 얻을 것입니다. 하지만 제대로된 결과를 얻기위한 가정은 최소한 특정 k-mer가 해당 유전체에서 딱 한번 unique하게 발견되어야 합니다. 5-mer 짜리는 확률적으로 1 kb당 한번씩 발견될 수 있고, 10-mer는 1 Mb당 한번씩 발견될 수 있습니다. 이렇게 사이즈가 작은 k-mer들은 시퀀스가 유전체에 여러번 무작위적으로 발견될수 있기 때문에 올바른 결과를 담보할 수 없습니다. 16-mer쯤 되면 4.3 Gb당 한번정도 무작위적으로 발견됩니다. 이정도면 나쁘진 않지만 위 표에서 보시다시피 4.3 Gb 보다 더 큰 사이즈의 유전체도 존재하기 때문에 안심할 수 없겠죠. 17-mer 정도면 (17 Gb당 1번) 현재 진행되는 유전체 프로젝트에서는 안전한 결과를 보장할 수 있다고 하겠습니다. 더 큰사이즈의 k-mer는 안되냐구요? 물론 가능합니다. 하지만 frequency plot을 그리기 위해 더 많은 k-mer를 이용하는 것이 일반적으로 더 안정적인 결과를 얻을 수 있고 또 시퀀스의 base quality가 완벽하지 않기 때문에 시퀀스 에러가 있을 수 있어 큰 k-mer를 사용할 수록 에러율이 높아질 위험이 있습니다. 대략 17~21-mer 정도가 가장 효율적이라 여겨집니다.

두번째: RNA-seq 방법

두번째로 소개할 방법은 BMC Genomics (2011) 논문에 소개된 내용입니다. 버블콘이라 불리는 바다달팽이 (Conus bullatus)의 전사체를 분석한 논문인데요 (Ref. Hu et al. BMC Genomics 2011, 12:60). 기본적인 원리는 위에서 소개한 BGI 방법과 유사합니다. 차이점은 Genome Shotgun NGS data만 이용하는 것이 아니고 RNA-seq data도 함께 이용한다는 것입니다. RNA-seq에서 얻은 sequence reads에 genome NGS reads를 매핑하는 것이죠. Transcriptome을 레퍼런스로 삼아서 genome sequence reads를 붙이고 각 transcript당 평균적으로 몇 fold로 붙었는지 계산해보면 그 genome NGS reads가 genome의 몇 fold를 반영하고 있는지를 판단할 수 있다는 원리입니다. 이 방법의 장점은 genome NGS coverage가 1.5 fold 정도여도 좋은 예측결과를 보여준다는 것입니다.

이 방법을 검증하기 위해 논문에서는 C. elegans와 D. melanogaster의 NGS 데이터로부터 가상의 1.5 fold 짜리 모의데이터를 구성해서 테스트를 해보았는데 다음과 같은 좋은 결과치를 얻을 수 있었다고 합니다.



WU-BLASTN으로 "M = 1 N = -3 Q =3 R = 1 wordmask seg lcmask" 옵션을 사용해서 NGS reads를 RNA-seq 어셈블리로 만들어진 transcript contigs에 매핑합니다. 각 transcript별 coverage depth를 length 기준으로 계산해서 얻은 다음, 위 그래프에서 보는 것처럼 coverage-depth vs transcript percentage plot을 얻습니다. 이때 얻어진 maximum peak coverage가 전체 genomic NGS reads의 coverage가 되며, 수식 (2)를 이용해서 전체 genome size를 예측할 수 있습니다. 만약 소량의 genome NGS data만 있어서 첫번째로 소개한 k-mer 방법을 사용하기 어려운 상황에서 RNA-seq data를 같이 가지고 있다면, 써볼만한 방법이라고 생각됩니다.

 


작성자 : Codes사업부 Research팀 노승재 팀장

Posted by 人Co

2013/06/11 16:27 2013/06/11 16:27
Response
No Trackback , No Comment
RSS :
https://post-blog.insilicogen.com/blog/rss/response/133

人Co Internship 2013을 마치며-


지난 1월 7일부터 한달여간 (주)인실리코젠의 생물정보 인재양성 프로그램인
人Co INTERNSHIP 프로그램이 진행되었습니다. 국내 기업과 연구기관에서 요구하는 최신의 생물정보 솔루션과 기초 기술교육 및 사내 현장실습을 통해 바이오 연구개발과 조직 생활의 기초 개념을 이해할 수 있는 좋은 기회를 제공하는데 목적을 둔 본 프로그램에 앞으로도 생물정보인재로 성장하고자 하는 많은 분들의 관심과 참여 바랍니다.
수료하신 네 분 모두 축하드리며, 소감을 한 번 들어볼까요?

사용자 삽입 이미지

강전모

2013 人Co Internship에 참여한 강전모입니다. 전 이번 2013년 새해를 인실리코젠과 함께 시작하였습니다.
지금 영남대학교 생명공학과에 재학 중에 있지만 생명공학 전공임에도 불구하고 전공 관련 기업 등에 대해서는 잘 알고 있지 않았습니다. 그러던 중 동기생인 명희선배의 취업소식을 통해 '인실리코젠' 이라는 회사를 처음 알게 되었고, 이 후, 학교에서 열리는 학회에서 박준형 부장님의 발표도 보고, 강의시간에 정명희 선배의 회사 소개를 들으면서 인실리코젠에 대해서 알게 되었습니다.
이렇게 알게 된 인실리코젠에 대한 첫 이미지는 빼어난 디자인이었습니다. 아직 잘 알지 못했었지만 다른 곳과 다르게 딱딱하지 않은 홈페이지와 블로그는 부담 없이 알아갈 수 있도록 도와주었습니다. 호감을 가지고 둘러보던 중 인실리코젠의 기업가치인 人Co ‘사람(人)을 중심(Core)으로 컴퓨터(Computer)를 통해 배려(Consideration)하고 소통(Communication)한다.’ 를 보고 감동 받았었습니다. 또 제가 관심이 있는 컴퓨터를 이용하고, 사람이 중심이라는 말을 통해 호감은 관심으로 이어졌습니다. 이 관심은 저에게 경험을 위해 한 발짝 내딛을 수 있는 용기를 주었고 이를 계기로 이번 12월 학교 홈페이지를 통해 알게 된 ‘인턴십 지원자 모집’ 과 교수님의 추천으로 이번 인턴십에 지원하여 참여할 수 있게 되었습니다.

1월7일 떨리는 마음으로 인실리코젠에 출근한 첫날, 자리와 노트북을 배정받고 회사 업무에 필요한 skype나 wiki 사용법, 회사 소개 등을 받으며 인턴십을 시작하였습니다. 무엇보다 송하나 선배가 직원 한분 한분을 소개시켜주시는데 반갑게 맞이해주시며 정중하게 명함을 건네주시던 그 모습이 정말 인상 깊었습니다. 첫 주의 수요세미나를 통해 각자 자기소개 발표를 하며 정식으로 직원 분들께 인사를 드렸는데, 발표 전 까지는 괜찮았지만 발표를 시작하는 순간 너무 떨리는 바람에 어떻게 발표했는지 기억도 안날 정도였습니다. 1주차 중반에 접어들면서 CLC Main Workbench에 대해 배우기 시작했습니다. 수요세미나 후 농림수산검역검사본부에 CLC Main workbench 강의지원을 나가서 책자와 볼펜, 설문지도 나눠드리고, 쉬는 시간을 위한 다과도 준비하며 강의 준비를 도와드렸고, 앞으로 익혀나가야 할 CLC Main Workbench에 대한 강의도 들었습니다. 생각 외로 많은 분들이 모이셨고, 단상에 서서 강의하는 김경윤 주임님과 송하나 선배를 보면서 왠지 모를 뿌듯함과 자신감이 생기는 것 같았습니다. 강의를 들으면서 대략적인 CLC Main Workbench 사용법을 배웠고 이를 바탕으로 CLC Main Workbench overview를 발표 자료를 만들면서 tool사용법을 숙지하였습니다. overview발표 후 CLC Main Workbench를 이용해 당뇨병과 인플루엔자에 관한 두 가지 case study를 실습하였습니다.

당뇨병에 관한 주제는 '사람의 당뇨병에 연관된 유전적 변이 확인'으로, 사람과 유사한 점이 많은 돼지의 유전체내 당뇨병 관련 위치에서의 서열 다형성을 CLC Main Workbench를 사용하여 분석하는 것이었습니다. CLC Main Workbench에 있는 NCBI 검색기능으로 당뇨병관련 유전자인 UCP유전자를 찾고, 이 유전자를 BLAST하여 상동성을 가진 돼지 및 다른 개체 5종의 서열을 다운받아 Alignment를 수행한 후 나머지 종들과 비교하면서 돼지와 사람에서 SNP로 의심되는 지역을 annotation 하였습니다. 이 후, NCBI SNP DB에 올라와있는 SNP를 비교해 실제 SNP가 존재하는 지역을 찾고 이를 포함하는 유전자 서열을 클로닝하기 위한 primer도 제작해보고, 임의로 선택한 증폭구간의 서열에서 SNP가 바뀌어서 아미노산 서열이 바뀌는 지를 translation tool을 이용해 비교해보았습니다. 두번째는 인플루엔자에 관해 '높은 발병률의 조류독감 바이러스의 유전적 특성'을 주제로 case study를 진행하였고 당뇨병의 case study와 비슷한 방법으로 수행하였습니다. CLC Main Workbench를 이용한 DB search를 통해 각 type 별 인플루엔자 서열을 받아 Alignment를 수행하고, 이를 통해 type간의 서열차이를 확인하고 BLAST를 이용해 각 type별 인플루엔자의 상동성을 조사하였습니다. 이 과정에서 각 인플루엔자 간에 동일하게 일치하는 지역을 확인하였고, 이는 인플루엔자 연구에서 primer 제작 등에 사용될 수 있을 것이라는 생각도 하게 되었습니다. 마지막으로는 phylogenetic tree 그려 봄으로 인플루엔자 바이러스가 지역별로 분화한다는 특징도 확인하였습니다. 이 두 case study에 대한 발표준비를 하면서 인턴십에 참여하지 않았다면 알 수 없는 CLC Main Wrokbench라는 프로그램을 알게 되었고, CLC Main Workbench가 실험이나 연구에 얼마나 많은 도움을 줄 수 있는지도 몸소 체험하는 계기가 되었습니다.

이후, Genomics Workbenh에 대해 김경윤 주임님의 설명을 듣고 Main Workbench처럼 그룹스터디가 아니라 개별 스터디로 발표 주제를 각각 배정받고 실습했습니다. 학교에서 수업으로만 들었던 NGS 데이터를 이용해 assembly를 실습할 수 있었는데, assembly에 관한 알고리즘이나 각 NGS file format에 맞는 옵션설정과 assembly를 수행하기 위한 parameter설정 등의 절차를 알게 되면서 학교에서는 미처 배우지 못했던 것을 알게 되는 계기가 되었습니다.

인턴십 시작할 때 책을 한권씩 나눠 주셨습니다. '사원의 마음가짐'이라는 책이었는데 회사에 실습하면서 책을 읽게 될 줄은 예상 밖이었습니다. 예전엔 서점에서 책도 구매하여 읽고, 좋아하는 작가도 있었으며 책 읽는 것을 좋아했는데 지금은 거의 읽어본 적이 없어서 내심 반성하는 기회도 되었습니다. 이 책을 읽고 난 후, 지금 가장 크게 와 닿았던 문구가 있습니다. '백문이 불여일험' '백번 듣는 것 보다 한번 경험하는 것이 더 좋다.' 라는 뜻입니다. 4주 동안 CLC Main Workbench와 Genomics Workbench를 배우고 실습하면서 사실 종종 의문점도 들었었습니다. 인턴십 과정 이기는 하지만 회사의 업무를 배워 간단한 일이나마 도와드린다는 생각보단 회사에게 일방적으로 배우기만 하는 과정이 더 컸기 때문입니다. 하지만 점점 발표준비를 하고 사장님과 이사님 그리고 부장님, 주임님의 면담과 직원 분들이 일하시는 모습을 보고 그냥 지나가는 인턴십 과정이 아니라는 것을 깨달았습니다. 더 좋은 솔루션을 만들고, 좋은 프로그램을 다른 사람들에게 제공하기 위해서는 자신도 프로그램에 대해서 잘 알고 있어야하며, 사용하면서 생긴 여러 가지 문제점들과 의문점을 해결해 줄 수 있어야 하기 때문입니다. 또한 이러한 과정을 통해 자신 스스로가 성장하고 이 성장이 회사가 성장하는 계기가 되는 것처럼 하루하루가 그냥 지나가는 것이 아니라 경험이고, 이 경험들이 쌓이면 능력이 된다는 것을 최근에서야 깨달았습니다. 이 뜻을 이해했을 때 인턴십 프로그램에 참여하길 정말 잘했다는 생각이 들었습니다.

또 이번 인턴십에 참여하게 되어 저의 시야를 조금 더 넓힐 수 있게 된 것 같습니다. 사실 생물정보학 분야가 이렇게 넓고 다양할 줄은 생각하지 못했었습니다. 생물정보분석과 실험은 별개라고 구분했던 편견이 깨어졌고 물론 많은 고민이 생기긴 했지만, 저에게 부족한 점이 무엇인지, 무엇을 해야 할지 등의 제가 가야할 길의 갈피를 잡아주었습니다. 아직 1년의 시간이 남은 만큼 조금 더 고민하고, 노력한다면 1년 후에는 더욱 성숙해져있는 저를 볼 수 있을 것 같습니다. 4주간의 人Co Internship을 통해 많은 가르침을 주신 사장님 및 직원 분들에게 감사의 인사를 드립니다.

사용자 삽입 이미지

김정민

4주간 인실리코젠과 저와의 인사

지금(2013년 2월 1일)으로부터 약 2달 전 교수님께서 전화가 오셨습니다. “정민아, 이번에 인실리코젠에서 여름때 못갔던 인턴십을 다시 하니까 갈 수 있지?, 가서 많이 배워왔으면 좋겠다.” 라고 하신 것이 이곳 인실리코젠과의 대면을 위한 교수님의 배려이자 저에게는 첫 걸음마였습니다. 그 후 1달 뒤 처음 수원에 올라올 때, 네비게이션의 목적지가 인실리코젠이 있는 벤처밸리여서 일생 처음 수원에 올라와서 첫발을 내딛은 곳도 ‘회사 바로 앞’이었습니다. 그날따라 날이 춥고 먼 길을 오느라 피곤했지만 낯선 이곳이 신기했고 빨리 회사에 들어가서 회사분들을 뵙고 싶다는 생각을 했습니다. 하 지만 어느 곳이나 마찬가지듯이 낯선 곳은 두렵고, 어색하기 마련이고 여기서 처음 또한 그러했지만, 人co core라는 말과 걸맞게 사람을 가장 먼저로 여기고 소중히 생각하는 이곳의 선배님들께서 너무 자상하게 대해주셔서 적응하는데 큰 힘이 들지 않았습니다.

첫 날, 둘째날에 걸쳐 많은 분들께서 명함을 주시며 특히 정은미 이사님께서 “명함을 대할 때 우리는 그 사람을 대하듯이 소중하게 대한다.”라 말씀하시며 그 분들에게 얼굴이 되어주는 인실리코젠 특유의 디자인이 되어있는 명함을 소중히 받는 시간을 가졌습니다. 실제로 모 교수님을 뵐때 명함을 받으시는 모습을 볼 수 있었는데 받으신 이후에 명함을 대하는 모습을 유심히 보았습니다. 그 결과 저는 명함은 그 사람을 대면할 때 절대로 함부로 하지않고 소중히 앞 테이블에 놓아서 이야기를 나누신다고 우리에게 교육하신 그대로 몸소 실천하고 계심을 보고 진심으로 감명을 받았습니다. 다른 곳에서는 명함같이 작은 것 하나까지 소중히 여기시는 분들을 볼 수가 없었는데 그런 모습을 보면서 또 한번 ‘정말 나는 인턴십을 온 것이 아니라 “人Co” 인턴십에 와있는구나.’ 라는 생각을 하게 되었습니다. 임천안 이사님께서 우리에게 보안각서 등을 주시며 그 순간까지도 깨알같은 조언이나 인생에 있어서 필요한 충고를 아끼지 않으셨습니다.

이 곳에서 가장 기억에 남는 것들 중 하나가 발표하는 것들에 대한 역량을 늘리기 위해서 자주 발표를 하는 시간을 가졌는데 그 시작은 인턴쉽 3일차 되는 날에 가졌던 나에 대한 소개 발표였습니다. 그날의 기억이 아직도 생생한데 많이 긴장하고 떨렸지만 발표할 때에 이곳 분들이 편안하게 하라고 편안한 분위기를 자연스럽게 만들어 주신 대한 작은 배려가 저에게는 매우 큰 힘이 되어 무사히 마칠 수 있었습니다.

또한 우리가 3주가량에 걸쳐 배운 CLC main workbench, CLC genomics workbench라는 프로그램을 처음 접할 수 있게 농림수산검역검사본부에서 열린 세미나에 참석했는데 김경윤 주임님, 송하나 선배님께서 발표하시는 모습을 보게 회사에서 하루일정을 배려해 주셨습니다.

첫 주가 이렇게 마무리 되고 두 번째 주는 본격적으로 CLC main workbench를 이용해서 실습하고, 공부하는 시간을 가졌습니다. 처 음에는 매우 낯선 프로그램을 접함으로 인해 오는 스트레스와 압박감이 있었지만 사용을 하면 할수록 너무 편리하고 유익하고 어딜 가든지 회사의 일원은 아니지만 소개해주고 싶다고 생각이 드는 프로그램임을 깨달을 수 있었습니다. CLC main workbench를 이용하는 작업을 하면서 이곳에서는 직접적으로 하지는 않았지만 실험적인 측면이나, 기타 생물학적인 배경지식을 쌓는데 많은 도움이 되어 유익한 시간임을 또 한번 깨닫고 이곳에 와서 이렇게 교육을 받는다는 자체가 ‘알아가는 행복’임을 느꼈습니다. CLC genomics workbench를 할 때에는 조금 더 어려운 NGS를 이용한 mapping분석이며, 변이에 대해 분석-조사 했는데, 항상 경윤 주임님께서 “어려운 부분이 있으면 언제든지 와서 물어보고 또 부담감 가지지말고 공부하고 준비해서 아는 만큼 발표하자”고 우리를 위해 배려차원에서 말씀해주셔서 마음을 편히 가지고 공부할 때도 더 집중할 수 있게 되었고 발표 후 경윤 주임님의 설명을 통해 공부할 수 있는 질보다 더욱 심도있는 내용을 공부 하였습니다. 단언코 만일 저러한 프로그램이 필요한 실험실이나 회사가 있다면 돈을 주고 직원을 보내는 손해를 감수하면서도 여기서 교육을 통해 배울 충분한 가치가 있는 내용의 인턴십 프로그램이었습니다.

또한 사람을 먼저 생각하고 그 사람의 인성이나 하고자하는 성실감을 먼저 보며 그 사람의 부족한 점은 시간을 들여서 키운다는 신념아래 저희에게 나눠주신 지금은 고인이 되신 마쓰시타 고노스케씨의 사원의 마음가짐이라는 책을 읽으면서 회사의 일부분으로써 어떠한 마음가짐을 가져야하고 이곳에서 원하는가를 알 수 있었습니다.

다른곳의 인턴십을 체험해보지 못해서 잘은 모르겠습니다만, 이곳은 학교에 제출하는 우리의 임무임에도 불구하고 하나부터 열까지 꼼꼼하고 세세하게 다 신경써주셨던 이지혜 주임님과 모든 과정을 관료적이지 않고 ‘내가 정말 나에 대해서 알고 싶어하는 회사에 있구나’라는 생각이 들게끔 해주었던 모든 프로그램들은 이곳에 오고싶다고 하는 분들이나 관심을 가지고 있는 분들께는 지금이라도 당장 가보라 말씀드리고 싶습니다.

제가 다른 곳을 선택 할 수도 있었지만 교수님께서 “이곳은 가 보아야하는 곳이다”, 학교 선배이신 명희 선배님께서도 “나는 우리회사가 너무 만족스럽고 거기의 사람들이 너무 좋아서 일할 맛이 난다.”라는 말들을 듣고 택했는데 아주 탁월한 선택이었던 것 같습니다. 또 이곳에서는 멘토, 멘티라는 것이 있어서 지정해놓은 멘토에게 궁금한거나 힘든일이 있으면 자연스럽게 가서 여쭈어보고 맘을 터놓을 수 있게 해놓아서 너무 좋았습니다. 제 멘토는 Descign팀의 조아영 주임님이셨는데 1:1로 대화하기에는 너무 바빠보이셔서 그렇게 잘 하지는 못했지만 처음에 적응을 할 수 있게끔 교육때 편의도 봐주시고, 식사도 같이하면서 다른 분들보다는 조금 더 가까워 질 수 있게 해주셔서 감사했습니다. 보 통 무슨 일정이든 끝이나고 돌아갈 때는 더 잘할거라는 아쉬움과 끝이나서 홀가분한 마음이 들기 마련인데 4주교육을 마치고 돌아가는 순간에도 한주만 더 있어서 더 많은 것을 배우고 싶은 마음이 간절해서 제가 제 자신에게 놀래면서 대구로 돌아갑니다.

영리를 추구하는 회사에서 실적이나, 자신의 업무에 대한 책임은 어느곳에나 있듯이 이곳에서도 있겠지만 이곳은 ‘돌봄’이 있는 회사이고 배려가 있는 회사입니다. 높은 직급을 가지신 분께서 사원분들이나, 저희에게 작은 것 하나도 시키지 아니하시고 도와줄 수 있느냐고 말씀하시는 것이 이상적으로 말하는 소위 ‘수평적 관계’의 회사의 바람직한 모습을 보여주고 있지 않느냐 느껴짐을 얻었습니다. 이곳을 안 것은 앞으로의 Bioinformatics 분야로 가기를 마음먹은 저에게는 놓쳐서는 안될 큰 기회이자 행운이었던 것 같습니다. 끝 으로 우리 곁에서 있는 듯 없는 듯 지켜보아주신 최남우 사장님께서는 모든 직원분들의 으뜸되시는 CEO로서 존경 또한 한 몸에 받고 계신 듯 보여집니다. 많이 겪어 보지는 못했지만 말씀 하나 하나 하실 때 단어선택에도 신경을 쓰셔서 말씀을 하시고 한마디 한마디에 진심을 담아 나아갈 비젼을 저희에게 보이시고 우리의 생각을 물으시고 들어주심에 회사의 직원분들이 왜 이토록 친절하시고 배려가 많으신지 알 수가 있었습니다. 저는 이것을 끝으로 여기지 않습니다. 지금은 다시 학교로 돌아가지만 분명 회사에서 만족할 만한 인재가 되어 다시 이곳을 방문했을 때는 이렇게 아쉬운 마음으로 돌아가지 않을 것입니다. 그때가 너무 기다려지고 기대가 됩니다. 다시 한번 귀한시간 내어 저를 4주가량 맡아서 친절과 배려로 가르쳐주신 인실리코젠의 모든 직원분들에게 감사의 말씀을 짧게나마 드리면서 인실리코젠과 함께한 4주간 “人Co” 인턴십에 대한 후기를 맺겠습니다. 감사합니다!

사용자 삽입 이미지

김진규

[첫 만남 : 2013년 1월 6일 (일)]

人Co Internship의 첫 시작은 1월 7일 월요일이었지만, 내게 있어서 실제 인턴십의 시작은 1월 6일 일요일이었다. 수원 사무실에 8시까지 출근해야 된다는 사실을 알게 되었고, 평소 잠이 많은 나는 고민 끝에 4주 동안 수원 사무실 근처에서 살기로 마음 먹었다. 한 달간 일하게 될 인실리코젠 본사에도 미리 와보고 주변 고시원, 숙소들도 알아보았지만 마땅치 않았다. 게다가 6개월도 아닌 한 달 동안 살 방을 알아보는 것은 더욱이 어려웠고 수원역 주변은 이른 아침마다 출근하기엔 교통편에서 별 이점이 없어 보인다고 생각하여 지나가던 중 찜질방을 보게 되었고, 나는 1월 6일부터 2월 1일 한 달간 찜질방에서 살게 되었다. 사실 처음부터 찜질방 생활이 편했다고 할 순 없지만 약 4주가 된 지금은 정말 편하게 잘 지내고 있다. 다음 날 나는 인실리코젠에 처음으로 출근을 하게 되었다. 지문 등록, 위키 문법과 OJT작성, 사내 예절 교육, Skype 등 모든 것이 처음 접해보는 것이고 낯설었고 어려웠다. 다른 인턴 분들께서 먼저 와 계셨는데 당시는 정말 어색하고 긴장됬지만 한 주 한 주 같이 배우고 일하고 발표하면서 정말 큰 힘이 되었다. 만약에 다른 인턴분들이 없었다면 지난 4주 동안 어떡했을까 하는 생각이 든다.

[1주차]
첫 날 이후 인실리코젠 직원 분들을 익히는 것이 어려웠다. 그 이유는 직책이 너무 다양했기 때문이다! 이전에도 아르바이트 등을 해왔고, 군대에서도 금방 익혔는데… 선임님, 주임님, 책임님, 수석님….너무 헷갈렸던 기억이 난다. 뿐만 아니라 그 동안 가끔씩 한 두 번 만들어봤던 프레젠테이션 작성과 발표를 매주 2번 정도씩 발표 혹은 제출해야 된다는 사실을 알게 되었다. 그야말로 1주차 초반에는 정말 매일 매일 혼란의 연속이었다. 첫 발표는 수요세미나 시간에 했었던 “자기소개” 였다. 첫 발표라 많이 긴장도 많이 됐지만 그것보다도 앞으로의 발표를 위해서 정말 많이 연습하고 준비해야겠다는 생각이 앞섰다. 이후 성격 검사, 사내 예절, 농림수산검역검사본부 세미나 보조 등 그렇게 첫 1주는 정신 없이 지나갔다. 사실상 4주라는 기간 동안 생물정보 분석 프로그램을 완전히 익히는 것은 어렵기 때문에 2주차에는 당뇨에 대한 Case study를 실습해보기로 하였고 3주차에는 인플루엔자 바이러스에 대한 Case study를 실습하기로 하였다. 그리고 마지막 4주차에는 NGS 분석기능이 추가된 CLC Genomics workbench에 대해서 공부를 하기로 하였다.

[2주차]
2주차에는 본격적으로 인실리코젠의 생물정보 분석 메인 툴 중 하나인 CLC Main Workbench에 대해서 공부를 하였다. 처음인지라 CLC Main workbench를 다루는 것 자체가 서툴고 어떠한 기능을 언제 활용 해야 될 지도 감이 안 왔지만, 김경윤 주임님과 송하나 선배님을 비롯, 다른 인턴분들에게 조언을 구하면서 Case study를 실습한 끝에 어느정도 전반적인 내용은 이해할 수 있었다. 처음에는 어려웠지만 Case study를 통해 실습을 해보면서 한 가지 실험을 다루면서, Main workbench에 대한 기능도 통합적으로 공부할 수 있어서 정말 효과적이었다고 생각한다. 학교 전공과목 시간에 이론적으로 배웠던 SNP, BLAST 등의 내용을 실제로 프로그램을 이용하여 실습하고 관련 내용을 찾아서 공부해나가다 보니 정말 내 자신에게 큰 도움이 되었다. 실습도 점점 익숙해 졌을 뿐 아니라 첫 주와는 달리 회사 분위기도 빠르게 적응이 되었다. 한 분 한 분 모두들 정말 친절하시고 열정을 가지고 일하시는 모습이 인상 깊었다. 비록 금요일에 발표는 만족스럽지 못했지만 어느 정도 Main workbench에 대해서도, 인실리코젠에 대해서도 감을 익힐 수 있었던 한 주였다.

[3주차]
어느덧 人Co Internship 프로그램에 참여한 지도 3주차, 벌써 절반이 지났다. 이번 주에 다루게 될 CLC Main Workbench의 2번째 Case study는 인플루엔자 바이러스에 대한 연관성을 분석하는 내용이었다. 몇 해전 전세계적으로 큰 이슈였던 조류 독감, H5N1 인플루엔자 바이러스들의 지역별, 종별 연관성을 비교하는 실습을 하였다. 뿐만 아니라 유사 질병인 뉴캐슬 병과의 차이점도 CLC Main Workbench를 이용하여 손쉽게 비교할 수 있다는 사실에 정말 신기했다. 처음 CLC Main Workbench를 이용할 때는 마냥 어려운 프로그램이라고만 생각했었는데 어느 정도 익숙해지니 정말 생물정보 분석을 하는데 유용한 툴이라는 생각이 들었다. 중간 중간에 틈틈이 최남우 대표이사님, 임천안 이사님, 박준형 부장님과 면담을 가졌는데 내 자신의 현재를 다시 한번 되돌아 보고 반성할 수 있었던 좋은 기회였다. 뿐만 아니라 아직은 불확실한 진로에 대해서도 좀 더 많이 고민하고 방향을 잡아나가야겠다는 생각이 들었다. 금요일 발표와 함께 그렇게 인턴십의 3주차도 지나갔다.

[4주차]
벌써 인턴십의 마지막 주가 되었다. 지난주부터 틈틈이 공부해온 NGS에 대한 배경지식을 CLC Genomics workbench를 이용하여 인턴분들 각각에게 주어진 다른 주제를 다뤄보았다. 나는 Epigenomics와 ChIP-chip/ChIP Seq 두 가지 분석 방식을 알아보고 실제로 예제 데이터를 이용하여 ChIP Seq 분석을 해보았다. 기존의 Main workbench에 NGS 데이터 분석 기능이 추가되었기 때문에 이해하는데도 좀 더 어려웠지만 많은 분들의 도움을 받아 무사히 프로젝트를 수행하고 발표를 마쳤다.

[2013년 2월 1일 (금)]
오늘은 드디어 人Co Internship의 마지막 날이다. 오전에는 그동안 4주간의 인턴십 활동을 집약하여 만든 프레젠테이션을 토대로 최종평가 발표 시간을 가졌다. 최남우 대표이사님과 임천안 이사님, 정은미 이사님, 김경윤 주임님 그리고 이지혜 주임님께서 평가관으로 참석하셨는데 너무 떨리고 긴장됐다. 나머지 세 분의 인턴분들의 발표까지 다 끝난 이후 대표이사님께서 여러 가지 조언과 함께 인실리코젠의 경영 철학인 人Co에 대해서 다시 한번 말씀하셨는데 다시 한번 이번 인턴십 기간 동안 배우 많은 것들의 의미를 되새길 수 있었다. 오후에는 수료식을 가졌는데 4주라는 기간, 총 160시간 동안의 人Co Internship 동안 직접 경험한 모든 순간 순간들이 새록 새록 기억나는 순간이었다. 인턴십 기간 동안 매일 작성해온 OJT 위키 페이지에 랜덤으로 나오는 글귀 중 이런 글귀가 있다.

“엘리자가 말했어요. 세상은 생각대로 되지 않는다고. 하지만 생각대로 되지 않는다는 건 정말 멋지네요. 생각지도 못한 일이 일어나니까요."
그렇다. 항상 무언가를 준비하고 직접 실천하는 데 있어서 나 자신의 생각대로 완벽하게 되는 것은 없다. 하지만 그렇기 때문에 보다 많은 것을 경험하고 배울 수 있으며 다시 한번 자신에 대해서 되돌아 볼 수 있는 여유를 가질 수 있는 것이 아닐까? 나는 이번 人Co Internship을 통해서 다시 한번 내 자신의 부족한 점이 무엇이고 앞으로 보완해 나가야겠다는 생각이 들었는데 이것만으로도 나는 인실리코젠에서 귀중한 경험을 했다고 생각하고 앞으로도 잊지 못할 것이다.



사용자 삽입 이미지

유승일

Insilicogenist로 지낸 1월

(주)인실리코젠에 대한 첫 기억은 2010년 말 송하나 선배님이 취직했다는 소식을 접했을 때 였습니다. 그 이후엔 졸업생 선배들의 입에서 저희 회사에 대한 얘기를 은연 중 들었던 기억도 있습니다. 그렇게 한두 번 회사명을 접하다보니 '회사명 정말 좋다.' 라는 생각을 하게 되었습니다. in silico + gen(e), 누가 들어도 생물정보회사였습니다.
석사 졸업을 앞 둔 시점에서 첫 직장에 대한 고민을 하게 되었습니다. 항상 '첫 직장은 중요하다.'라는 말을 들어왔기 때문인지 그 어느 때보다 신중했던 것 같습니다. 선택을 하게 된 큰 이유는 주변 지인들의 자자한 칭찬이 있었기 때문입니다. 사내 분위기도 좋고, Culture Day를 통해 단합을 다지는, 사람이 중심인 회사라는 칭찬이 그것이었습니다. 하지만 제 선택의 주요인은 회사 홈페이지를 봤을 때 부터 마음이 이미 넘어와 있었습니다. 그리곤 人Co Internship의 문을 두드렸습니다.
7일부터 8일 이틀간은 인코인턴십 프로그램의 소개와 저희 회사에서 개발한 LabKM을 기반으로 한 Wiki의 사용법, 그리고 人Co 브랜드 가치 소개, 사내 생활에서의 예절, 안전보안교육 등 회사생활에 필요한 다양하고도 기초적인 교육을 받은 시간이었습니다. 이 시간 동안 명함을 주고받아 보기도하고 제 성격이 어떠한 유형인지 알아 본 시간이 되었습니다. 많은 교육들 중에 제 머리 속에 딱 박히는 단어가 있었습니다. 바로 정은미 이사님께서 말씀해주신 Plan Do See 의 생활화 입니다. 이사님께서는 회사를 다니시면서 박사학위과정을 밟으셨는데, 그때 일을 말씀해주시면서 Plan Do See 라는 말씀을 해주셨습니다. 이 방법은 제가 그 동안 해왔었던 것들을 다시 한 번 돌아보는 계기가 되었습니다. 또한 이번 1월 한 달 동안 프로그램을 진행하면서 직접적인 큰 도움이 되었습니다.

그 다음 날인 9일에는 가장 떨렸었던 첫 발표인 자기소개가 있었던 날입니다. 수요세미나 때 진행되었기 때문에 스카이프를 통해 모든 직원분들에게 저에 대한 간략한 소개를 하는 시간이었습니다. 석사학위논문에 대해서도 말씀드리기도 했지만, 저의 포부를 보여드리기 위해 ‘하나로 잇는 유승일’, ‘유승일-INSILICOGEN=0'이라는 멘트를 준비했었습니다. 발표 당시에는 당차게 발표했었는데 지금 생각하면 얼마나 손발이 오글거리는지 모릅니다.
본격적인 일정이 시작되었던 10일에서 23일에는 CLC Main Workbench에 대해서 공부했습니다. 당뇨와 조류 인플루엔자, 총 2가지 케이스에 대해 매뉴얼을 참고하며 Main Workbench를 익히는 시간이 되었습니다. 당뇨병 케이스 스터디에서는 SNP가 당뇨병에 어떻게 연관을 보이는지에 대해서 공부했습니다. SNP에 의해 단백질의 구조가 바뀌면 그 기능도 변하기 때문에 Main Workbench를 통해 당뇨병을 유전적인 레벨에서 공부하는 계기가 되었습니다. 두번째 케이스로 조류 인플루엔자에 대해서 공부했었습니다. 조류 인플루엔자는 바이러스가 원인인데 고 병원성 바이러스에 걸리면 엄청난 전염성으로 인해 막대한 경제적 손실을 가져옵니다. 때문에 공부를 하면서 고 병원성과 저 병원성의 염기서열의 차이를 밝히면 재밌겠다는 아이디어가 떠올랐지만, 논문 검색을 해본 결과 아쉽게도 다른 사람이 먼저 연구한 것이 확인되었습니다. 어쩔 수 없이 그 논문의 내용을 가지고 cleavage site에서 고 병원성과 저 병원성의 서열 차이를 Main Workbench를 사용하여 확인했습니다.
24일부터 30일에는 Main Workbench를 마치고 Genomics Workbench를 공부하였습니다. NGS 데이터를 활용한 Genomics Workbench의 다양한 활용 중에 저는 Expression Analysis를 공부했고 분석을위해 RNA-Seq을 Genomics Workbench를 통해 수행했습니다. 분석을 공부하면서 느꼈던 것은 효율적인 시퀀싱 컨설팅 진행을 위해서는 실험 방법이나 과정을 제대로 이해하는 것부터 시작되어야 하고, 유전학적 지식을 바탕으로 대용량 시퀀싱 데이터를 효율적으로 활용할 수 있는 기반이 체계적으로 구축되어야 한다고 생각했습니다. 프로그램의 자동성과 스크립트를 통한 유연성을 골고루 갖추는 것이 좋을 것 같았습니다.
중간 중간 독서경영과 추가적인 업무들을 포함해 Genomics Workbench를 마지막으로 1월 한 달의 모든 과정이 끝났습니다. 그 한 달 동안 저는 39번의 지하철과 78번의 버스, 그리고 78번의 환승, 2666.43km의 이동 그리고 97시간 30분의 출퇴근 이라는 기록 데이터를 만들어냈습니다. 이 기록은 계속 이어질 테지만 단순히 이어지는 것이 아닌 이 기록을 밟고 더 나아가야 할 것은 프로페셔널단계입니다. 프로가 되고 싶다. 이것이 제가 한달 동안 人Co Internship을 하면서 가장 크게 느낀 점입니다.
사용자 삽입 이미지
한 달 동안 진행된 人Co Internship은 제 인생에 특별한 의미가 있는 달이었습니다. 제 인생에 있어서 화이트 칼라(White Collar)로써 처음으로 출근을 경험한 의미 있는 달이고, 진정한 아침형 인간으로 환골탈태한 달이기도 합니다. 그리고 저만의 아날로그 식 메모가 유원기 주임님 덕분에 스마트한 메모로 탈바꿈하기도 했습니다. 그리고 부족한 부분이 무엇이고, 어떻게 채워 나가야하는지 나름의 방향을 잡는 계기가 되었고, 인실리코젠이 컨설팅전문회사로써 어떤 업무를 하는지 100%는 아니지만 어느 정도 알게되었습니다. 1월의 人Co Internship은 끝이 났습니다. 하지만 앞으로 2월의 人Co Internship 그리고 앞으로 차근차근 계획하고 실천하고 평가하면서 제 역량들을 쌓아갈 것입니다. 마지막으로 좋은 기회를 주신 사장님과 직접 실천으로 가르침을 주신 모든 분들께 감사드립니다.





Posted by 人Co

2013/02/28 17:02 2013/02/28 17:02
Response
No Trackback , No Comment
RSS :
https://post-blog.insilicogen.com/blog/rss/response/127



« Previous : 1 : 2 : 3 : 4 : 5 : 6 : 7 : 8 : 9 : ... 10 : Next »