« Previous : 1 : 2 : 3 : 4 : 5 : 6 : Next »

人Co Internship 2013을 마치며-


지난 1월 7일부터 한달여간 (주)인실리코젠의 생물정보 인재양성 프로그램인
人Co INTERNSHIP 프로그램이 진행되었습니다. 국내 기업과 연구기관에서 요구하는 최신의 생물정보 솔루션과 기초 기술교육 및 사내 현장실습을 통해 바이오 연구개발과 조직 생활의 기초 개념을 이해할 수 있는 좋은 기회를 제공하는데 목적을 둔 본 프로그램에 앞으로도 생물정보인재로 성장하고자 하는 많은 분들의 관심과 참여 바랍니다.
수료하신 네 분 모두 축하드리며, 소감을 한 번 들어볼까요?

사용자 삽입 이미지

강전모

2013 人Co Internship에 참여한 강전모입니다. 전 이번 2013년 새해를 인실리코젠과 함께 시작하였습니다.
지금 영남대학교 생명공학과에 재학 중에 있지만 생명공학 전공임에도 불구하고 전공 관련 기업 등에 대해서는 잘 알고 있지 않았습니다. 그러던 중 동기생인 명희선배의 취업소식을 통해 '인실리코젠' 이라는 회사를 처음 알게 되었고, 이 후, 학교에서 열리는 학회에서 박준형 부장님의 발표도 보고, 강의시간에 정명희 선배의 회사 소개를 들으면서 인실리코젠에 대해서 알게 되었습니다.
이렇게 알게 된 인실리코젠에 대한 첫 이미지는 빼어난 디자인이었습니다. 아직 잘 알지 못했었지만 다른 곳과 다르게 딱딱하지 않은 홈페이지와 블로그는 부담 없이 알아갈 수 있도록 도와주었습니다. 호감을 가지고 둘러보던 중 인실리코젠의 기업가치인 人Co ‘사람(人)을 중심(Core)으로 컴퓨터(Computer)를 통해 배려(Consideration)하고 소통(Communication)한다.’ 를 보고 감동 받았었습니다. 또 제가 관심이 있는 컴퓨터를 이용하고, 사람이 중심이라는 말을 통해 호감은 관심으로 이어졌습니다. 이 관심은 저에게 경험을 위해 한 발짝 내딛을 수 있는 용기를 주었고 이를 계기로 이번 12월 학교 홈페이지를 통해 알게 된 ‘인턴십 지원자 모집’ 과 교수님의 추천으로 이번 인턴십에 지원하여 참여할 수 있게 되었습니다.

1월7일 떨리는 마음으로 인실리코젠에 출근한 첫날, 자리와 노트북을 배정받고 회사 업무에 필요한 skype나 wiki 사용법, 회사 소개 등을 받으며 인턴십을 시작하였습니다. 무엇보다 송하나 선배가 직원 한분 한분을 소개시켜주시는데 반갑게 맞이해주시며 정중하게 명함을 건네주시던 그 모습이 정말 인상 깊었습니다. 첫 주의 수요세미나를 통해 각자 자기소개 발표를 하며 정식으로 직원 분들께 인사를 드렸는데, 발표 전 까지는 괜찮았지만 발표를 시작하는 순간 너무 떨리는 바람에 어떻게 발표했는지 기억도 안날 정도였습니다. 1주차 중반에 접어들면서 CLC Main Workbench에 대해 배우기 시작했습니다. 수요세미나 후 농림수산검역검사본부에 CLC Main workbench 강의지원을 나가서 책자와 볼펜, 설문지도 나눠드리고, 쉬는 시간을 위한 다과도 준비하며 강의 준비를 도와드렸고, 앞으로 익혀나가야 할 CLC Main Workbench에 대한 강의도 들었습니다. 생각 외로 많은 분들이 모이셨고, 단상에 서서 강의하는 김경윤 주임님과 송하나 선배를 보면서 왠지 모를 뿌듯함과 자신감이 생기는 것 같았습니다. 강의를 들으면서 대략적인 CLC Main Workbench 사용법을 배웠고 이를 바탕으로 CLC Main Workbench overview를 발표 자료를 만들면서 tool사용법을 숙지하였습니다. overview발표 후 CLC Main Workbench를 이용해 당뇨병과 인플루엔자에 관한 두 가지 case study를 실습하였습니다.

당뇨병에 관한 주제는 '사람의 당뇨병에 연관된 유전적 변이 확인'으로, 사람과 유사한 점이 많은 돼지의 유전체내 당뇨병 관련 위치에서의 서열 다형성을 CLC Main Workbench를 사용하여 분석하는 것이었습니다. CLC Main Workbench에 있는 NCBI 검색기능으로 당뇨병관련 유전자인 UCP유전자를 찾고, 이 유전자를 BLAST하여 상동성을 가진 돼지 및 다른 개체 5종의 서열을 다운받아 Alignment를 수행한 후 나머지 종들과 비교하면서 돼지와 사람에서 SNP로 의심되는 지역을 annotation 하였습니다. 이 후, NCBI SNP DB에 올라와있는 SNP를 비교해 실제 SNP가 존재하는 지역을 찾고 이를 포함하는 유전자 서열을 클로닝하기 위한 primer도 제작해보고, 임의로 선택한 증폭구간의 서열에서 SNP가 바뀌어서 아미노산 서열이 바뀌는 지를 translation tool을 이용해 비교해보았습니다. 두번째는 인플루엔자에 관해 '높은 발병률의 조류독감 바이러스의 유전적 특성'을 주제로 case study를 진행하였고 당뇨병의 case study와 비슷한 방법으로 수행하였습니다. CLC Main Workbench를 이용한 DB search를 통해 각 type 별 인플루엔자 서열을 받아 Alignment를 수행하고, 이를 통해 type간의 서열차이를 확인하고 BLAST를 이용해 각 type별 인플루엔자의 상동성을 조사하였습니다. 이 과정에서 각 인플루엔자 간에 동일하게 일치하는 지역을 확인하였고, 이는 인플루엔자 연구에서 primer 제작 등에 사용될 수 있을 것이라는 생각도 하게 되었습니다. 마지막으로는 phylogenetic tree 그려 봄으로 인플루엔자 바이러스가 지역별로 분화한다는 특징도 확인하였습니다. 이 두 case study에 대한 발표준비를 하면서 인턴십에 참여하지 않았다면 알 수 없는 CLC Main Wrokbench라는 프로그램을 알게 되었고, CLC Main Workbench가 실험이나 연구에 얼마나 많은 도움을 줄 수 있는지도 몸소 체험하는 계기가 되었습니다.

이후, Genomics Workbenh에 대해 김경윤 주임님의 설명을 듣고 Main Workbench처럼 그룹스터디가 아니라 개별 스터디로 발표 주제를 각각 배정받고 실습했습니다. 학교에서 수업으로만 들었던 NGS 데이터를 이용해 assembly를 실습할 수 있었는데, assembly에 관한 알고리즘이나 각 NGS file format에 맞는 옵션설정과 assembly를 수행하기 위한 parameter설정 등의 절차를 알게 되면서 학교에서는 미처 배우지 못했던 것을 알게 되는 계기가 되었습니다.

인턴십 시작할 때 책을 한권씩 나눠 주셨습니다. '사원의 마음가짐'이라는 책이었는데 회사에 실습하면서 책을 읽게 될 줄은 예상 밖이었습니다. 예전엔 서점에서 책도 구매하여 읽고, 좋아하는 작가도 있었으며 책 읽는 것을 좋아했는데 지금은 거의 읽어본 적이 없어서 내심 반성하는 기회도 되었습니다. 이 책을 읽고 난 후, 지금 가장 크게 와 닿았던 문구가 있습니다. '백문이 불여일험' '백번 듣는 것 보다 한번 경험하는 것이 더 좋다.' 라는 뜻입니다. 4주 동안 CLC Main Workbench와 Genomics Workbench를 배우고 실습하면서 사실 종종 의문점도 들었었습니다. 인턴십 과정 이기는 하지만 회사의 업무를 배워 간단한 일이나마 도와드린다는 생각보단 회사에게 일방적으로 배우기만 하는 과정이 더 컸기 때문입니다. 하지만 점점 발표준비를 하고 사장님과 이사님 그리고 부장님, 주임님의 면담과 직원 분들이 일하시는 모습을 보고 그냥 지나가는 인턴십 과정이 아니라는 것을 깨달았습니다. 더 좋은 솔루션을 만들고, 좋은 프로그램을 다른 사람들에게 제공하기 위해서는 자신도 프로그램에 대해서 잘 알고 있어야하며, 사용하면서 생긴 여러 가지 문제점들과 의문점을 해결해 줄 수 있어야 하기 때문입니다. 또한 이러한 과정을 통해 자신 스스로가 성장하고 이 성장이 회사가 성장하는 계기가 되는 것처럼 하루하루가 그냥 지나가는 것이 아니라 경험이고, 이 경험들이 쌓이면 능력이 된다는 것을 최근에서야 깨달았습니다. 이 뜻을 이해했을 때 인턴십 프로그램에 참여하길 정말 잘했다는 생각이 들었습니다.

또 이번 인턴십에 참여하게 되어 저의 시야를 조금 더 넓힐 수 있게 된 것 같습니다. 사실 생물정보학 분야가 이렇게 넓고 다양할 줄은 생각하지 못했었습니다. 생물정보분석과 실험은 별개라고 구분했던 편견이 깨어졌고 물론 많은 고민이 생기긴 했지만, 저에게 부족한 점이 무엇인지, 무엇을 해야 할지 등의 제가 가야할 길의 갈피를 잡아주었습니다. 아직 1년의 시간이 남은 만큼 조금 더 고민하고, 노력한다면 1년 후에는 더욱 성숙해져있는 저를 볼 수 있을 것 같습니다. 4주간의 人Co Internship을 통해 많은 가르침을 주신 사장님 및 직원 분들에게 감사의 인사를 드립니다.

사용자 삽입 이미지

김정민

4주간 인실리코젠과 저와의 인사

지금(2013년 2월 1일)으로부터 약 2달 전 교수님께서 전화가 오셨습니다. “정민아, 이번에 인실리코젠에서 여름때 못갔던 인턴십을 다시 하니까 갈 수 있지?, 가서 많이 배워왔으면 좋겠다.” 라고 하신 것이 이곳 인실리코젠과의 대면을 위한 교수님의 배려이자 저에게는 첫 걸음마였습니다. 그 후 1달 뒤 처음 수원에 올라올 때, 네비게이션의 목적지가 인실리코젠이 있는 벤처밸리여서 일생 처음 수원에 올라와서 첫발을 내딛은 곳도 ‘회사 바로 앞’이었습니다. 그날따라 날이 춥고 먼 길을 오느라 피곤했지만 낯선 이곳이 신기했고 빨리 회사에 들어가서 회사분들을 뵙고 싶다는 생각을 했습니다. 하 지만 어느 곳이나 마찬가지듯이 낯선 곳은 두렵고, 어색하기 마련이고 여기서 처음 또한 그러했지만, 人co core라는 말과 걸맞게 사람을 가장 먼저로 여기고 소중히 생각하는 이곳의 선배님들께서 너무 자상하게 대해주셔서 적응하는데 큰 힘이 들지 않았습니다.

첫 날, 둘째날에 걸쳐 많은 분들께서 명함을 주시며 특히 정은미 이사님께서 “명함을 대할 때 우리는 그 사람을 대하듯이 소중하게 대한다.”라 말씀하시며 그 분들에게 얼굴이 되어주는 인실리코젠 특유의 디자인이 되어있는 명함을 소중히 받는 시간을 가졌습니다. 실제로 모 교수님을 뵐때 명함을 받으시는 모습을 볼 수 있었는데 받으신 이후에 명함을 대하는 모습을 유심히 보았습니다. 그 결과 저는 명함은 그 사람을 대면할 때 절대로 함부로 하지않고 소중히 앞 테이블에 놓아서 이야기를 나누신다고 우리에게 교육하신 그대로 몸소 실천하고 계심을 보고 진심으로 감명을 받았습니다. 다른 곳에서는 명함같이 작은 것 하나까지 소중히 여기시는 분들을 볼 수가 없었는데 그런 모습을 보면서 또 한번 ‘정말 나는 인턴십을 온 것이 아니라 “人Co” 인턴십에 와있는구나.’ 라는 생각을 하게 되었습니다. 임천안 이사님께서 우리에게 보안각서 등을 주시며 그 순간까지도 깨알같은 조언이나 인생에 있어서 필요한 충고를 아끼지 않으셨습니다.

이 곳에서 가장 기억에 남는 것들 중 하나가 발표하는 것들에 대한 역량을 늘리기 위해서 자주 발표를 하는 시간을 가졌는데 그 시작은 인턴쉽 3일차 되는 날에 가졌던 나에 대한 소개 발표였습니다. 그날의 기억이 아직도 생생한데 많이 긴장하고 떨렸지만 발표할 때에 이곳 분들이 편안하게 하라고 편안한 분위기를 자연스럽게 만들어 주신 대한 작은 배려가 저에게는 매우 큰 힘이 되어 무사히 마칠 수 있었습니다.

또한 우리가 3주가량에 걸쳐 배운 CLC main workbench, CLC genomics workbench라는 프로그램을 처음 접할 수 있게 농림수산검역검사본부에서 열린 세미나에 참석했는데 김경윤 주임님, 송하나 선배님께서 발표하시는 모습을 보게 회사에서 하루일정을 배려해 주셨습니다.

첫 주가 이렇게 마무리 되고 두 번째 주는 본격적으로 CLC main workbench를 이용해서 실습하고, 공부하는 시간을 가졌습니다. 처 음에는 매우 낯선 프로그램을 접함으로 인해 오는 스트레스와 압박감이 있었지만 사용을 하면 할수록 너무 편리하고 유익하고 어딜 가든지 회사의 일원은 아니지만 소개해주고 싶다고 생각이 드는 프로그램임을 깨달을 수 있었습니다. CLC main workbench를 이용하는 작업을 하면서 이곳에서는 직접적으로 하지는 않았지만 실험적인 측면이나, 기타 생물학적인 배경지식을 쌓는데 많은 도움이 되어 유익한 시간임을 또 한번 깨닫고 이곳에 와서 이렇게 교육을 받는다는 자체가 ‘알아가는 행복’임을 느꼈습니다. CLC genomics workbench를 할 때에는 조금 더 어려운 NGS를 이용한 mapping분석이며, 변이에 대해 분석-조사 했는데, 항상 경윤 주임님께서 “어려운 부분이 있으면 언제든지 와서 물어보고 또 부담감 가지지말고 공부하고 준비해서 아는 만큼 발표하자”고 우리를 위해 배려차원에서 말씀해주셔서 마음을 편히 가지고 공부할 때도 더 집중할 수 있게 되었고 발표 후 경윤 주임님의 설명을 통해 공부할 수 있는 질보다 더욱 심도있는 내용을 공부 하였습니다. 단언코 만일 저러한 프로그램이 필요한 실험실이나 회사가 있다면 돈을 주고 직원을 보내는 손해를 감수하면서도 여기서 교육을 통해 배울 충분한 가치가 있는 내용의 인턴십 프로그램이었습니다.

또한 사람을 먼저 생각하고 그 사람의 인성이나 하고자하는 성실감을 먼저 보며 그 사람의 부족한 점은 시간을 들여서 키운다는 신념아래 저희에게 나눠주신 지금은 고인이 되신 마쓰시타 고노스케씨의 사원의 마음가짐이라는 책을 읽으면서 회사의 일부분으로써 어떠한 마음가짐을 가져야하고 이곳에서 원하는가를 알 수 있었습니다.

다른곳의 인턴십을 체험해보지 못해서 잘은 모르겠습니다만, 이곳은 학교에 제출하는 우리의 임무임에도 불구하고 하나부터 열까지 꼼꼼하고 세세하게 다 신경써주셨던 이지혜 주임님과 모든 과정을 관료적이지 않고 ‘내가 정말 나에 대해서 알고 싶어하는 회사에 있구나’라는 생각이 들게끔 해주었던 모든 프로그램들은 이곳에 오고싶다고 하는 분들이나 관심을 가지고 있는 분들께는 지금이라도 당장 가보라 말씀드리고 싶습니다.

제가 다른 곳을 선택 할 수도 있었지만 교수님께서 “이곳은 가 보아야하는 곳이다”, 학교 선배이신 명희 선배님께서도 “나는 우리회사가 너무 만족스럽고 거기의 사람들이 너무 좋아서 일할 맛이 난다.”라는 말들을 듣고 택했는데 아주 탁월한 선택이었던 것 같습니다. 또 이곳에서는 멘토, 멘티라는 것이 있어서 지정해놓은 멘토에게 궁금한거나 힘든일이 있으면 자연스럽게 가서 여쭈어보고 맘을 터놓을 수 있게 해놓아서 너무 좋았습니다. 제 멘토는 Descign팀의 조아영 주임님이셨는데 1:1로 대화하기에는 너무 바빠보이셔서 그렇게 잘 하지는 못했지만 처음에 적응을 할 수 있게끔 교육때 편의도 봐주시고, 식사도 같이하면서 다른 분들보다는 조금 더 가까워 질 수 있게 해주셔서 감사했습니다. 보 통 무슨 일정이든 끝이나고 돌아갈 때는 더 잘할거라는 아쉬움과 끝이나서 홀가분한 마음이 들기 마련인데 4주교육을 마치고 돌아가는 순간에도 한주만 더 있어서 더 많은 것을 배우고 싶은 마음이 간절해서 제가 제 자신에게 놀래면서 대구로 돌아갑니다.

영리를 추구하는 회사에서 실적이나, 자신의 업무에 대한 책임은 어느곳에나 있듯이 이곳에서도 있겠지만 이곳은 ‘돌봄’이 있는 회사이고 배려가 있는 회사입니다. 높은 직급을 가지신 분께서 사원분들이나, 저희에게 작은 것 하나도 시키지 아니하시고 도와줄 수 있느냐고 말씀하시는 것이 이상적으로 말하는 소위 ‘수평적 관계’의 회사의 바람직한 모습을 보여주고 있지 않느냐 느껴짐을 얻었습니다. 이곳을 안 것은 앞으로의 Bioinformatics 분야로 가기를 마음먹은 저에게는 놓쳐서는 안될 큰 기회이자 행운이었던 것 같습니다. 끝 으로 우리 곁에서 있는 듯 없는 듯 지켜보아주신 최남우 사장님께서는 모든 직원분들의 으뜸되시는 CEO로서 존경 또한 한 몸에 받고 계신 듯 보여집니다. 많이 겪어 보지는 못했지만 말씀 하나 하나 하실 때 단어선택에도 신경을 쓰셔서 말씀을 하시고 한마디 한마디에 진심을 담아 나아갈 비젼을 저희에게 보이시고 우리의 생각을 물으시고 들어주심에 회사의 직원분들이 왜 이토록 친절하시고 배려가 많으신지 알 수가 있었습니다. 저는 이것을 끝으로 여기지 않습니다. 지금은 다시 학교로 돌아가지만 분명 회사에서 만족할 만한 인재가 되어 다시 이곳을 방문했을 때는 이렇게 아쉬운 마음으로 돌아가지 않을 것입니다. 그때가 너무 기다려지고 기대가 됩니다. 다시 한번 귀한시간 내어 저를 4주가량 맡아서 친절과 배려로 가르쳐주신 인실리코젠의 모든 직원분들에게 감사의 말씀을 짧게나마 드리면서 인실리코젠과 함께한 4주간 “人Co” 인턴십에 대한 후기를 맺겠습니다. 감사합니다!

사용자 삽입 이미지

김진규

[첫 만남 : 2013년 1월 6일 (일)]

人Co Internship의 첫 시작은 1월 7일 월요일이었지만, 내게 있어서 실제 인턴십의 시작은 1월 6일 일요일이었다. 수원 사무실에 8시까지 출근해야 된다는 사실을 알게 되었고, 평소 잠이 많은 나는 고민 끝에 4주 동안 수원 사무실 근처에서 살기로 마음 먹었다. 한 달간 일하게 될 인실리코젠 본사에도 미리 와보고 주변 고시원, 숙소들도 알아보았지만 마땅치 않았다. 게다가 6개월도 아닌 한 달 동안 살 방을 알아보는 것은 더욱이 어려웠고 수원역 주변은 이른 아침마다 출근하기엔 교통편에서 별 이점이 없어 보인다고 생각하여 지나가던 중 찜질방을 보게 되었고, 나는 1월 6일부터 2월 1일 한 달간 찜질방에서 살게 되었다. 사실 처음부터 찜질방 생활이 편했다고 할 순 없지만 약 4주가 된 지금은 정말 편하게 잘 지내고 있다. 다음 날 나는 인실리코젠에 처음으로 출근을 하게 되었다. 지문 등록, 위키 문법과 OJT작성, 사내 예절 교육, Skype 등 모든 것이 처음 접해보는 것이고 낯설었고 어려웠다. 다른 인턴 분들께서 먼저 와 계셨는데 당시는 정말 어색하고 긴장됬지만 한 주 한 주 같이 배우고 일하고 발표하면서 정말 큰 힘이 되었다. 만약에 다른 인턴분들이 없었다면 지난 4주 동안 어떡했을까 하는 생각이 든다.

[1주차]
첫 날 이후 인실리코젠 직원 분들을 익히는 것이 어려웠다. 그 이유는 직책이 너무 다양했기 때문이다! 이전에도 아르바이트 등을 해왔고, 군대에서도 금방 익혔는데… 선임님, 주임님, 책임님, 수석님….너무 헷갈렸던 기억이 난다. 뿐만 아니라 그 동안 가끔씩 한 두 번 만들어봤던 프레젠테이션 작성과 발표를 매주 2번 정도씩 발표 혹은 제출해야 된다는 사실을 알게 되었다. 그야말로 1주차 초반에는 정말 매일 매일 혼란의 연속이었다. 첫 발표는 수요세미나 시간에 했었던 “자기소개” 였다. 첫 발표라 많이 긴장도 많이 됐지만 그것보다도 앞으로의 발표를 위해서 정말 많이 연습하고 준비해야겠다는 생각이 앞섰다. 이후 성격 검사, 사내 예절, 농림수산검역검사본부 세미나 보조 등 그렇게 첫 1주는 정신 없이 지나갔다. 사실상 4주라는 기간 동안 생물정보 분석 프로그램을 완전히 익히는 것은 어렵기 때문에 2주차에는 당뇨에 대한 Case study를 실습해보기로 하였고 3주차에는 인플루엔자 바이러스에 대한 Case study를 실습하기로 하였다. 그리고 마지막 4주차에는 NGS 분석기능이 추가된 CLC Genomics workbench에 대해서 공부를 하기로 하였다.

[2주차]
2주차에는 본격적으로 인실리코젠의 생물정보 분석 메인 툴 중 하나인 CLC Main Workbench에 대해서 공부를 하였다. 처음인지라 CLC Main workbench를 다루는 것 자체가 서툴고 어떠한 기능을 언제 활용 해야 될 지도 감이 안 왔지만, 김경윤 주임님과 송하나 선배님을 비롯, 다른 인턴분들에게 조언을 구하면서 Case study를 실습한 끝에 어느정도 전반적인 내용은 이해할 수 있었다. 처음에는 어려웠지만 Case study를 통해 실습을 해보면서 한 가지 실험을 다루면서, Main workbench에 대한 기능도 통합적으로 공부할 수 있어서 정말 효과적이었다고 생각한다. 학교 전공과목 시간에 이론적으로 배웠던 SNP, BLAST 등의 내용을 실제로 프로그램을 이용하여 실습하고 관련 내용을 찾아서 공부해나가다 보니 정말 내 자신에게 큰 도움이 되었다. 실습도 점점 익숙해 졌을 뿐 아니라 첫 주와는 달리 회사 분위기도 빠르게 적응이 되었다. 한 분 한 분 모두들 정말 친절하시고 열정을 가지고 일하시는 모습이 인상 깊었다. 비록 금요일에 발표는 만족스럽지 못했지만 어느 정도 Main workbench에 대해서도, 인실리코젠에 대해서도 감을 익힐 수 있었던 한 주였다.

[3주차]
어느덧 人Co Internship 프로그램에 참여한 지도 3주차, 벌써 절반이 지났다. 이번 주에 다루게 될 CLC Main Workbench의 2번째 Case study는 인플루엔자 바이러스에 대한 연관성을 분석하는 내용이었다. 몇 해전 전세계적으로 큰 이슈였던 조류 독감, H5N1 인플루엔자 바이러스들의 지역별, 종별 연관성을 비교하는 실습을 하였다. 뿐만 아니라 유사 질병인 뉴캐슬 병과의 차이점도 CLC Main Workbench를 이용하여 손쉽게 비교할 수 있다는 사실에 정말 신기했다. 처음 CLC Main Workbench를 이용할 때는 마냥 어려운 프로그램이라고만 생각했었는데 어느 정도 익숙해지니 정말 생물정보 분석을 하는데 유용한 툴이라는 생각이 들었다. 중간 중간에 틈틈이 최남우 대표이사님, 임천안 이사님, 박준형 부장님과 면담을 가졌는데 내 자신의 현재를 다시 한번 되돌아 보고 반성할 수 있었던 좋은 기회였다. 뿐만 아니라 아직은 불확실한 진로에 대해서도 좀 더 많이 고민하고 방향을 잡아나가야겠다는 생각이 들었다. 금요일 발표와 함께 그렇게 인턴십의 3주차도 지나갔다.

[4주차]
벌써 인턴십의 마지막 주가 되었다. 지난주부터 틈틈이 공부해온 NGS에 대한 배경지식을 CLC Genomics workbench를 이용하여 인턴분들 각각에게 주어진 다른 주제를 다뤄보았다. 나는 Epigenomics와 ChIP-chip/ChIP Seq 두 가지 분석 방식을 알아보고 실제로 예제 데이터를 이용하여 ChIP Seq 분석을 해보았다. 기존의 Main workbench에 NGS 데이터 분석 기능이 추가되었기 때문에 이해하는데도 좀 더 어려웠지만 많은 분들의 도움을 받아 무사히 프로젝트를 수행하고 발표를 마쳤다.

[2013년 2월 1일 (금)]
오늘은 드디어 人Co Internship의 마지막 날이다. 오전에는 그동안 4주간의 인턴십 활동을 집약하여 만든 프레젠테이션을 토대로 최종평가 발표 시간을 가졌다. 최남우 대표이사님과 임천안 이사님, 정은미 이사님, 김경윤 주임님 그리고 이지혜 주임님께서 평가관으로 참석하셨는데 너무 떨리고 긴장됐다. 나머지 세 분의 인턴분들의 발표까지 다 끝난 이후 대표이사님께서 여러 가지 조언과 함께 인실리코젠의 경영 철학인 人Co에 대해서 다시 한번 말씀하셨는데 다시 한번 이번 인턴십 기간 동안 배우 많은 것들의 의미를 되새길 수 있었다. 오후에는 수료식을 가졌는데 4주라는 기간, 총 160시간 동안의 人Co Internship 동안 직접 경험한 모든 순간 순간들이 새록 새록 기억나는 순간이었다. 인턴십 기간 동안 매일 작성해온 OJT 위키 페이지에 랜덤으로 나오는 글귀 중 이런 글귀가 있다.

“엘리자가 말했어요. 세상은 생각대로 되지 않는다고. 하지만 생각대로 되지 않는다는 건 정말 멋지네요. 생각지도 못한 일이 일어나니까요."
그렇다. 항상 무언가를 준비하고 직접 실천하는 데 있어서 나 자신의 생각대로 완벽하게 되는 것은 없다. 하지만 그렇기 때문에 보다 많은 것을 경험하고 배울 수 있으며 다시 한번 자신에 대해서 되돌아 볼 수 있는 여유를 가질 수 있는 것이 아닐까? 나는 이번 人Co Internship을 통해서 다시 한번 내 자신의 부족한 점이 무엇이고 앞으로 보완해 나가야겠다는 생각이 들었는데 이것만으로도 나는 인실리코젠에서 귀중한 경험을 했다고 생각하고 앞으로도 잊지 못할 것이다.



사용자 삽입 이미지

유승일

Insilicogenist로 지낸 1월

(주)인실리코젠에 대한 첫 기억은 2010년 말 송하나 선배님이 취직했다는 소식을 접했을 때 였습니다. 그 이후엔 졸업생 선배들의 입에서 저희 회사에 대한 얘기를 은연 중 들었던 기억도 있습니다. 그렇게 한두 번 회사명을 접하다보니 '회사명 정말 좋다.' 라는 생각을 하게 되었습니다. in silico + gen(e), 누가 들어도 생물정보회사였습니다.
석사 졸업을 앞 둔 시점에서 첫 직장에 대한 고민을 하게 되었습니다. 항상 '첫 직장은 중요하다.'라는 말을 들어왔기 때문인지 그 어느 때보다 신중했던 것 같습니다. 선택을 하게 된 큰 이유는 주변 지인들의 자자한 칭찬이 있었기 때문입니다. 사내 분위기도 좋고, Culture Day를 통해 단합을 다지는, 사람이 중심인 회사라는 칭찬이 그것이었습니다. 하지만 제 선택의 주요인은 회사 홈페이지를 봤을 때 부터 마음이 이미 넘어와 있었습니다. 그리곤 人Co Internship의 문을 두드렸습니다.
7일부터 8일 이틀간은 인코인턴십 프로그램의 소개와 저희 회사에서 개발한 LabKM을 기반으로 한 Wiki의 사용법, 그리고 人Co 브랜드 가치 소개, 사내 생활에서의 예절, 안전보안교육 등 회사생활에 필요한 다양하고도 기초적인 교육을 받은 시간이었습니다. 이 시간 동안 명함을 주고받아 보기도하고 제 성격이 어떠한 유형인지 알아 본 시간이 되었습니다. 많은 교육들 중에 제 머리 속에 딱 박히는 단어가 있었습니다. 바로 정은미 이사님께서 말씀해주신 Plan Do See 의 생활화 입니다. 이사님께서는 회사를 다니시면서 박사학위과정을 밟으셨는데, 그때 일을 말씀해주시면서 Plan Do See 라는 말씀을 해주셨습니다. 이 방법은 제가 그 동안 해왔었던 것들을 다시 한 번 돌아보는 계기가 되었습니다. 또한 이번 1월 한 달 동안 프로그램을 진행하면서 직접적인 큰 도움이 되었습니다.

그 다음 날인 9일에는 가장 떨렸었던 첫 발표인 자기소개가 있었던 날입니다. 수요세미나 때 진행되었기 때문에 스카이프를 통해 모든 직원분들에게 저에 대한 간략한 소개를 하는 시간이었습니다. 석사학위논문에 대해서도 말씀드리기도 했지만, 저의 포부를 보여드리기 위해 ‘하나로 잇는 유승일’, ‘유승일-INSILICOGEN=0'이라는 멘트를 준비했었습니다. 발표 당시에는 당차게 발표했었는데 지금 생각하면 얼마나 손발이 오글거리는지 모릅니다.
본격적인 일정이 시작되었던 10일에서 23일에는 CLC Main Workbench에 대해서 공부했습니다. 당뇨와 조류 인플루엔자, 총 2가지 케이스에 대해 매뉴얼을 참고하며 Main Workbench를 익히는 시간이 되었습니다. 당뇨병 케이스 스터디에서는 SNP가 당뇨병에 어떻게 연관을 보이는지에 대해서 공부했습니다. SNP에 의해 단백질의 구조가 바뀌면 그 기능도 변하기 때문에 Main Workbench를 통해 당뇨병을 유전적인 레벨에서 공부하는 계기가 되었습니다. 두번째 케이스로 조류 인플루엔자에 대해서 공부했었습니다. 조류 인플루엔자는 바이러스가 원인인데 고 병원성 바이러스에 걸리면 엄청난 전염성으로 인해 막대한 경제적 손실을 가져옵니다. 때문에 공부를 하면서 고 병원성과 저 병원성의 염기서열의 차이를 밝히면 재밌겠다는 아이디어가 떠올랐지만, 논문 검색을 해본 결과 아쉽게도 다른 사람이 먼저 연구한 것이 확인되었습니다. 어쩔 수 없이 그 논문의 내용을 가지고 cleavage site에서 고 병원성과 저 병원성의 서열 차이를 Main Workbench를 사용하여 확인했습니다.
24일부터 30일에는 Main Workbench를 마치고 Genomics Workbench를 공부하였습니다. NGS 데이터를 활용한 Genomics Workbench의 다양한 활용 중에 저는 Expression Analysis를 공부했고 분석을위해 RNA-Seq을 Genomics Workbench를 통해 수행했습니다. 분석을 공부하면서 느꼈던 것은 효율적인 시퀀싱 컨설팅 진행을 위해서는 실험 방법이나 과정을 제대로 이해하는 것부터 시작되어야 하고, 유전학적 지식을 바탕으로 대용량 시퀀싱 데이터를 효율적으로 활용할 수 있는 기반이 체계적으로 구축되어야 한다고 생각했습니다. 프로그램의 자동성과 스크립트를 통한 유연성을 골고루 갖추는 것이 좋을 것 같았습니다.
중간 중간 독서경영과 추가적인 업무들을 포함해 Genomics Workbench를 마지막으로 1월 한 달의 모든 과정이 끝났습니다. 그 한 달 동안 저는 39번의 지하철과 78번의 버스, 그리고 78번의 환승, 2666.43km의 이동 그리고 97시간 30분의 출퇴근 이라는 기록 데이터를 만들어냈습니다. 이 기록은 계속 이어질 테지만 단순히 이어지는 것이 아닌 이 기록을 밟고 더 나아가야 할 것은 프로페셔널단계입니다. 프로가 되고 싶다. 이것이 제가 한달 동안 人Co Internship을 하면서 가장 크게 느낀 점입니다.
사용자 삽입 이미지
한 달 동안 진행된 人Co Internship은 제 인생에 특별한 의미가 있는 달이었습니다. 제 인생에 있어서 화이트 칼라(White Collar)로써 처음으로 출근을 경험한 의미 있는 달이고, 진정한 아침형 인간으로 환골탈태한 달이기도 합니다. 그리고 저만의 아날로그 식 메모가 유원기 주임님 덕분에 스마트한 메모로 탈바꿈하기도 했습니다. 그리고 부족한 부분이 무엇이고, 어떻게 채워 나가야하는지 나름의 방향을 잡는 계기가 되었고, 인실리코젠이 컨설팅전문회사로써 어떤 업무를 하는지 100%는 아니지만 어느 정도 알게되었습니다. 1월의 人Co Internship은 끝이 났습니다. 하지만 앞으로 2월의 人Co Internship 그리고 앞으로 차근차근 계획하고 실천하고 평가하면서 제 역량들을 쌓아갈 것입니다. 마지막으로 좋은 기회를 주신 사장님과 직접 실천으로 가르침을 주신 모든 분들께 감사드립니다.





Posted by 人Co

2013/02/28 17:02 2013/02/28 17:02
Response
No Trackback , No Comment
RSS :
https://post-blog.insilicogen.com/blog/rss/response/127



----------------------------------------------------------------------------------------
[모집분야]
1. 생물정보분석분야 경력 0명
2. 개발분야 경력 0명
3. 개발분야 신입 0명
4. 기획/사업관리분야 경력 0명

[분야별 지원요건]
1. 생물정보분석분야
   - 석사졸업이상, 경력3년 이상
   - 생물관련 전공자 중 생물정보 분석경력자
   - NGS 분석 경험우대, Python 경험자
   - 근무지 : 수원
2. 개발분야 (경력)
   - 공공기관 SI 프로젝트 경험 3년 이상(경력확인 가능한 서류 필요)
   - Java, JSP, Oracle, MySQL 사용 가능자
   - 전자정부프레임워크 개발 경험자
   - 시스템 엔지니어 경험자 우대
   - 생물정보 경험 및 관심자 우대
   - 근무지 : 수원 또는 대전지사
3. 개발분야 (신입)
   - Java, JSP 사용 가능자
   - 시스템 엔지니어 경험자 우대
   - 생물정보 경험 및 관심자 우대
   - 근무지 : 수원
4. 기획/사업관리분야
   - 경력3년 이상 또는 석사 졸업 이상
   - 정보통신 전공자 중 생물정보분석 경력자 우대
   - 데이터베이스 설계 경험 우대
   - 영어 독해, 작문 필수
   - 근무지 : 수원

[제출 서류]
입사지원서 : 당사양식 작성 후 제출 (파일명 : 이름_이력서.docx. 경력위주로 작성요망)



[제출 방법]
recruit@insilicogen.com으로 파일첨부하여 제출 (메일제목 : "[모집분야] 홍길동 지원" 제목으로 기재)

[채용 절차]
1. 1차 서류전형 : 2/4(월) ~ 2/28(목)
2. 2차 실무담당자 및 임원 면접(1차 통과자) : 3/8(금)
3. 최종합격자 통보일 : 3/15(금)
   * 상기 일정은 사정에 따라 변경될 수 있습니다.

[채용 형태] 
1. 경력 : 경력검증을 위한 계약직(3개월, 당사내규에 따른 연봉)입사 후 검증 통과자는 연봉협상을 통한 정규직 전환
2. 신입 : 인턴계약 6개월 후 검증 통과자는 정규직 전환(당사내규에 따른 연봉)

[근무환경]
1. 주5일 근무
2. 4대 보험, 단체보험
3. 퇴직연금
4. 성과급
5. 경조사 휴가 및 지원

[공통우대사항]
영어회화가능자, 운전 가능자

[기타]
- 해외 출장 결격사유 없는 자(필수)
- 남자의 경우 병역필 또는 면제자(필수)
- 제출된 서류는 일체 반환하지 않습니다.
- 채용 합격 및 입사 후에라도 입사지원서 및 제출서류 내용이 거짓으로 확인될 경우에는 합격 및 입사를 취소할 수 있습니다.
- 절차별 합격자는 E-mail/휴대전화를 통해 개별 안내해 드립니다.
- 문의사항은 메일로 문의해 주시기 바랍니다.(recruit@insilicogen.com)

Posted by 人Co

2013/02/04 08:53 2013/02/04 08:53
Response
No Trackback , No Comment
RSS :
https://post-blog.insilicogen.com/blog/rss/response/126

<출장정보>
 - 기간 : 2012.11.04 ~ 2012.11.10 (7일)
 - 지역 : BIOBASE사 인도지사 (Bangalore in India)



BIOBASE사는 그 동안 우리 회사에서 많은 고객분들에게 consulting과 분석을 진행해왔던 파트너사입니다 (http://www.insilicogen.com/wiki/BIOBASE/Introduction). 이미 잘 알려져 있는 것처럼 BIOBASE사는 TRANSFAC®, HGMD®, PROTEOME™ 등의 양적/질적으로 훌륭한 데이터베이스를 전문 curator들이 직접 구축할 뿐만 아니라, 최근에는 Genome Trax™와 ExPlain™과 같은 분석 서비스도 개발되어 생물정보학적 분석서비스를 선도하는 기업입니다.



BIOBASE사 본사는 독일의 Wolfenbuettel에 위치하고 있으며 1997년에 설립되어 지금까지 생명과학, 의약학 및 다양한 응용 분야 등의 사업에서 큰 기여를 해왔습니다. 이후 2006년에 Jesintha (BIOBASE사 인도지사장)와 Kantharuban (재정 및 행정 담당)이 인도 Bangalore에서 BIOBASE사 인도지사를 설립하여 독일 본사와 긴밀한 관계를 유지하면서 독자적인 curation service에 대한 체계를 확장해 나가고 있습니다. 모든 database의 curation이 인도지사에서 이뤄진다는 것을 알고 그런 모습을 직접 현장에서 알아보고자 이번에 박준형 부장님과 제가 그 곳을 다녀왔습니다.



본격 미팅을 하기 전에 우리가 묵는 호텔에 직접 찾아와주신 Jesintha 및 Javid (인사담당자)와 함께 점식 식사를 하면서 가벼운 대화를 했습니다. 작년에 Jesintha가 당사를 방문했을 때 정말 좋았다며 소중한 추억을 나눴고, 이후 시간에는 자세히 다룰 이슈 사항들에 대해서 이야기를 나누었습니다. 인도 전통 음식들은 사실 입에 많이 맞지는 않았지만, 다행히 호텔 레스토랑 위주로 식사를 해서 적정수준에서 인도의 음식문화를 경험할 수 있었습니다.



BIOBASE사 인도지사는 ORACLE이 위치한 동일한 건물을 사용하고 있으며 3층을 사용하고 있습니다.
 

예상했던 것보다 사무실이 상당히 넓었고, 직원들도 많았습니다. 책상이 넓으면서도 그 위에 기타 복잡한 행정서류가 없어서인지 전체적으로 깔끔한 느낌을 받았습니다. 직원들의 65% 정도는 여성일 정도로, 상대적으로 여직원들이 많은 편이었습니다. 사진에는 보이지 않지만, 논문을 보면서 자유롭게 의논하는 모습들이 마치 대학 연구실의 한 장면 같아 보였습니다. 중간에 있는 기둥에는 Growth의 단어 아래에 "The road to success is always under construction. It is necessary to always surpass oneself and this is a lifelong occupation." 문장이 기록되어 있었는데, 이 말이 어쩌면 curator들에게 가장 중요한 것들이란 생각이 들었습니다.
 


한창 curation 작업을 하시던 한 curator 팀원들과 함께 사진을 찍었습니다. 가운데 curator 분의 책상 한 켠에 보시면 논문이 쌓여있는 것이 보입니다. 이 분들은 대부분이 curator로서 업무 유형에 따라 PDF 파일을 화면을 통해 보는 분도 계셨고, 출력물로 curation 정보를 추출하는 분도 있었습니다.
 

먼저 양사간의 업무 특징과 비전에 대한 내용을 소개하는 시간을 가졌는데, 함께 대화를 하면 할수록 서로 간에 긴밀한 상호협력관계가 필요하다는 기대를 하게 되었습니다. 크게는 BIOBASE사의 Product와 Service를 구분하여 논의를 진행하였고, 이후 시간에 실무 담당자들의 발표를 통해서 구체적인 정보를 얻을 수 있었습니다.
 


HGMD®, Genome Trax™, PROTEOME™, TRANSFAC® 등의 전반적인 BIOBASE사 제품군에 대한 설명은 Dr. Karthick이 담당을 해줬고 (사진 위), ExPlain™에 대한 전반적인 설명은 Dr. Dinesh가 진행해줬습니다 (사진 아래). 그 동안 HGMD®와 TRANSFAC® 정도만 주로 알았던 저에게 Genome Trax™와 ExPlain™ 에 대한 설명을 듣는 시간이 매우 흥미로웠습니다. 모든 세미나는 자유롭게 토론하는 방식으로 진행하다보니 무수한 질문과 응답이 교차하면서 1시 30분 - 2시간 동안 모든 세미나가 진행되었습니다. (아래는 발표를 내용 중에서 주요 내용만 다룬 것으로 자세한 내용은 BIOBASE사 홈페이지를 참조바랍니다.)
  • 연구자가 발견한 disease mutation이 진짜인지 아닌지를 구별하고 싶을 때는 방대한 참고문헌 리뷰를 통해 구축된 HGMD® 데이터베이스를 검색해보면 되며, 더 나아가 고급 검색기능을 통해 dbSNP filtering, 특정 position 또는 구간 내에 존재하는 mutation 검색, 특정 질병 및 미리 지정된 mutation 특성을 기반으로 한 mutation 검색 등이 가능합니다.

  • 더 나아가 Genome Trax™는 대단위로 동정된 mutation 중에서 연구자가 원하는 최적의 mutation을 결정하기 위한 약 30여개에 달하는 분석결과 정보를 제공하며, 그 외에도 dbNSFP를 이용하여 human non-synonymous SNP를 손쉽게 탐색이 가능하고, 어떤 결과에도 포함되지 않은 mutation이라면 novel variation이라고 충분히 판단할 수 있도록 돕는 웹기반 분석툴입니다.
  • TRANSFAC®은 gene regulation에 초점을 둔 데이터베이스이고, PROTEOME™은 단백질 발현 및 상호작용 등에 걸친 다양한 부분에 초점을 둔 것입니다.

  • ExPlain™은 TRANSFAC®과 PROTEOME™의 강력한 기능을 적용하여 target gene이 과발현하지 않더라도 promoter 분석과 pathway 분석을 통해 activated pathway와 그에 따른 key node를 분석할 수 있는 독자적인 분석 툴입니다.



사실 저희가 가장 궁금했던 내용은 Curation Pipeline에 대한 것이었는데, Proteome™ database 담당자 Dr. Geeta가 우리가 기대했던 만큼 방대한 내용을 세세하게 설명을 해주었습니다. 모든 curation은 reference pipeline, sequence pipeline, vocabulary pipeline, curation platform의 총 4개 부분으로 구성되어 있습니다.
  • Reference pipeline은 방대한 참고문헌을 통해 정보를 추출하고 수집하는 단계로서, partially automated process를 통해 전체 정보의 30%정도를 일정하게 수집하는 한편, manually searching papers 과정을 통해 나머지 70%의 정보를 축적합니다.
  • Sequence pipeline은 Sort, Merge, Nametag process와 같은 세부적인 3단계를 거쳐서 서열 정보를 중심으로 BIOBASE사 내부 데이터베이스와 연결된 다양한 데이터를 grouping하는 중요한 과정을 거치게 됩니다.
  • Vocabulary pipeline는 앞선 과정을 통해서 수집된 gene ontology, Mesh term, international vocabulary를 BIOBASE Knowledge Library (BKL)로 연결해 줍니다.
  • Curation platform는 ortholog 관계를 근거로 GOGNATE group으로 지정하고 가용한 모든 BIOBASE사 내부 데이터베이스 정보를 연결하게 됩니다.
위 의 단계별 작업을 통해 완성된 curation 데이터베이스는 quality check (QC) 정책을 통해서 3단계를 거쳐서 발생된 error를 수정할 수 있으며, quality assurance (QA) 제도를 통해 curation 작업의 질을 지속적으로 향상시키고 있다고 합니다. 이렇게 축적된 데이터베이스를 고객이 사용할 경우, 어떻게 결과를 보게 되는지 TP53 단백질을 사례로 보여줬습니다. 그 결과를 하나하나 따라가 보니 Introduction, Biomarker associations, Drug interactions, Mutant phenotype, Pathway & Interactions 등을 포함하여 현 시점에 수집할 수 있는 그 단백질과 관련된 모든 정보를 확인할 수 있었습니다. 더구나 참고문헌 정보까지 연결되어 있기 때문에 이 단백질에 대한 논문을 작성한다면 정말 편하게 작성할 수 있을 것 같았습니다.



Non-NGS based analysis에 대한 설명도 충분히 듣고 왔습니다. 다른 분들과 마찬가지로 담당자 Mittun은 고객의 실험 결과와는 별개로 독립적인 데이터베이스를 구축하는 전략과 방법에 대해 구체적으로 발표해 주셨습니다. 이와 관련된 Service 프로젝트로는 앞에서 언급한 것들 뿐만 아니라, compounds, lipids, metabolite 등도 포함되어 있었습니다. 수많은 curation service 중에서 놀라웠던 것은 Reaction kinetics curation이었습니다. Kinetics 정보를 추출하려면 참고문헌의 본문 뿐만 아니라, 그래프와 표에 제시된 데이터 수치를 curator가 직접 추출하는 과정을 거치며, 추출된 데이터를 Cell Illustrator에 적용하여 시뮬레이션도 가능하다고 합니다. 이 외에도 Drug curation, Protein kinase curation, Plant pathway curation, Nutrigenomics curation 등의 curation service를 통해서 이미 방대한 정보를 보유하고 있다고 합니다.



BIOBASE사는 고객에게 데이터를 파일로 직접 전달하기도 하지만, Cell Illustrator, Cell Designer, PIXEL 등의 소프트웨어를 이용하여 고객들이 좀더 효율적으로 simulation을 할 수 있도록 해줍니다. Cell Designer를 잘 이용하면 사용자가 원하는 biological map을 효율적으로 비교 및 분석이 가능하다고 합니다.



BIOBASE사의 product 및 service에 대한 모든 발표를 들은 후에, 본격적으로 Jesintha 및 Jyothi와 함께 마케팅 전략에 대해 깊이있는 의논을 했습니다.



당사에 관심이 많은 인도지사 실무자 팀장인 Dr. Dinesh와 Dr. Karthick은 자투리 시간에도 먼저 찾아와서 말을 걸 정도로 많은 관심을 표현했습니다. 처음에는 한국과 인도 간의 문화 차이에 대해서 가볍게 대화를 시작했지만, 점차 각 국의 연구환경, 각 회사의 비전에 대한 다양한 의견 공유까지 연결되어 1시간여동안 서서 대화를 나누었습니다.



많은 인종과 종교가 공존하는 인도이기에 다양한 축제가 있지만, 국가적인 명절로 손꼽히는 것은 힌두교 축제들입니다. 그 중에 하나인 Diwali를 기념함과 동시에 BIOBASE사에서는 결혼하는 직원들을 위한 이벤트를 마련해줬습니다. 예비부부의 서로 간의 퀴즈 맞추기는 우리나라에서도 몇 번 보았지만, 그림 그리기 게임은 처음 보는 것이어서 인도 사람들의 순수함을 엿볼 수 있어서 좋았습니다. 웃고 즐긴 후에는 결혼을 앞둔 직원들이 원하는 가전제품을 선물로 주는 훈훈한 모습도 보았답니다.



모든 행사의 마지막에 Jesintha 지사장님은 한국에서 온 (주)인실리코젠이 함께 비전에 대해 고민하고, 다양한 아이디어를 제공한 것에 대해 진심으로 고마움을 표시하시면서 방문한 저희들과 회사에 귀한 선물을 주셨습니다. 사실 관광하러 (차 많고 사람 많은) 인도 Bangalore를 또 가라고 한다면 정중히 거절하고 싶지만, BIOBASE사 인도지사에 가라고 한다면 다시 그곳에 가고 싶습니다. 자신들의 pipeline을 자신있게 설명해주는 그들과 그것을 모두 받아들이고 가고 싶다는 열정을 가지고 듣는 우리, 그렇게 함께 보낸 6일 동안의 여정은 모두가 하나가 되는 멋진 순간들의 연속이 아니었나 싶습니다. 그런 순간들이 밑바탕이 되어 생긴 신뢰가 다시 고객들에게 고스란히 돌아가는 날이 하루빨리 오기를 기대해 봅니다.

Codes 사업부 주임컨설턴트 유원기

Posted by 人Co

2013/01/18 14:22 2013/01/18 14:22
Response
No Trackback , No Comment
RSS :
https://post-blog.insilicogen.com/blog/rss/response/122

人Co Internship 2012 후기

人Co와 함께한 13주 (김경아)


처음 면접을 보기 위해 인실리코젠의 문을 열고 들어섰을 때, welcome과 제 이름이 적혀 있는 칠판이 저를 가장 먼저 반겨주었습니다. 이것을 보며 아주 작은 것 하나에도 신경을 써 주신 것 같아, 저에게 인실리코젠의 첫 이미지는 ‘따뜻함’으로 다가왔습니다. 그리고 7월2일, 인실리코젠에서 저의 인턴십 프로그램이 시작되었습니다. 첫날에는 자리, 모니터, 노트북을 배정받고 업무를 시작하기 위해 필요한 소프트웨어들을 설치하고 회사 분들과 인사를 나누고 명함을 받는 시간을 가졌습니다.
둘째날은 사내규범, 사회생활예절, 파워포인트 작성법에 대한 교육을 받고 다음날 아침 수요세미나시간에 발표할 자기소개를 준비하는 시간을 가졌습니다. 수요세미나는 아침 8시에 진행이 되었기 때문에 지쳐있는 회사사람들의 이목을 끌만한 무언가를 생각해내기 위해 열심히 머리를 굴렸습니다. 회사에서 하는 첫 발표였기 때문에 지금 생각해보면 가장 떨었던 발표였던 것 같습니다.

7월5일, 인턴프로그램일정이 시작되었고 제일 처음으로 접하게 된 부서는 Codes사업부였습니다. Codes사업부에서는 회사에서 주로 다루고 있는 분석 tool인 CLC Main Workbench와 CLC Genomics Workbench 그리고 NGS(Next Generation Sequencing)에 관한 것을 배웠습니다. 교육을 토대로 CLC Main Workbench, CLC Genomics Workbench의 사용방법과 한글 매뉴얼을 작성하고 발표하였고 NGS에 관한 PPT를 작성하였습니다. Codes사업부는 인턴 프로그램을 시작한지 얼마 되지 않았기 때문에 상대적으로 가장 많이 얼어있었고 처음 접하는 부분이 많아서 힘들었던 점이 많았습니다. 하지만 경윤주임님, 재영주임님, 하나선배님께서 중간 점검을 통해서 잘못된 방향으로 가고 있을 때에는 바로 잡아주시고 모르는 부분은 친절하고 최대한 쉽게 설명해 주셔서 과제를 무사히 마칠 수 있었습니다.

8월2일, 두 번째로 KM사업부에서의 인턴프로그램일정이 시작되었습니다. KM사업부에서 첫날 받은 일정표를 과연 내가 이것들을 모두 수행해 낼 수 있을까 하는 걱정이 가득해졌습니다. 하지만 저의 걱정과는 달리 KM사업부에서의 프로그램은 알아갈 수록 재미있었습니다.
Linux에 관한 교육을 담당하셨던 경표 선배님께서는 제가 아주 기본적인 내용을 몰라 질문을 하여도 항상 친절하게 이해가 갈 때까지 설명해 주셨습니다. CRM교육과 세금계산서 작성, 견적서 작성등과 같은 문서작성관련 교육을 담당해주신 선수선배님께서는 항상 꼼꼼하게 수행해야 할 과제들을 체크해 주셨고 과제를 수행하고 난 다음에는 개선되어야 할 부분을 체크해 주셨습니다. DBMS중의 하나인 MySQL에 관한 교육과 brassicarapa의 primer를 design하는 프로젝트를 담당해주신 성찬주임님께서는 다른 인턴분들과 함께 과제를 해결해나갈 수 있도록 잘 이끌어 주셨습니다. 덕분에 어색했던 인턴분들과 조금 더 친해질 수 있었던 계기가 될 수 있었습니다.

KM사업부에서 있으면서 CLC 세미나 지원을 나가게 되었습니다. 기념품을 나눠주고 질문타임에 마이크를 전달해주는 작은 역할을 맡았지만 직접 세미나가 진행되는 곳에 방문하고 경험해 볼 수 있어서 너무 좋았습니다. 회사에서 보던 주임님들이 많은 사람들 앞에 나가서 강연을 하고 또 그 강연을 사람들이 경청하는 모습을 보며 왠지 모를 뿌듯함이 느껴졌습니다. 함께 세미나 지원을 나갔던 Descign팀의 지혜주임님과 아영주임님은 기념품, 펜, 이젤 등과 같이 작은 부분도 꼼꼼하게 체크하고 준비를 하셨습니다. 그러한 모습을 보면서 주임님들의 프로페셔널함에는 다 이유가 있다는 것을 느낄 수 있었습니다.

8월30일, 세 번째로 Trac사업부에서의 인턴프로그램일정이 시작되었습니다. 평소 회사에서 자주 뵐 수 없었던 Trac사업부의 이부장님과 박선임님께서는 바쁜 일정에도 불구하고 아침 일찍 회사에 나오셔서 저희를 위해 교육을 해 주셨습니다. 이부장님께서는 이력추적시스템에 관한 교육을 해주시고 국내∙외 이력추적시스템에 관한 발표과제를 내주셨습니다. 발표를 할 때에도 편한 분위기를 조성해 주셨고 발표의 내용에 관한 질문을 하실 때에도 편하게 답을 할 수 있도록 도와주셨습니다. 박선임님께서는 WBS와 산출내역서 교육을 담당해주셨습니다. 이 부분은 인턴프로그램을 진행하면서 가장 이해하기 힘들었던 내용이었습니다. 하지만 교육을 해 주시면서 할 수 있다는 용기를 불어넣어 주셨습니다.
Trac사업부에서의 최종발표를 하면서 나의 노력은 터무니 없이 부족했다는 것을 느꼈습니다. 스스로 해답을 찾는 것 보다는 모르는 것은 물어보고 조언을 구하는 것이 더 중요하다는 사실을 다시 한번 가슴에 새길 수 있었습니다.

9월13일, Descign팀에서의 인턴프로그램일정이 시작되었고 이틀간 유전체학회에 지원을 나가게 되었습니다. 유전체학회에서 맡은 역할은 기념품과 브로셔를 나눠주고 최대한 많은 설문조사를 받아내는 것 이었습니다. 처음에는 사람들에게 우리회사를 소개하는데 버벅 거리고 당황을 하였지만 주임님과 선배님께서 회사 소개를 하시는 모습을 보고 따라 하다 보니 자연스럽게 회사를 소개 할 수 있게 되었습니다.
학회 둘째날, 강부장님의 런치세미나가 있었던 시간에 본격적으로 브로셔와 설문지를 돌렸습니다. 몇몇 분은 정성스럽게 설문조사에 참여하시고 직접 가져다 주시기 까지 하셨지만 대부분은 그대로 책상 위에 놔두고 가셔서 뿌린 만큼의 효과를 거두지 못해 아쉬웠습니다. 규모가 작은 학회였기 때문에 적은 인원이 참가하여 조금은 힘이 빠져 있었지만 열심히 잠재고객에게 회사소개를 하시는 조팀장님의 모습을 보며 다시 힘을 낼 수 있었습니다.



이렇게 이틀간의 유전체학회는 무사히 마무리 될 수 있었고 학회에서 받은 설문 조사결과를 분석하여 회사 신뢰도와 인지도를 나타내는 그래프를 작성하여 작년의 그래프와 비교해 보았습니다. 신뢰도와 인지도가 모두 하락했지만 작년과 비교 대상이 달랐고 많은 항목이 공백으로 채워져 있었기 때문에 이번 설문조사 결과에 큰 의미를 둘 필요는 없다고 생각하였습니다.

유전체학회에서 돌아와 Descign팀에서 수행한 과제는 유전체학회 참가보고서 작성, 창립기념일 기획보고서 작성, 워크샵 기획보고서 작성, CI&BI 수집하기, 회사홍보방안, 정보디자인하기였습니다. Descign팀에서 과제를 수행할 때에는 최대한 전형적인 틀에서 벗어나 새롭고 창의적인 내용을 담으려고 노력을 했습니다. 그 결과 창립기념일 기획보고서 아이디어에 관한 칭찬을 받아서 노력의 보람을 느낄 수 있었습니다. Descign팀에서는 가장 짧은 기간 동안 참여했기 때문에 아쉬운 감이 많았습니다.
13 주 동안 인실리코젠의 인턴십프로그램을 통해 총 4개의 사업부에서 많은 것을 체험하고 배울 수 있었습니다. 프로그램을 마치기까지 힘들어서 포기해버리고 싶은 적도 있었지만 꿋꿋하게 버텨왔습니다. 이렇게 버틸 수 있었던 가장 큰 힘은 바로 인실리코젠에 계시는 모든 분들의 따뜻한 말 한마디와 관심이었습니다. 단 하루도 쓸데 없이 시간을 보내지 않도록 좋은 프로그램을 구성하여 최대한 많은 것을 체험하고 느낄 수 있도록 해주셔서 13주 동안 많은 성장을 할 수 있었습니다. 가끔은 인턴십프로그램을 열심히 준비해준 분들에 비해 나의 노력이 부족한 것 같아 죄송스러울 때도 있었지만 항상 최선을 다하려고 노력을 다 하였습니다. 그리고 그 결과 지금과 같은 결실을 맺을 수 있었습니다.

이 글을 쓰면서 오랜 기간 함께 했던 모든 분들의 얼굴이 스쳐지나 갔습니다. 인실리코젠에서 인턴십프로그램을 참여한 순간이 제 인생에 있어서 가장 많이 배우고 느끼고 성장하며 자신을 객관적으로 바라 볼 수 있었던 시간이었던 것 같습니다.

With insilicogen (이제홍)


인실리코젠과 함께 한 3달이란 시간동안 즐거웠고 최선을 다했다고 생각합니다. 3달 동안 Codes 사업부, KM 사업부, Trac 사업부, Descign 팀을 거치며 다양한 교육을 받고 많은 일들을 수행하였습니다. 무엇보다도 人Co의 가치체계를 통해 사람과 사람 사이의 관계가 무엇보다 중요하다는 것을 느낄 수 있었습니다. 이러한 지식과 경험들은 앞으로도 잊어버리지 못 할 좋은 추억이 되었습니다.

Codes 사업부에서는 CLC Main Workbench와 CLC Genomics Workbench를 공부하는 것이었습니다. CLC Main Workbench는 분자생물학 데이터 분석 및 관리를 위한 통합 생물정보 분석 소프트웨어로 CLC Main Workbench에 NGS 데이터 분석기술을 추가한 것이 CLC Genomics Workbench입니다.



소프트웨어 교육과 함께 영문 manual 번역을 함께 진행 하였습니다. 가장 이해하기 쉽게 구성된 한글 manual을 만든다는 것이 생각보다 많이 어려웠습니다. 문제 해결 방법을 모르고 갈팡질팡 할 때 진행방향을 조언해 주시고, 간단한 업무들에 대해서는 직접 경험할 수 있는 기회를 만들어 주셔서 회사에 빨리 적응할 수 있었습니다. 짧은 기간이여서 소프트웨어의 세세한 부분까지 파악하지는 못하였지만, Workbench의 구성과 분석 설계의 흐름을 파악할 수 있었던 시간이였습니다.

KM 사업부에서는 처음 교육일정표를 받았을 때, 다양한 교육들이 빡빡하게 짜여져 있어 많은 긴장을 하였지만 협업을 하는 방법과 정확한 피드백을 통해 업무에 대한 부담감을 줄이고 즐거움을 느낄 수 있도록 많은 도움을 주셨습니다. 혈연관계를 가진 유전자 정보를 체계적으로 관리, 보존하기 위한 첨단 생물정보 시스템인 KinMatch와 생명과학 분야의 지식관리를 위한 Web 2.0 기술 서비스인 LabKM에 대하여 고객 제안용 ppt제작과 기업이 고객 관계를 관리해 나가는 방법인 CRM 교육을 통하여 업무를 진행하기 전에 고객의 다양한 상황을 생각하여 제안하는 목적을 생각하고 목적에 따른 주요사항을 정리하는 습관을 가지고 딱딱한 보고형태의 대화보다는 고객과의 소통을 통해 친근하게 다가가야 한다는 것을 알 수 있었습니다. 기초적인 Linux 사용법을 배우고 직접 Blast를 설치하고 구동해보았으며, DBMS인 MySQL을 이용하여 데이터베이스의 구조에 대하여 이해할 수 있었습니다. 또한 제안요청서, 제안서, 견적서, 세금계산서 등의 문서 작성 실습을 통하여 정확한 업무 전달이나 의사결정을 위해서는 문서가 올바르고 체계적으로 작성되어야 하며, 문서작성 및 관리하는 능력은 업무 활동에 중요한 역할을 한다고 느낄 수 있었습니다.

Trac 사업부에서는 프로젝트의 계획단계부터 종료단계까지의 업무를 세분화하여 분류하는 WBS(Work Breakdown Structure)와 계약금액을 구성하는 공종별목적물물량에 대한 계약단가를 기재하여 작성하는 산출내역서에 대하여 공부하고, 실습을 통하여 프로젝트의 착수부터 종료까지의 모든 과정을 총괄하는 PM의 역할을 수행해 보니 업무의 세분화를 떠나 고객의 요구사항을 정확히 판단 즉, 사람과 사람사이의 Communication이 얼마나 중요한가를 알게 되었고, 맡은 프로젝트를 무사히 마치게 되었을 때의 뿌듯함을 느낄 수 있었습니다.

Descign 팀에서는 기업을 고객의 마음속에 깊은 인상을 남기기 위한 중요한 작업인 브랜딩에 대한 교육과 워크샵과 창립기념일의 행사 기획안 작성을 통해 창의적인 마케팅 방법과 생각을 실천에 옮길 수 있는 방법들을 생각하는 시간이었습니다. 또한 9월 13~14일에 개최된 유전체학회에 참가하여 기업 이미지 설문조사를 실시하고 분석하는 과정을 통하여 기업의 발전방향에 대한 생각과 마케팅의 중요성에 대해서 배울 수 있었습니다.

인턴기간 동안 사원의 마음가짐, 경영의 마음가짐, 사업의 마음가짐, CEO 칭기스칸, 프리젠테이션 젠 총 5권의 독서경영도서를 읽고 많은 것을 느낄 수 있었으며, 특히 ‘사원의 마음가짐’이라는 책을 통하여 직장에서의 생활 방법과 올바른 마음가짐에 대해 생각하고 입사 초기의 마음을 잃지 않겠다는 다짐을 할 수 있는 계기가 되었습니다. 3 달간의 인턴십 기간 동안 많은 분들의 관심과 배려를 통하여 알찬 시간을 보낸 것 같고, 좀 더 적극적으로 많은 분들에게 다가가지 못했던 점이 아쉬움으로 남아서 고치려고 많이 노력하였습니다. 이번 인턴십의 3달이 인생에 있어서 빙산의 일각에 지나지 않겠지만, 빙산을 구성함에 있어서 많은 영향을 줄 것이라 생각합니다. 제 자신을 객관적으로 평가하고, 성장의 가능성을 만들어주신 모든 분에게 감사의 말씀 전합니다.

김경아, 이제홍

Posted by 人Co

2012/10/12 13:00 2012/10/12 13:00
,
Response
No Trackback , No Comment
RSS :
https://post-blog.insilicogen.com/blog/rss/response/119



CLC bio asia-pacific resellers meeting


CLC bio 에서는 매년 여름 아시아 지역의 distributor들이 모여 정보를 공유하고 협력 방안을 모색 할 수 있는 meeting을 주최해 왔습니다. 이번 Asia-pasific resellers meeting에는 한국과 대만, 일본, 중국, 말레이시아, 오스트레일리아의 distributor들과 덴마크의 CLC bio 본사의 책임자들이 함께하였습니다. 아시아 각국의 생물정보 시장을 선도하는 업체 담당자들과 만나 이야기를 나눠보니 모두 생물정보 분야의 발전에 일부분 기여하고 있다는 자부심을 공유할 수 있어서 유익한 시간이었습니다.


특히 이번 meeting에는 CLC bio 의 부사장과 개발 책임자가 참가했는데요, 저희 (주)인실리코젠은 한국의 CLC bio 유저들을 대신하여 고객들의 요구사항이나 고충을 대변하여 CLC bio의 담당자들을 거세게 몰아 붙이는 진풍경이 벌어지기도 했습니다. 그 결과 다양한 지원 정책과 유용한 분석 기능들의 추가 개발을 약속 받았습니다.



CLC bio는 Next-Generation Sequencing (NGS) 열풍으로 생물정보학 분야에 집중된 관심과 함께 나날이 성장해 나가며, Agriculture, Diagnosis, Medical research 분야의 집중된 분석 도구와 pipeline을 개발해 나갈 것이라고 밝혔습니다. 뿐만 아니라 이러한 분야에 적용할 수 있는 다양한 case study와 application note와 같은 자료를 제공하겠다는 계획도 밝혀 CLC bio의 solution들이 더 쉽게 널리 이용될 수 있도록 노력하는 의지를 볼 수 있었습니다.



3일 이라는 짧은 시간 동안의 만남이지만 모두 다 생물정보학 분야의 발전이라는 목표와, 'CLC man'이라는 동질감을 공유해서 일을 떠나 개인적으로 많이 친해진 모습들을 볼 수 있었습니다.

NGS analysis, anyone can do!


이 번 CLC bio Asia re-seller meeting 행사 내에는 "NGS analysis, anyone can do!" 라는 주제로 NGS 데이터의 de novo/reference assembly를 비롯하여 variation detection, RNA-seq, ChIP-seq 등의 분석을 누구나 쉽고 간편하게 수행할 수 있는 CLC Genomics Workbench의 5.5 버전 런칭 세미나도 개최되었습니다.

지 난 8월 23일, 이비스 앰베서더 수원 호텔에서 진행된 이 세미나는 최근 업그레이드로 다양한 분석 도구들이 추가된 CLC Genomics Workbench의 기능과 실 사례 데이터 분석 결과를 바탕으로 우리 회사의 VVIP 고객들을 초청하여 CLC Genomics Workbench 사용자들에게 유용한 시간이 되었습니다.



먼저 이번 세미나의 개요와 각 섹션에 대한 간단한 소개 후 본격적으로 세미나가 시작되었습니다. ‘NGS 기본 개념 및 응용분야’라는 주제로 진행된 첫 번째 섹션은 NGS를 이용한 다양한 application 및 분석 사례를 소개하는 시간이었고, 연이어 두 번째 섹션은 NGS 데이터를 활용할 수 있는 다양한 분석 툴을 탑재하고 있는 CLC Genomics Workbench의 기능들에 대하여 알 수 있는 시간이었습니다. 또한 이번 re-seller meeting 행사로 인하여 내한한 CLC bio사의 Henry Wang 컨설턴트가 가장 중요한 세 번째 섹션을 맡아 CLC Genomics Workbench 5.5 버전의 업그레이드된 기능에 대한 리뷰를 진행하였습니다.





잠깐의 휴식시간 후 바로 진행된 네 번째 섹션은 이러한 CLC Genomics Workbench를 이용하여 얻은 실사례 데이터로 case study를 보여주는 시간이었습니다. 최근 NGS 데이터로 가장 많이 수행하고 있는 variation 분석과 RNA-seq 분석에 대한 예제로 CLC Genomics Workbench에서 실제 분석되는 과정을 확인할 수 있었고, 업그레이드 된 기능들을 잘 활용하여 쉽고 간단한 워크플로우로 제작할 수 있음이 사용자들에게 가장 흥미있는 이슈였습니다.





이렇게 이번 세미나를 통하여 CLC Genomics Workbench의 한층 업그레이드된 강력해진 분석 기능들을 파악할 수 있는 시간이었고, 짧은 시간에 많은 정보를 보여주려고 하다보니 그 동안 고민이었던 NGS 데이터의 분석 관련 질의/응답 및 컨설팅의 시간이 부족했던 점이 가장 아쉬웠습니다. 하지만 충분히 CLC Genomics Workbench의 매력을 직접 느낄 수 있었던 시간이었을 것이라 생각되고, 우리 고객분들이 조금 더 CLC Genomics Workbench를 활용하는 능력을 키울 수 있는 좋은 기회가 되었을 것입니다. "NGS analysis, anyone can do!"라는 이번 세미나의 주제처럼, 저희 (주)인실리코젠은 NGS 데이터 분석에 어려움을 느끼시는 연구자 분들께 NGS를 조금 더 쉽고 편리하게 분석할 수 있는 방법을 알릴 수 있도록 노력하겠습니다.

Tour

8월 22일 수요일

8월 22일 오전 distributor Meeting이 끝난 후 이비스 호텔에서 점심식사를 하였습니다. 모두들 맛있는 식사를 한 후에 든든한 마음으로, 한편으론 비가 올까 걱정스러운 마음을 가지고 경복궁을 향해 출발했습니다.

경복궁 입구에서 가이드를 만나기로 약속을 한 후, 버스를 타고 달리고 달려 드디어 경복궁 앞에 도착. 보라색 모자를 쓴, 오늘 하루 우리에게 친절하고 재미있게 설명을 해주실 가이드를 만났습니다. 하늘은 곧 비가 쏟아져 내릴 것처럼 흐렸지만 다행히도 비는 내리지 않았습니다. 경복궁에 들어가기 전 가이드의 설명이 시작되고, 저와 Henry는 입장권을 끊으러 갔습니다. 경복궁에 처음 온다는 저의 말에 Henry는 굉장히 놀란 눈치였습니다. Henry는 경복궁이 두 번째 방문이라고 합니다. 그렇게 먼 거리도 아닌데 왜 여지껏 한 번도 가보지 않았는지.. 너무 역사에 무관심했다는 생각이 드는 순간이었습니다.

경복궁에 들어서서 단체 사진을 한컷! 찍고 가이드의 설명을 들으며 이곳 저곳 둘러보기 시작했습니다. 모두들 호기심 가득한 눈빛으로 경복궁을 둘러보고 매우 아름답다는 탄성이 나오기도 하고 가이드의 재미난 설명 덕에 다들 신나보였습니다. 그리고 많은 분들이 사진을 찍느라 분주한 모습이었습니다.






많다면 많고 적다면 적은 인원을 박 부장님과 제가 어떻게 인솔을 해야 할지 걱정이 앞서기도 했지만 Henry의 도움 덕분에 한결 편하게 경복궁 관광을 할 수 있었습니다. 경 복궁 투어가 끝난 후 우리는 바로 인사동으로 향했습니다. 인사동에서는 각자 쇼핑타임을 가졌고, 인사동의 한정식 집에서 저녁 식사를 하였습니다. 좌식이라 외국인들에게는 다소 불편하여 미안한 마음이었지만 다들 내색하지 않고, 음식을 맛있게 먹어주었습니다.

빡빡했던 일정을 마무리하고 우리는 내일 또 다른 투어를 위해 호텔로 아쉬운 발걸음을 옮겼습니다.

8월 23일 목요일


23일 목요일에는 용인에 위치한 한국민속촌을 투어하기로 했습니다. 투 어를 시작하기 전 우리는 수원에서 맛있기로 소문난 ‘ㄱ’ 한정식 집으로 향했습니다. Vegetarian을 위해 식당에서 별도로 샐러드도 준비해주었습니다. 보기 좋은 음식(떡)이 먹기도 좋다는 말이 있듯이 음식들이 모두 굉장히 예쁘고 먹음직스럽게 한 접시 한 접시 담겨져 나왔습니다. 작품을 카메라에 담듯이 다들 배고픔도 잊은 채 음식을 카메라에 담기 바빴습니다. 역시나 맛도 굉장히 좋았습니다. 처음 보는 음식들도 신기해하며 모두들 맛있게 먹었습니다. 맛있는 점심 식사를 마친 후 우리는 본격적인 한국민속촌 투어를 시작하기 위해 식당을 나섰습니다. 한국민속촌은 우리 조상의 슬기와 지혜가 스며있는 전통생활 모습을 재현, 전시한 야외민속박물관으로 만들어진 곳입니다. 민속촌에서는 나이가 지긋하고 인상이 좋아 보이는 어르신이 가이드를 해주셨습니다. 교장선생님으로 계셨다가 퇴직 후에 봉사활동으로 가이드를 하고 계시다고 합니다. 전통생활 모습을 젊은 세대의 가이드가 아닌 나이 지긋한 어르신이 직접 해주니 우리나라 전통생활 모습이 더 잘 묘사되고 전달되지 않았나 싶었습니다.



가이드 선생님의 디테일한 설명과 함께 민속촌을 둘러본 후 각자 지인들에게 선물할 기념품도 구매를 하였습니다.

호텔로 돌아가는 차안에서 노을이 빨갛게 지는 모습을 보니 제가 타국에서 관광을 하고 있는 것만 같았습니다. 그만큼 노을이 너무 아름다웠습니다.

이틀동안 걸어서 투어를 하느라 저도 외국인 분들도 힘들었지만 그만큼 서로에게 좋은 추억이 됐을 거라 생각합니다. 대한민국이라는 나라에서 (주)인실리코젠과 함께 관광했던 모든 모습들이 외국인 분(친구)들에게 좋은 기억만 심어줬으면 좋겠다라는 생각을 하며, 저는 지금도 그 때의 모습을 다시 추억해 보고 있습니다.

(상기 사진중 초상권에 대한 우려가 있으신 분은 당사로 연락주시면, 즉시 조치를 취하겠습니다.)

Codes사업부 김경윤, 심재영, 송하나

Posted by 人Co

2012/09/28 14:16 2012/09/28 14:16
, , ,
Response
No Trackback , No Comment
RSS :
https://post-blog.insilicogen.com/blog/rss/response/118

ChIP-Seq 분석은 어떻게 하는건가요?

ChIP-Seq


ChIP 은 Chromatin Immunoprecipitation의 약자로 세포내에서 이뤄지는 단백질과 DNA간의 상호작용을 알아내는 주요한 방법으로 특정 단백질과 binding 하는 DNA sequence 를 알아내는 것을 목적으로 합니다. 특정 단백질과 결합된 DNA을 면역학적 방법인 antibody를 이용하여 침강시킨후 결합된 DNA를 따로 분리하여 그 sequence를 확인합니다. 이때, 해당 서열을 확인 하는 방법으로 microarray방식을 이용하면, ChIP-chip이 되고, NGS와같은 시퀀싱 방식을 이용하면 ChIP-seq이 됩니다. 이러한 방법은 유전자 발현을 조절하는 전사조절인자(transcription factor)의 bindig site와 기작을연구하는데 많이 이용되고 있습니다.

예를 들어 transcription factor A의 binding-site를 분석하기 위해, 먼저 세포내에서 transcription factor A와 DNA를 결합시킨 후 그 결합을 고정하기 위해 sample을 포름알데히드와 같은 고정액으로 고정시킵니다. 이후 세포를 lysis하여 DNA 전체를 분리한 다음 sonication 방법으로 DNA를 잘게 조각냅니다. 그러면 transcription factor와 결합된 상태의 DNA 조각과 그렇지 않은 조각이 생성됩니다. 이후 원하던 transcription factor A에 binding된 DNA 조각만을 분리하기 위해 transcrition factor A 특이적인 antibody와 beads 붙여 원심분리를 통해 transcription factor A와 이에 결합된 DNA만을 분리해 낼 수 있습니다. 마지막으로 분리된 transcription factorA와 DNA 사이의 결합을 끊어 DNA만을 분리해낸 다음 앞서 언급한 microarray방식과 NGS 기술을 이용한 시퀀싱 방식을 통해 각각 확인할수 있습니다. Microarray방식은 유전체상의 대부분의 영역을 microarray probe로 제작하여 chip에 심은 후 transcription factor A와 결합되었던 DNA조각을 binding 시켜 확인하게 되며, 시퀀싱 방식은 분리된 DNA조각을 직접적으로 시퀀싱을 통해 확인하게 됩니다. 이후 시퀀싱된 서열을 해당 유전체 서열에 mapping(reference assembly)을 통해 유전체 상의 binding location을 확인 합니다. 이들 모두 공통적으로 transcription factor A가 binding 하는 서열정보를 비롯하여 유전체내의 binding location을 함께 확인 할 수 있어 이차적으로 전자를 조절 받는 유전자 프로파일을 함께 확인 할수 있는 이점이 있습니다.

사용자 삽입 이미지
단백질과 binding 되는 DNA 서열이 짧기 때문에 , ChIP-Seq 분석을 할 때는 일반적으로 short read로 시퀀싱을 진행합니다. 또한 reference 서열에 mapping 할 때 역시 mapping 파라메터들을 엄격하게 설정하여 noise data의 생성을 예방합니다. 시퀀싱 reads의 서열들이 짧기 때문에 적은 bp의 mismatch나 gap일 지라도 실제 binding site가 아닌 엉뚱한 위치에 mapping될 확률이 높아 지므로 최종적으로 ChIP peak를 찾기 힘들어지게 될 수 있습니다. Mapping view를 보면 이렇게 특정 단백질에 특이적인 binding-site에만 read들이 mapping 되어 형성되는 'peak'을 확인 하실수 있습니다(Candidated transciption factor A binding position).

사용자 삽입 이미지
Peak 영역에 mapping된 read의 수와 전체 reference 서열의 mapping 된 read의 분포, 그리고 control 데이터에 mapping된 read의 분포 등을 고려하여 관찰되는 peak가 false positive인지 false negative인지 통계적으로 유의성을 검증할 수 있습니다. CLC Genomics Workbench를 이용하면 이렇게 찾아진 ChIP peak들에 대한 정보가 담긴 테이블과 해당 ChIP peak가 위치한 부분의 mapping view를 한 화면에서 확인할 수 있습니다.

사용자 삽입 이미지
그리고 mapping view를 조금 더 축소해 보면 해당 peak의 upstream과 downstream에 위치한 유전자를 확인하여, 어떤 유전자들이 해당 transcription factor A에 영향을 받을지 유추해 볼 수 있습니다.

사용자 삽입 이미지
부가적으로 BIOBASE사의 'TRANSFAC' 데이터베이스는 발표된 모든 논문들을 대상으로 생물 전문 큐레이터들이 검토하여 transcription factor와 transcription factor binding site에 대한 정보를 축적하고 있습니다. 또한 이렇게 형성된 TRANSFAC의 데이터는 보다 효율적으로 연구자들에게 공급하기위해 CLC Genomics Workbench에서 plug-in을 통해 ChIP-seq을 통해 찾아진 peak와 직접적으로 비교하여 관련된 유전자, 질병 및 mutation에 대한 다양한 정보를 제공 하고 있습니다.



Posted by 人Co

2012/06/11 15:03 2012/06/11 15:03
, , , ,
Response
No Trackback , No Comment
RSS :
https://post-blog.insilicogen.com/blog/rss/response/112

Biomax사와 CLC bio사 방문

지난 2월에는 김형용 책임개발자님과 강연경 선임개발자님이 당사에서 제공하는 솔루션에 대한 기술적 사항들을 교육받기 위해 독일 뮌헨의 Biomax사와 덴마크 오르후스의 CLC bio사에 방문하였습니다. 특히 Biomax사의 BioXM, CLC bio사의 CLC Genomics Server에 대해 기술적 전수를 받고 오셔서 앞으로의 솔루션 기반 고객서비스를 한층 강화할 수 있을 것으로 기대합니다. 그럼 두 분의 방문 후기를 들어볼까요?

생물정보분야 지식창출 전문가그룹 Biomax사를 방문하고

 KM사업부 김형용

Biomax, 아마도 가장 오래된 생물정보학 회사일듯. 2001년 RECOMB 학회에서도 Biomax의 개구리 심볼마크를 본 기억이 난다. 그 오랜시간동안 기업을 유지할 수 있다는 건 대단한 일이다. 중간에 생물정보분야 버블이 빠지던 기간도 있었음을 고려하면 그 기술력 유지가 상당했음을 짐작할 수 있다. Biomax사는 PedantPro로 일찌감치 유전체주석(Genome Annotation)분야에 자리를 잡고 생물정보 분야의 거의 전 분야를 커버해왔다. 최근에는 의미론적 방법으로 데이터베이스를 통합하고 지식 추출에 활용할 수 있는 BioXM을 통해 포스트 NGS분야의 선두주자로 자리매김하고 있다.

방문목적은 파트너사로서 현재 서비스하고 있는 BioXM에 대한 기술적 점검을 받고, 새버전의 기능에 대한 교육과 함께, 컨설팅 플랫폼으로 활용하기 위한 웹포털 기능을 중점적으로 이해하기 위함이였다. 개발자 두명이서만 방문해서 잘 따라갈 수 있을까 걱정이 앞서긴 했지만, 막상 부딪히니 기술적인 노하우들도 많이 얻고 또 많이 배울 수 있었던 좋은 경험이였다.

사용자 삽입 이미지
방문 첫날, 이날 영하 10도가 넘어가는 매우 추운날이였다. 위 사진에 보이는 곳이 Biomax사 건물이 있는 곳 앞. Biomax는 이 건물의 3,4층을 사용하고 있다.

사용자 삽입 이미지
함께 간 강연경 선임과 Biomax사 CEO이신 Klous Heumann 박사님. CEO께서 직접 프리젠테이션으로 BioXM 및 관련 비즈니스에 대한 소개를 해주셨다. 특히 BioXM을 통한 컨설팅 비즈니스에 대한 언급이 많았다. 직접 BioXM을 구입하지 않아도 자신의 데이터에 대해 컨설팅을 받고 웹페이지로 컨설팅 결과를 확인할 수 있다. 고객은 자신만의 데이터와 외부에 공개된 데이터(GO, KEGG 등)이 통합된 데이터베이스를 받고, 여기에 의미검색, 네트워크분석 등을 수행할 수 있다. 이 컨설팅 비즈니스 모델은 현재 우리 KM사업부에서도 추진중이다.

사용자 삽입 이미지
전체 트레이닝 스케줄과 당사 설치 이슈들에 대한 논의를 함께 했던 Dieter Maier 박사님. 큰 키에 조각같은 얼굴과 희끗한 머리가 멋지게 휘날리는 분이셨다. Biomax사에는 주로 생물학분야 박사님들이 많았는데 대부분 덩치들이 거대하셨다는. 동양인이면서도 작은 편인 나와 좀 많이 비교가 되더라. 나도 키는 더 안크겠지만 살이라도 찌워 덩치라도 비슷하게 만들어야 하나 싶었다. 점심식사는 회사에서 직접 만들어다 주셨는데 이분들 매번 빵만 드시는 걸 보니 살짝 안타까움도 들더라. 어찌 빵만먹고사나 몰라.

사용자 삽입 이미지
뮌헨에서의 3박 4일 일정을 사무실과 호텔에서만 보낼 수 없다는 생각에 마지막날 저녁 뮌헨 시내를 둘러보았다. 위 사진은 마리안 광장. 영하10도의 시내한복판이지만 그래도 가끔 관광객들이 보이긴 했다. 아마도 나처럼 이 추운날 뮌헨에 갈 곳이 없구나란 생각을 했을 듯. Biomax 사의 3일간의 일정동안 Pedant-pro, BioXM, 컨설팅 비즈니스등 많은 분야에 대한 논의들을 했고, 중요한 지식들을 전수받을 수 있었다. 특히도 BioXM 심화분석 이해를 위해 연습문제까지 내어주며 친절하게 알려주신 Hilmar Ilgenfritz 박사님이 기억에 많이 남는다. Biomax사 제품들을 가만히 보면 이곳만의 개발 철학도 느낄 수 있는데, 여기는 개발자 중심이라고 하기 보다는 과학자 중심인 회사라는 느낌. 회사안의 많은 과학자들이 무수한 논의를 거쳐 모델을 만들고 또 컴퓨터 과학자와 논의하여 제품을 만드는 모습은 쉽게 따라하기 어려운 이곳만의 저력을 느끼게 했다. 앞으로도 좋은 파트너 관계를 유지하고, 시맨틱스 컨설팅 분야에 좋은 성과들을 많이 남길 수 있길 바라면서 CLC bio가 있는 덴마크 오르후스로 향했다.

글로벌 기업으로 발전하고 있는 CLC bio사를 방문하고

Codes 사업부 강연경

CLCbio는 Biomax와 비교한다면 아주 짧은 기간내에 생물정보학 분석 솔루션 시장에 성공적으로 진입한 기업이다. CLCbio사의 솔루션은 크게 PC용 소프트웨어(Workbench 제품군), 엔터프라이즈급의 서버 솔루션(BioDatabase, Genomics Server) 으로 구분할 수 있는데 두 제품군 모두 사용자의 다양한 요구사항을 반영할 수 있는 커스터마이징 아키텍처를 포함하고 있다. 뿐만아니라 서버 솔루션과의 연계를 통해 다양한 형태의 플랫폼 구현이 가능하다. 이렇게 유연한 형태의 솔루션을 기반으로 철저히 사용자(고객) 중심의 기업 마인드가 짧은 기간에 그들이 글로벌 기업으로 발돋음한 힘이 아닐까란 생각을 해 보았다.

우리는 이틀동안 진행된 교육프로그램을 통해 CLC Genomics Server의 커스터마이징 도구인 Command Line Tool (CLT)과 External Application Tool 에 대한 기술적인 내용과 CLCbio의 비지니스 전략, 분석 컨설팅 실 예를 통한 plug-in 활용방법 등 여러가지를 보고 배울 수 있는 좋은 경험이였다.

사용자 삽입 이미지
CLCbio는 덴마크 오르후스(Aarhus) 라는 항구도시에 위치하고 있다. 첫날 우리는 Henry(CLCbio Asia-Pacific Reseller Manager)가 추천해준 대로 호텔에서 CLCbio사까지 약 30분정도 되는 거리를 짧게나마 덴마크를 보고 느끼면서 찾아갔다. 2월의 북유럽 추운 날씨에도 많은 사람들이 자전거로 출근하는 모습이 인상적이였다.

사용자 삽입 이미지
CLCbio 본사의 이곳저곳의 모습이다. 내가 느낀 CLCbio 본사 분위기는 깨끗한 사무실과 CLCbio 로고처럼 군더더기 없는 인테리어 그리고 직원들의 자유롭고 젊고 활기찬 모습.

사용자 삽입 이미지
한국에도 몇번 방문했었던 Mikael. 그는 이틀동안의 우리 스케줄을 체크해 준 친절한 Cigar guy! (담배를 무척 좋아하는 듯하다.)

사용자 삽입 이미지
한국시장에 큰 관심을 보여 주었던 CEO Thomas Knudsen.

사용자 삽입 이미지
CLC Genomics Server 개발을 담당하고 있는 Paul로부터 CLC Genomics 서버가 지원하는 분산환경에 대한 시스템 구조에 대한 대략적인 설명을 들었다. 우리는 이틀간의 CLCbio 본사에서의 교육 일정동안 CLC Genomics Server가 제공하는 다양한 커스터마이징 기술(External Application, Plugin, Command Line Tool) 에 대한 기술적인 내용뿐만 아니라 실제 적용사례에 대한 내용에 대한 설명을 들을 수 있었다. 구체적인 사례를 들으면서 어렵게만 생각되었던 커스터마이징 관련 기술들에 대해 회사에서 진행하고 있는 몇개의 CLC Genomics Server 커스터마이징 관련 사업에도 접목 시킬 수 있겠다란 생각이 들었다. 개인적으로 이번 파트너사 방문 출장을 통해 글로벌한 기업과 우리회사가 파트너쉽을 가지고 같이 하고 있다는 것에 대한 자부심과 함께 외국 파트너사와 함께 일하기 위해서 영어가 얼마나 중요한 수단인지 다시한번 실감했다. 좀 더 준비하지 했으면 더 많이 배우고 갈 수 있지 않았을까라는 아쉬움과 회사로 돌아가 새롭게 알게된 기술들을 어떻게 접목 시킬수 있을까라는 고민을 하면 Biomax 그리고 CLCbio사 방문 일정을 마무리 했다.


Posted by 人Co

2012/05/25 08:46 2012/05/25 08:46
Response
No Trackback , No Comment
RSS :
https://post-blog.insilicogen.com/blog/rss/response/111

RNA-Seq
RNA-Seq은 NGS 기술로 transcriptome을 분석 할 수 있는 방법으로써, 말 그대로 특정 샘플에서 발현되는 RNA 서열을 시퀀싱하여, 어떤 exon들로 조합된 transcript가 발현이 되었는지, transcriptome에 대한 다양한 정보를 한 번에 알아낼 수 있는 방법입니다.

RNA-Seq 데이터 다운받기
웹 브라우저에서 아래 url로 이동해 보시면 CLC bio에서 제공하는 예제 RNA-Seq 데이터를 받으실 수 있습니다. 이 데이터는 RNA-Seq 분석에 관한 초기 논문 중의 하나인 Mortazavi의 논문에서 얻은 데이터로 mouse의 brain과 liver에서 발현되는 mRNA를 시퀀싱 하여 분석한 데이터입니다. 이 데이터는 이미 CLC Genomics Workbench에 import가 된 상태의 데이터로 .zip 파일을 그대로 ‘Navigation Area'에 드래그 하면 자동으로 import가 됩니다.

http://www.clcbio.com/index.php?id=1290
사용자 삽입 이미지
Subset.zip 이라는 파일의 import가 완료되면 다음 그림과 같은 데이터가 나타나게 됩니다. Brain과 liver에서 각각 두 개씩 얻은 read 데이터와 mouse 16번 염색체의 reference 서열 파일을 확인 할 수 있습니다.

사용자 삽입 이미지

RNA-Seq 분석 돌리기
데이터 준비가 완료되면, ‘Toolbox’의 'RNA-Seq Analysis'를 실행시킵니다.

사용자 삽입 이미지
첫 번째 단계에서 reference 서열에 mapping 시킬 read 데이터를 선택합니다. 이때 각 샘플에서 얻은 데이터끼리 따로 분석을 해야 하기 때문에, 다른 샘플의 read를 함께 선택하지 않도록 주의합니다.

사용자 삽입 이미지
다음 단계에서는 reference 서열에 대한 몇 가지 항목을 설정합니다. ‘Reference'는 read를 mapping 시킬 reference 서열을 지정하는 항목인데 선택한 reference 서열에 있는 annotation을 이용할 것인지 아닌지를 선택해야 합니다. 전자의 경우 reference 서열에서 'Gene'이라는 이름으로 annotation 영역을 추출한 다음 그 서열들에만 read들을 mapping 시키게 됩니다. 이 때 아래 쪽 ’Extend annotated gene regions'의 값을 조정하면 gene 영역의 upstream과 downstream으로 지정된 base 만큼 확장하여 추출하게 됩니다. 후자의 경우 전체 reference 서열에 read들을 mapping 시킨 후 전체 서열에 대한 발현량이 계산되게 됩니다.

사용자 삽입 이미지
다음 단계에서는 read를 mapping 하는데 요구되는 옵션들을 설정하게 됩니다. ‘Maximum number of mismatches'는 read가 reference 서열에 mapping 될 때 허용되는 mismatch base의 수를 정해주는 옵션이고 ’Maximum number of hits for a read'는 non-specific하게 mapping 되는 read의 허용 가능한 정도를 정하는 옵션입니다. 예를 들어 이 옵션이 ‘10’으로 설정되어 있을 경우, reference 서열에 mapping 될 수 있는 부분이 11개 이상인 read는 mapping되지 않고 버려집니다. 반면에 mapping 될 수 있는 부분이 10개 이하인 경우에는 그 mapping 될 수 있는 부분들 중에서 무작위로 한 자리가 선택되어 mapping 되게 됩니다. 'Minimum length fraction'과 ‘Minimum similarity fraction'은 mapping 시킬 read가 long read 일 경우 적용되는 옵션입니다. Long read는 길이가 길다 보니 reference 서열과 mapping 되는 부분을 base 단위로 정하지 않고 비율로 정하게 되는데, 'Minimum length fraction'이 ’0.9‘로 설정되면 100bp의 read는 최소한 90bp 이상 reference 서열과 match되어야 mapping 됩니다. 그리고 ‘Minimum similarity fraction'이 ’0.8‘로 설정되면 mapping 된 부분의 identity가 80%는 되어야 mapping이 됩니다.

사용자 삽입 이미지
다음 옵션은 새로운 exon 영역을 찾아내는데 필요한 옵션들입니다. 먼저 'Type of organism'에서 분석 대상이 원핵생물(Prokaryote)인지 진핵생물(Eukaryote)인지 선택합니다. 원핵생물의 경우 exon과 intron의 개념이 없기 때문에 'Exon discovery'가 수행되지 않습니다.

사용자 삽입 이미지
진핵생물을 선택하고 'Exon discovery'를 수행하도록 체크하게 되면, 세 가지 옵션 값을 설정 할 수 있습니다. 'Required relative expression level'은 다른 exon들의 발현량에 비해서 새롭게 찾아진 exon에 요구되는 상대적인 발현량을 의미합니다. 그리고 ‘Minimum number of reads'는 새롭게 찾아진 exon 영역에 요구되는 최소한의 mapping read의 수를 의미하고, 'Minimum length'는 그 exon 영역의 최소 길이를 의미합니다. 예를 들어 이 옵션들이 기본 값으로 설정된 경우, intron 영역의 어떤 부분에 10개 이상의 read가 mapping 되고, 이 read 들로 조합된 consensus 영역이 50bp 이상이면서, 이 부분에 대하여 계산된 발현량이 다른 exon 들의 발현량에 대하여 상대적으로 20% 이상이면 이 영역을 기존에 알려지지 않은 새로운 exon 이라고 인식하도록 되어 있습니다.

사용자 삽입 이미지
다음 단계에서는 분석 결과를 작성하는데 필요한 몇 가지 옵션들을 설정하게 됩니다. Mapping 되지 않은 read들의 목록을 따로 생성시킬 것인지, RNA-seq 분석에 관한 report나 분석 log를 작성할 것인지에 관하여 설정할 수 있습니다. 'Expression value'는 각 유전자 혹은 transcript의 발현값을 어떻게 계산 할 것인지를 정하는 옵션입니다. 'Transcript:RPKM'을 선택하면 각 transcript의 발현값을 계산하여 보여지게 됩니다.

사용자 삽입 이미지
그리고 paired-end read를 사용할 경우 'gene fusion' 분석도 할 수 있습니다. Gene fusion은 translocation, deletion, inversion과 같이 염색체 구조 변이에 의해서 두 개의 유전자가 합쳐진 경우를 말합니다.

사용자 삽입 이미지
예를 들어, gene fusion이 일어난 유전자에서 mRNA가 발현되고 시퀀싱 하여 paired-end read를 얻은 후 정상적인 reference 서열에 mapping을 시켜보면 forward 서열은 A라는 유전자에 mapping 되는데 reverse 서열은 B라는 유전자에 mapping 될 수 있습니다.

사용자 삽입 이미지
이런 paired-end read를 두 유전자 사이에 gene fusion이 일어났다고 볼 수 있는 증거로 제시할 수 있으며, ‘Minimum read count'로 이런 paired-end read가 최소한 몇 개가 있어야 gene fusion이 일어났다고 report를 할지 정해 줄 수 있습니다.

모든 옵션과 결과의 저장 위치 지정이 완료되면 ‘Finish' 버튼을 클릭하면 분석이 진행 됩니다.

분석이 완료되면 다양한 정보가 들어있는 테이블이 나타납니다. 각 유전자 별로 발현값, annotate된 transcript의 수, 확인된 transcript의 수 exon 영역의 길이, exon 영역에 mapping된 read의 수, 등 많은 정보를 확인 할 수 있습니다.

사용자 삽입 이미지
각 항목을 더블클릭해 보면 각 유전자별로 read 들이 어떻게 mapping 되었는지 확인할 수 있는 mapping view가 나타납니다. Mapping view에서 오른쪽 side panel의 몇 가지 설정을 바꾸면 다양한 형태로 화면을 수정할 수 있습니다. Mapping view를 열어 보면 read들이 어떤 exon에 mapping이 되었는지 볼 수 있고, 이를 통해 어떤 exon들이 조합된 transcript가 발현이 되었는지 알 수 있게 됩니다. 한 가지 예로 Brain sample의 Bdh1 이라는 유전자에서는 1개의 'Putative exon'이 발견 되었습니다. Liver sample의 결과에서 같은 유전자의 mapping view를 열고 비교해 보니 Brain sample에서 발견된 새로운 exon 부분이 mapping 되지 않은 것을 볼 수 있습니다. 이를 통해 Brain 조직에서는 Bdg1 유전자에 기존에 알려지지 않은 exon 영역이 존재하고 이 exon 영역이 함께 조합된 새로운 transcript가 발현된다고 추측해 볼 수 있습니다.

사용자 삽입 이미지
Paired-end read를 이용하고 gene fusion event를 확인 하도록 옵션을 설정했다면, 다음과 같은 결과 테이블도 볼 수 있습니다. 이 테이블에서 gene fusion이 일어난 유전자와 그 유전자의 위치, 그리고 몇 개의 paired-end read가 mapping 되었는지 확인 할 수 있습니다.

사용자 삽입 이미지

Reference
 - http://en.wikipedia.org/wiki/Fusion_gene
 - Genomic sequencing of colorectal adenocarcinomas identifies a recurrent VTI1A-TCF7L2 fusion, Nature Genetics Volume:43, Pages:964–968 Year published:(2011)



* 아래 이메일 주소로 연락 주시면 CLC Genomics Workbench의 모든 기능을 사용할 수 있는 데모 라이센스를 제공해 드리오니 많은 이용 바랍니다.

  - codes@insilicogen.com

Posted by 人Co

2012/04/30 20:10 2012/04/30 20:10
Response
No Trackback , No Comment
RSS :
https://post-blog.insilicogen.com/blog/rss/response/109

NGS 데이터로 SNP와 Indel 분석하기

Variation study
'시퀀싱 비용의 절감’ 이라는 장점을 갖는 NGS 기술과 함께 이슈가 되고 있는 분야가 ‘개인 맞춤형 진단’입니다. 질병, 체질 등 모든 표현형의 근간이 되는 DNA의 서열 정보를 알아내어 비교함으로써 개인 간의 차이와 질병의 원인을 알아낼 수 있는 시도를 진행할 수 있게 된 것입니다. NGS 데이터를 이용해 수행할 수 있는 variation 분석으로 SNP, small insertion/deletion polymorphisms, structure variation 분석이 있습니다.

분석 방법은 대략 비슷한데,

  1. Reference 서열에 mapping
  2. Variation(SNP, Indel, etc)찾기
  3. Public DB 데이터와 비교

와 같은 순서로 볼 수 있습니다.

사용자 삽입 이미지
보통 mapping을 하기 전에 read 들을 quality나 시퀀싱 기기에 잠재적인 오류를 줄이기 위한 filtering을 먼저 진행하지만 여기선 언급하지 않겠습니다. Reference 서열과 read가 준비되면 reference assembly를 합니다. 그리고 그 결과로 나온 mapping 데이터에서 reference 서열과 consensus 서열, 그리고 consensus 서열을 만들어낸 read들의 서열 데이터를 모두 종합해서 SNP나 Indel을 찾아냅니다.

SNP 찾기
먼저 SNP를 찾는 방법에 대해 정리해 보고자 합니다. 사실 SNP를 찾는 소프트웨어들이 하는 일은 reference 서열과 consensus 서열이 서로 다른 position을 찾은 후, 그 position의 consensus 서열을 구성한 read들의 quality나 coverage, 그리고 구성 비율 등의 기준을 정하고 그 기준을 통과하는 position을 찾아 정리해주는 역할을 합니다.

아래 그림에서 노란색으로 강조된 세로 열을 보면 consensus 서열(black)이 ‘A’ 이지만 이 서열에 해당하는 read들을 보면 일부 ‘C' 가 보입니다. Window size라는 것은 SNP를 찾는데 특정 position에 해당 하는 read의 서열 주변 영역을 말합니다. 예를 들어서 window size가 11이라고 정해지면 특정 position의 양옆으로 5bp 씩 확장한 11bp를 의미합니다. 만약 read의 해당 position이 끝 부분이어서 한쪽으로 확장할 영역이 5bp 미만일 경우 부족한 만큼 반대쪽 영역으로 확장하여 비대칭한 형태로 window size가 설정 됩니다. 이 window size을 대상으로 quality나 gap, mismatch 개수를 계산한 다음 해당 position의 consensus 서열을 결정하게 만든 read들의 정보가 믿을 수 있는지에 대한 filtering을 하게 됩니다. 만약 해당 position을 서열을 결정하는 read 서열 주변(window size) 영역의 quality가 낮거나 gap 또는 mismatch가 많다면, 그 read의 서열은 신뢰하기 어렵기 때문에 SNP를 결정 할 때 제외해야 할 것입니다.

사용자 삽입 이미지
이렇게 믿을 수 있는 read 정보만 남겨놓은 다음에는 read 서열의 frequency를 계산하여, 해당 position에 대하여 reference 서열과 다른 read의 서열의 frequency에 대한 기준을 정해 SNP를 찾아냅니다. 예 를 들어 위 그림의 강조된 부분에 mapping 된 14개 read 중 8개의 read는 'A'이지만 4개의 read는 C를 가리키고 있습니다. A와 C의 frequency는 66.67%와 33.33%입니다. 만약 reference 서열이 'A'이고 기준 frequency를 30% 라고 정했다면, 이 position은 SNP로 찾아질 것입니다. 이 frequency에 대한 기준은 sample을 어떻게 준비했느냐에 따라 달라집니다. 예를 들어 이배체 종의 sample을 그대로 시퀀싱 했다면 부모로 받은 서로 다른 두 개의 형질이 섞인채로 시퀀싱 되어 실제 SNP를 찾기 힘들기 때문입니다.

이렇게 염기서열 상에서의 SNP를 찾고난 다음에는 이 서열이 발현 단계에서 아미노산 서열의 변화까지 일으키는 non-synonymous SNP인지 확인해야 합니다.

사용자 삽입 이미지
사용자 삽입 이미지

DIP 찾기
편의상 Deletion/Insertion(gap) polymorphism을 줄여서 DIP라고 부르겠습니다. DIP를 찾는 것도 SNP를 찾는 방법과 유사합니다. Reference 서열과 비교해서 consensus 서열에 나타난 insertion이나 deletion이 나타난 자리를 찾는 것 입니다. 이 때 SNP와 마찬가지로 DIP가 나타난 consensus 서열의 근거가 되는 read의 수나 frequency를 기준으로 DIP를 선별해 낼 수 있습니다. DIP의 경우 1~2bp로 인해 해당 유전자의 ORF 전체가 바뀌게 되므로 관련된 유전자와 관련된 구조적 변화나 질병 등에 대한 연구가 함께 필요합니다.

사용자 삽입 이미지


* 아래 이메일 주소로 연락 주시면 CLC Genomics Workbench의 모든 기능을 사용할 수 있는 데모 라이센스를 제공해 드리오니 많은 이용 바랍니다.

  - codes@insilicogen.com

Posted by 人Co

2012/04/20 14:04 2012/04/20 14:04
Response
No Trackback , No Comment
RSS :
https://post-blog.insilicogen.com/blog/rss/response/108

Assembly를 해보자!

"저는 생물학과를 졸업 후 분자생물학 실험을 주로 하는 실험실에 석사과정으로 들어간 대학원생입니다. 여기서 저의 막내 생활이 다시 시작됩니다.
어느 날 교수님께서 '너의 석사 주제를 가져왔노라'시며 의미심장한 미소를 띄우시고는 미팅룸으로 저를 끌고 가십니다.
요즘 NGS 라는게 뜨는데 네가 남자고 컴퓨터를 좀 더 잘 할 터이니 네가 이걸로 뭔가를 해보라고 하십니다.
그 '뭔가'가 대체 뭔지는 논문 찾아보면 다 나오니까 조사해오라고 하십니다.
나름 조사를 해보니 용어도 잘 모르겠고, 다 영어라 해석도 어렵고...
전 정말 미추어 버리겠지만, 어쩌겠습니까? 까라면 까야죠."

위의 이야기는 제가 아는 어떤 친구의 하소연입니다. 이런 상황은 이 친구 뿐만이 아니라 대한민국 실험실의 많은 학생들, 그리고 연구원들이 공감하는 이야기일 것 같습니다.
저도 그 답답함을 겪었던, 그리고 아직 겪고 있는 한 사람으로서 제가 아는 만큼 NGS에 대해서 쉽게 이해할 수 있는, 그리고 소통을 통해 그 답답함을 해결할 수 있게 하는 글을 남겨보고자 합니다. 자 그럼 NGS 정체에 대해서부터 이야기 해보겠습니다.

NGS가 뭡니까?
NGS는 Next Generation Sequencing의 약자로 차세대 염기서열 결정이라고 해석할 수 있겠습니다. 해석은 ‘염기서열 결정’이라고 했는데 ‘휴먼 지놈 시퀀싱’ 할 때의 그 시퀀싱을 쓰는게 더 어울릴 것 같네요. 아무튼 어떤 생명체의 염기 서열을 알아낼 때 쓰는 시퀀싱법의 최신 버젼을 말하는 것 같습니다. 차세대라고 하는걸 보면 이전 세대의 염기서열 결정법 보다 뭔가 더 좋은게 있는 것 같습니다. 얼마나 혁신적으로 좋아졌길래 ‘차세대’라는 말을 갖다 붙였을까요?

'이전 세대' 시퀀싱법 Sanger method
Sanger method는 학부 분자생물학 시간 때 언뜻 들은 기억이 납니다. 지놈을 무작위로 잘라 단편 조각으로 만들고, single strand로 만든 다음 PCR처럼 primer를 붙이고 중합효소로 상보적인 dNTP들을 붙여 나갈 때 형광다이가 붙어 있는 ddNTP가 붙으면 중합 반응이 끝나고, 그 조각들을 전기영동으로 분리하면 짧은 조각부터 1bp 간격으로 정렬이 되는데 이 순서대로 형광다이의 색으로 A, T, G, C 서열을 결정해 나가는 방법입니다. 비루한 저의 설명 보다는 없는 지식이 없는 위키피디아(http://en.wikipedia.org/wiki/DNA_sequencing)나 파워블로거 님들의 자료를 살펴 보심이 옳은 줄로 아뢰옵니다. Sanger method의 장점이라면 정확해서 믿을만하다고 할 수 있겠습니다. 단점은 비싸고 오래 걸린다는 점입니다. 그래서 연구용으로는 적합하지만 상업적 목적으로 이용하기에는 힘들다고 합니다.

그럼 NGS는 뭐가 좋은데?
싸고 빠릅니다. 어디까지나 Sanger method에 비해서라는 전제가 붙을 때 이야기입니다. 차세대 염기서열 결정법은 크게 4~5가지가 있습니다. 기존 Sanger method의 비싸고 오래 걸려서 상업적으로 이용하기 어렵다는 단점을 극복할 수 있는 시퀀싱법을 개발하기 위해 몇몇 회사가 뛰어들어 새로운 시퀀싱법을 개발해 냈는데 기본적으로 전체 genome을 잘라 단편으로 만든 후 각 단편의 서열을 시퀀싱하고 이 단편들을 assembly라는 단계에서 겹쳐지는 부분을 이어 원래 지놈 서열을 알아내는 식으로 genome project가 진행 됩니다. 각 회사마다 개발해낸 시퀀싱법이 적용된 장비(혹은 플랫폼이라고 부르기도 합니다.)를 개발해서 판매하고 있으며 대표적으로 Roche사의 GS-FLX, Illumina의 Genome Analyzer, Applied Biosystem사의 SOLiD, Life Technologies사의 Ion Torrent 등이 있습니다. 여기서부터 슬슬 복잡해지기 시작합니다. 각 장비들마다 다른 시퀀싱법을 사용하다 보니 저마다 각자의 강점과 약점이 있습니다.

NGS로 무엇을 할 수 있을까?
서열을 시퀀싱해서 할 수 있는 분석들 대부분을 할 수 있습니다. 크게 나누자면 genomics, transcriptomics, epigenomics 분야로 나눌 수 있지만 raw data를 어떻게 응용하느냐에 따라 더 다양한 분야의 분석 방법들이 만들어 질 수 있을 것 같습니다.

Genomics

Transcriptomics

Epigenomics

de novo assembly

Reference assembly

SNP detection

DIP detection

RNA-Seq

Small-RNA analysis

ChIP-Seq


NGS 분석을 위해 준비해야 할 것들
"자 그럼 NGS 분석을 해보자! 뭐부터? 설계 먼저!
헐~ 데이터 파일이 너무 큰데... 내 PC에서 하면 PC 폭발하는거 아녀?
받긴 받았는데.. 이게 다 뭐다냐?"

어느 실험이 다 그렇듯이 NGS 데이터를 분석하는 것도 정확한 계획을 세우는 것이 중요합니다. 그 계획을 세우기 위해서는 시퀀싱 대상이 원핵 생물인지 진핵 생물인지? 지놈의 크기는 어느 정도인지? 그리고 얼마나 많이 시퀀싱 할 것인지(depth)? 그리고 주로 분석 할 대상이 RNA서열인지? exom 서열인지? whole 지놈 서열인지? 와 같이 시퀀싱 대상에 대한 정보를 파악하고 분석 목적에 맞는 시퀀싱 데이터(single short, long read, paired-end read, mate paired-end read)를 만드는 것이 중요합니다. 그리고 이 데이터들을 분석하기 위한 고사양의 컴퓨터, 분석 소프트웨어도 준비해야 합니다. 이 부분에 대한 설명은 다음으로 넘기도록 하겠습니다.

"de novo" assembly를 해보자!
'de novo' 라는 말이 낯섭니다. 우리 친구 네이놈 사전을 찾아보니 부사로써 ’처음부터‘, ’새로(이)(anew)‘, ’다시(again)‘, 영영사전에는 'from the beginning' 이라는 뜻이랍니다. 그러니까 de novo assembly는 새롭게 assembly를 한다는 말이 되겠네요. de novo assembly는 주로 서열이 밝혀지지 않은 종의 지놈 서열을 알아내고자 할 때 수행하는 분석입니다. Assembly는 일종의 퍼즐 맞추기랑 비슷합니다. Reference assembly는 원본 사진을 보면서 맞추는 퍼즐이고 de novo assembly는 원본 사진 없이 맞추는 거라고 보시면 됩니다.

사용자 삽입 이미지
* 1,000 피스 퍼즐 맞추는데 3일이 넘게 걸린다는데 이 퍼즐은 18,235 피스랍니다. 단순 비례 계산으로 치면 54일 쯤 걸렸겠네요.

원본 없이 하나하나 맞춰보면서 연결되는 것들 끼리 쭉~ 이어 원래의 genome 서열을 알아내야 하는 작업인지라 한 종류의 read들만 가지고 assemble을 하기란 쉽지 않습니다. 그래서 short, long, paired-end, mate-paired-end 등 여러 종류의 read들을 가지고 assembly를 해야 결과가 좋아집니다.

사용자 삽입 이미지
* 과학시간에 많이 보던 큰 구슬, 작은 구슬로 비커 채우기 실험

NGS read 데이터를 다운받자!
Assembly를 하려면 먼저 NGS read가 필요합니다. 현재 NCBI, EBI, DDBJ의 sequence 데이터 저장 서비스인 SRA(Sequence Read Archive)에서 공개된 NGS 데이터를 받을 수 있습니다. 일단 이 블로그에서는 어떻게 de novo assembly를 돌릴 수 있는지 알아보는 것이 목적이므로 지놈의 크기가 비교적 작은 E. coli의 NGS 데이터를 사용하고자 합니다. 웹 브라우저에서 아래 url로 이동해 보시면 CLC bio에서 제공하는 예제 데이터로 E.coli의 genome을 sequencing한, Roche의 454 장비에서 만들어진 long read 데이터와, Illumina 장비에서 만들어진 paired-end read 데이터를 다운받을 수 있습니다.

http://www.clcbio.com/index.php?id=1290

사용자 삽입 이미지

Roche 454 데이터 불러오기
Roche의 데이터는 크게 두 가지 형태가 있습니다. 하나는 454 Flowgram 이라고 불리는 .sff 파일이고 다른 하나는 FASTA 포맷으로 서열과 그에 대응하는 quality 값이 각각 두 개의 파일에 분리된 형태가 있습니다. 여기서 사용할 데이터는 후자에 해당합니다. 먼저 다운로드 받은 Roche 데이터의 압축 파일을 풀면 3개의 파일이 생성됩니다. 하나는 이미 알려진 E.coli의 전체 genome 서열 파일(.gbk)이고 다른 두 파일에 NGS read 파일입니다. 이중에서 .fna 파일이 각 read의 서열이 있는 파일이고 .qual 파일은 각 서열의 quality 값이 순서대로 기록된 파일입니다. 그 리고 CLC Genomics Workbench 화면 위쪽의 Tool bar에서 'NGS import'라는 버튼을 클릭하면 다음과 같이 import 할 수 있는 NGS data의 종류가 나타납니다. 여기서 첫 번째에 있는 'Roche 454...‘를 클릭합니다.

사용자 삽입 이미지
검색위치에서 아까 압축을 풀었던 폴더를 찾아간 후 .fna 파일과 .qual 파일을 둘 다 선택한 후 'Next'를 클릭하고, 다음 화면에서 저장위치 선택 후 'Finish' 버튼을 클릭하면 import가 완료 됩니다. Roche의 장비에서 나오는 서열에는 adapter sequence라는게 존재합니다. 이 adapter 서열은 원래 시퀀싱을 한 sample에서 나온 서열이 아니기 때문에 제거해 주는 과정이 필요한데 '454 options'에 있는 'Remove adapter sequence' 옵션이 항상 체크되어 있어야 합니다.

사용자 삽입 이미지

Illumina 데이터 불러오기
이번에 불러올 Illumina의 데이터는 paired-end read입니다. 검색위치에서 Illumina 데이터의 압축을 풀어놓은 폴더를 찾아간 후 forward 방향의 read 파일과 reverse 방향의 read파일을 둘다 선택 하시고, ‘General options'에 있는 ’Paired reads'라는 옵션을 체크해 줘서 이 read들이 paired-end read임을 인식하도록 해줍니다. 'Paired read' 옵션이 선택되면 ‘Paired read orientation'이라는 항목에 대한 옵션을 조정 할 수 있도록 활성화가 되는데 여기서 insertion size를 조정해 줍니다. 그리고 ’Next' 버튼을 클릭하고 저장할 위치를 설정한 후 ‘Finish' 버튼을 클릭하면 import가 완료됩니다.

사용자 삽입 이미지

de novo assembly 돌리기
Import가 완료되면 다음 그림과 같이 Roche와 Illumina 데이터가 각각 하나씩 나타나게 됩니다. Illumina 데이터의 파일은 두 개였지만 import 가 되면서 하나의 데이터로 합쳐진 것을 볼 수 있습니다.

사용자 삽입 이미지
데이터 준비가 완료되면 'Toolbox'에서 'High-Throughput Sequencing'에 있는 'De Novo Assembly'라는 툴을 더블클릭하여 실행 시킵니다. 첫 번째 화면에서 assemble 할 read 데이터를 선택하고 'Next'를 클릭합니다.

사용자 삽입 이미지
그 다음 단계에서는 de novo assembly를 하는데 필요한 몇 가지 옵션 값들을 선택하도록 되어 있습니다. CLC Genomics Workbench는 de Bruijn graph 라는 알고리즘으로 assembly를 합니다. 이 때 원래 read들을 더 작은 단편들로 만드는데, 이 단편들의 길이를 word size라고 부릅니다. ‘Automatic word size’를 체크하면 데이터의 크기에 따라서 정해진 word size로 assembly를 하게 됩니다. ‘Guidance only reads’는 scaffolding에 사용할 read를 설정하는 옵션으로 mate paired-end read를 선택해야 합니다. ‘Contig length’는 assembly된 contig 서열의 최소 길이를 설정하는 옵션이고, 'Perform scaffolding'은 만들어진 contig들과 가이드로 사용할 paired-end read를 가지고 더 큰 contig인 scaffold 서열을 만들 것인지 설정하는 옵션입니다. de novo assembly 옵션들의 설정이 완료되면 ‘Next'를 클릭합니다.

사용자 삽입 이미지
다음 단계의 옵션들은 mapping에 관련된 옵션들입니다. de novo assembly 하고 나면 일단 contig 서열들만 만들어 지게 됩니다. 이 contig 서열을 reference로 하여 read들을 mapping 시켜서 각 contig가 어떤 read들의 조합으로 만들어진 것인지 알 수 있게 합니다. ‘Update contigs' 옵션을 체크하게 되면 contig에 read가 mapping되는 정보가 contig 서열에 반영되게 됩니다. ‘Create simple contig sequences'를 선택하고 ’Next'를 클릭하면 이러한 과정 없이 contig 서열 들만 만들어 내게 됩니다. 옵션 설정이 완료되면 'Next'를 클릭하고 저장위치를 설정한 후 'Finish' 버튼을 클리하면 de novo assembly가 시작됩니다.

사용자 삽입 이미지
de novo assembly의 결과 데이터를 열어보면 다음과 같은 테이블을 볼 수 있습니다. 이 테이블은 각 de novo assembly의 결과로 만들어진 각 contig들의 정보를 보여 주며, 생성된 contig의 수, 각 contig의 길이, 각 contig에 mapping된 read의 수, 각 contig의 평균 coverage와 같은 정보를 알 수 있게 됩니다.

사용자 삽입 이미지
각 항목을 더블클릭하면 새 데이터 탭이 열리면서 해당 contig와 그 contig에 mapping된 read들의 mapping view가 나타나게 됩니다. 가운데 가는 실선으로 이어진 굵은 파란색 선은 paired-end read를 나타내고 연두색 선은 forward 방향의 single read, 빨간색 선은 reverse 방향으로 mapping 된 single read를 의미합니다. 각 read에서 세로 방향으로 그어진 작은 선들은 contig 서열과 다른 base로 conflict라고 부르며 A, T, G, C 각 염기 마다 다른 색깔로 표시 됩니다. de novo assembly를 할 때 이런 conflict가 많을 경우 sequencing 에러가 높다고 의심해 볼 수 있으며, 혹은 heterozygous 종의 지놈을 시퀀싱 했다고 추정해 볼 수 있습니다.

사용자 삽입 이미지

Reference assembly를 해보자!
앞에서 reference assembly가 원본 사진을 보고 퍼즐을 맞추는 것과 비슷하다고 말했습니다. Reference assembly는 말 그대로 reference가 되는 원본 서열에 read들을 mapping시켜 만들어지는 consensus 서열을 얻는 것을 말합니다. 예를 들어 한우의 유전체를 시퀀싱 하여 얻어낸 read 데이터를 NCBI에 공개된 소의 reference 서열에 mapping 시켜서 한우의 유전체와 어떤 차이가 있는지 비교하는 분석을 수행할 수 있을 것입니다.

이번에도 Roche 454 데이터와 Illumina의 데이터를 이용하되, 함께 압축되어 있던 E.coli 지놈 서열(NC_010473)을 reference로 두고 mapping 시켜 보도록 하겠습니다. Reference 서열 파일, NC_010473.gbk는 마우스로 클릭앤드래그하여 ‘Navigation Area’에 옮기면 자동으로 import가 완료 됩니다.

사용자 삽입 이미지
'Toolbox'에서 'High-Throughput Sequencing'에 있는 'Map Reads to Reference'라는 툴을 더블클릭하여 실행 시킵니다. 첫 번째 화면에서 assemble 할 read 데이터를 선택하고 'Next'를 클릭합니다.

사용자 삽입 이미지
다음 단계에서는 reference가 될 서열을 선택해 줍니다. 이 때 여러 개의 reference 서열을 지정할 수 있습니다. 예를 들어 human의 NGS 데이터를 전체 염색체에 mapping 시키고자 할 경우 22개의 상염색체와 2개의 성염색체, 그리고 필요에 따라 mitochondrial 염색체 서열을 선택해야 합니다. 선택이 완료되면 ‘Next'를 클릭합니다.

사용자 삽입 이미지
다음 단계에서는 mapping에 관련된 옵션들을 선택합니다. 크게 long read에 대하여 설정해야 하는 옵션과 short read 대하여 설정해야 하는 옵션으로 구분됩니다.

사용자 삽입 이미지
다음 단계에서는 일반적인 결과 처리에 관련된 옵션들을 설정합니다. 'Add conflict annotation'을 클릭하면 consensus서열과 다른 reference 서열의 염기에 'Conflict' 라는 annotation을 입혀 주게 됩니다. reference 서열의 크기가 크고 sequencing depth가 높을수록 비교적 conflict가 많이 발생하게 됩니다. 이 때 이 옵션의 설정을 체크하면 conflict 부분을 가시화 하는데 상당히 많은 메모리를 필요하게 되어 결과를 보는데 많이 시간이 필요하게 될 수 있습니다. 다음 옵션인 'Conflict resolution'은 conflict가 발생한 부분의 consensus 염기를 어떻게 결정할 것인지를 설정하는 옵션입니다. 그 리고 'Non-specific matches', 즉 reference 서열에 특정 부분에만 붙지 않고 다수의 부분에 붙는 read를 ‘Random'하게 붙일 것인지 ’Ignore'(무시) 할 것인지 설정 한 후 'Next'를 클릭합니다.

다음 단계에서 분석결과에 대한 report나 mapping 되지 않은 read들의 목록을 생성할 것인지, 결과를 저장할 것인지, 분석 로그를 생성시킬 것인지 등의 옵션을 설정합니다. 그 다음 단계에서 저장위치를 선택 후, 'Finish' 버튼을 클릭하면 reference assembly가 진행 됩니다.

사용자 삽입 이미지
Assembly가 완료되면 아래 그림처럼 mapping view가 나타나게 됩니다. 2개 이상의 reference 서열을 선택한 경우, 이전에 de novo assembly의 결과처럼 각 reference 서열 마다 간단한 정보와 함께 table 형태로 결과가 나타나게 되며, 각 항목을 더블클릭해 보면 mapping view를 보실 수 있습니다. de novo assembly 결과와는 다르게 consensus 서열 위에 reference 서열이 보이는 것을 보실 수 있습니다. 그리고 reference 서열에 있는 'Gene', 혹은 ‘CDS'와 같은 annotation들도 함께 보실 수 있습니다.

사용자 삽입 이미지


* 아래 이메일 주소로 연락 주시면 CLC Genomics Workbench의 모든 기능을 사용할 수 있는 데모 라이센스를 제공해 드리오니 많은 이용 바랍니다.

  - codes@insilicogen.com

Posted by 人Co

2012/04/13 09:36 2012/04/13 09:36
Response
No Trackback , No Comment
RSS :
https://post-blog.insilicogen.com/blog/rss/response/106



« Previous : 1 : 2 : 3 : 4 : 5 : 6 : Next »