흡연의 위험

정밀의료를 기반으로 하는 헬스케어에 관한 최근 의료계 및 산업계의 이슈로 인해 자연스럽게 사람들이 건강에 대한 관심도가 높아졌습니다. 특히 흡연의 위험성에 대한 인식이 변화되고, 담배가격 인상으로 인해 금연에 대한 관심이 많아짐에 따라 금연을 하려는 사람들이 증가하고, 이를 위해 정부에서도 금연치료프로그램을 지원하고 있습니다. 우리는 흡연의 위험성 면에서는 60년이 넘는 시간 동안 각종 암을 유발할 수 있는 가장 위험한 요인 중 하나라는 사실을 알아 왔고, 흡연의 경제적인 면에서는 흡연을 위해 담배를 구입하는 돈뿐만 아니라 흡연 결과 발생한 질환의 치료에 소요된 입원 진료비, 외래 진료비, 교통비, 보호자의 비용, 업무 손실에 따른 비용, 간접 흡연자들의 질환 치료비, 담뱃불로 인한 산불 피해 등이 있는 것을 알고 있습니다.


<Fig 1. 흡연하는_사진>
 


<Fig 2. 흡연의_피해>

 
이전부터 알고 있는 위 내용과 더불어 더 확실하게 흡연이 건강에 미치는 영향을 뒷받침해줄 수 있는 과학적 증거가 최근 사이언스 지에 발표되었습니다. 카이스트 연구진과 국외의 연구진들이 발표한 Mutational signatures associated with tobacco smoking in human cancer라는 제목의 논문인데, 이 논문의 내용은 흡연이 폐암·후두암·구강암 등의 원인이라는 점이고, 사람이 담배 연기를 들이마신 뒤 이 연기가 닿고 지나가는 곳에서만 독특한 형태의 유전자(DNA) 돌연변이가 일어난다는 것입니다. 지금까지는 흡연량과 암 발생의 상관관계를 통계적으로 분석하는 역학 조사로 흡연의 유해성을 입증해왔지만, 이번에는 담배가 암 발생에 어떤 작용을 하는지까지 밝혀낸 것입니다.
 


<Fig 3. 흡연으로_인한_유전자_변형>

 


<Fig 4. 흡연_시_변형될_수_있는_유전자_수>

특히 이 논문에서는 5천 명이 넘는 암 환자와 정상인의 유전자 염기서열을 비교 분석한 결과 흡연자인 암 환자의 경우 담배 연기가 직접 닿는 조직인 폐와 후두 등을 구성하는 세포의 유전자에 돌연변이가 많았다고 합니다. 돌연변이는 유전자를 구성하는 네 가지 염기 가운데 ‘시토신’(C) 염기가 ‘아데닌’(A) 염기로 변한 것이 대부분이었습니다. 이 돌연변이는 실험실에서 세포를 기른 뒤 발암물질인 ‘벤조피렌’에 노출하면 잘 생기는 유형입니다. 다시 말해 담배 속의 발암물질이 유전자에 직접 손상을 입힌다는 의미입니다. 다른 돌연변이로는 ‘티민’(T) 염기가 ‘시토신’(C) 염기로 변한 것이 있었는데 연구진은 이 돌연변이는 담배 속 발암물질이 간접적으로 영향을 끼쳐 생기는 것으로 추정했습니다. 요즘 이렇게 화두가 되는 흡연의 위험성에 대해 지금부터 나열해 보겠습니다.

1. 흡연이 건강에 미치는 영향
- 담배는 4,000여 화학물질로 이루어져 있으며, 60여 종의 발암물질이 함유되어 있다. 담배가 건강에 미치는 위해성은 50년 넘게 인식되어 왔다(IARC, 1986). 흡연은 심혈관 질환, 폐 질환 등의 심각한 질병을 유발하고 특히 각종 암의 중요한 원인이 된다. 선진국의 경우 전체 사망의 28%가 흡연에 기인하며, 전체 암 사망의 35%, 그리고 폐암 사망의 89%가 흡연에 기인한다(Peto 등, 1994). 2000년에는 흡연으로 인한 사망이 전 세계적으로 490만명 정도로 추산되며, 2030년에는 1,000만 명이 될 것으로 전망된다. “WHO, 2004”


2. 간접흡연
- 흡연은 자신의 건강을 해칠 뿐 아니라 주위 사람들의 건강에도 악영향을 미친다. 임신기간 동안 흡연을 한 산모의 경우 자연유산의 가능성이 크고, 저체중아 출산, 사산아 출산의 가능성이 크다. 또한, 흡연하는 산모에게서 태어난 유아들은 호흡기질환에 걸릴 위험이 크며, 성인의 경우도 만성적인 간접흡연은 폐암과 호흡기 질환, 심장 질환의 위험도를 높인다.
- 2011년도 국민건강 영양조사와 제7차(2011) 청소년 건강 행태 온라인조사 통계 자료에 의하면 주 1일 이상 가정 내 간접흡연 노출률은 청소년 39.6%, 성인 12.5%였고, 직장 내 간접흡연 노출률은 성인 45.2%로 나타났다.


3. 성장발달에 영향
청소년 흡연이 건강에 미치는 영향은 성인의 흡연보다 치명적이다. 단기적으로는 신체발육, 우울, 위험한 행동 등의 원인이 되며, 장기적으로는 흡연 관련 질병으로 인한 사망확률이 증가한다. 또한, 흡연이 20여 년의 시간적 격차를 두고, 본격적으로 피해를 발생시킨다는 점에서 청소년 흡연은 특히 중요한 의미가 있다. 즉, 2020년대의 흡연 피해 규모는 현재 30대 이후 세대의 흡연율에 의해 결정되며, 2030년대 이후의 흡연 피해 규모는 현재의 10대, 20대의 흡연율에 의해 결정된다(Peto 등, 2000). 따라서 우리나라 청소년의 높은 흡연율은 이들이 고령화되기 시작하는 2030년 후에 그 피해가 심각해지며, 이러한 흡연의 피해는 고령화와 더불어 상승 작용을 하게 될 것이다.


4. 기타영향
흡연으로 인한 질병 외에도 담배 재배로 인한 위험이 있다. 담배 재배자들은 젖은 담뱃잎과 접촉하여 니코틴이 피부로 흡수되어 생기는 녹색 담배병(GTS : Green Tobacco Sickness)을 호소한다. 그리고 해충과 질병으로부터 담배 식물을 보호하기 위하여 다량의 농약이 사용되는데 이는 담배 재배자의 건강에 피해를 주게 된다. 일례로 브라질에서 담배 재배 농가의 48%가 농약 관련 건강 문제로 고통을 받고 있었다. “WHO, 2004”



5. 흡연은 암(Cancer)을 유발한다.
- 흡연은 폐암, 식도암, 위암, 췌장암, 후두암, 인두암, 구강암, 신장암, 방광암, 자궁경부암, 백혈병 등 각종 암의 원인이 된다.
- 담배와 알코올을 동시에 사용할 경우, 후두암의 가장 주요한 원인이 된다.
- 저타르 담배도 폐암의 발생 위험을 낮춰주지 못한다.


6. 흡연은 심혈관질환(Cardiovascular disease)을 유발한다.
- 흡연은 심혈관질환으로 사망할 확률을 4배나 증가시킨다.
- 흡연은 동맥경화, 뇌졸중, 복부 대동맥류 등 심혈관질환의 원인이 된다.
- 담배와 알코올을 동시에 사용할 경우, 후두암의 가장 주요한 원인이 된다.
- 저타르, 저니코틴 담배라도 심혈관질환의 위험을 낮춰주지 못한다.


7. 흡연은 호흡기질환(Respiratory disease)을 유발한다.
- 흡연은 만성폐쇄성폐질환(COPD, Chronic Obstructive Pulmonary Disease)을 유발하는데, 미국인의 COPD에 의한 사망 중 90%는 흡연 때문이다.
- 흡연은 폐암의 가장 중요한 원인이 된다. 흡연자가 폐암에 걸릴 확률은 비흡연자의 20배 이상이다. 남자의 경우 폐암 사망의 90%, 여자 폐암 사망의 80%가 흡연 때문이다.
- 임신 중 흡연은 태아의 폐를 손상하고, 청소년기의 흡연은 폐의 성장을 지연시키며, 흡연은 만성 기침, 천식 등도 유발한다.


8. 흡연은 임산부와 태아에게 악영향을 미친다.
- 임신 중 흡연은 전치태반, 태반 조기박리를 유발하고, 태아에게 산소 공급을 감소시킨다.
- 임신 중 흡연은 저 체중아 출산 및 조 출산의 가능성을 높이며, 영아돌연사증후군(Sudden Infant Death Syndrome)을 유발한다.


9. 흡연은 건강 전반에 나쁜 영향을 미친다.
- 흡연자는 비흡연자에 비해 결근율이 높고, 의료이용이 많으며, 수술 후 회복이 늦고 합병증의 유발 가능성 또한 높다.
- 흡연은 백내장, 위궤양, 치주염, 고관절 골절 등의 질병 위험을 증가시킨다. 여성 흡연은 폐경 후 골다공증의 원인이 되며, 남성 흡연은 성기능장애의 원인이 되기도 한다.


이처럼 흡연은 건강한 삶에 있어서 위험한 요소입니다. 건강한 삶의 위험 요소인 담배를 끊을 수 있도록 도와주는 금연지원제도로는

1. 금연치료 의료기관의 금연치료 프로그램 이용 시 금연 상담료와 금연 치료약제 및 약국 금연관리료에 본인부담률 20% 수준, 금연치료프로그램에 3회 참여 시부터 본인부담금 전액 지원, 프로그램 최종이수 시 건강관리 선물 제공
2. 보건복지부에서 선정한 지역금연지원센터에서 찾아가는 금연지원서비스와 전문금연캠프 진행
3. 보건소의 금연클리닉에서 금연 상담 및 금연패치 등의 보조제 지원
4. 금연상담전화(1544-9030)를 통한 전문 상담사와의 상담 및 금연정보 제공 지원 등이 있습니다.
이러한 정부 지원 프로그램을 적절히 활용하여 금연에 도전하세요.

작성자 : DX팀 용승천 컨설턴트

Posted by 人Co

2016/12/09 16:06 2016/12/09 16:06
Response
No Trackback , No Comment
RSS :
https://post-blog.insilicogen.com/blog/rss/response/230

[모집공고] 人Co INTERNSHIP 2017 상반기



[모집분야]
지원대상 : 석·학사 기졸업자 또는 졸업예정자
지원기간 : 2016년 12월 7일(수) ~ 12월 16일(금)
지원서류 : 지원서(첨부된 당사 양식),
            성적증명서 및 졸업증명서(기졸업자 또는 졸업예정자 대상)
지원방법 : 지원서류를 메일로 발송 (recruit@insilicogen.com)

[전형일정]

1차 서류전형 : 2016년 12월 22일(목) 서류합격 발표 (개별연락)
2차 면접전형 : 2016년 12월 26일(월)
최종 합격자발표 : 2016년 12월 28일(수)
인턴근무지 : 본사
인턴기간 : 총 4주(2017년 1월 2일(월) ~ 1월 26일(목))
인턴혜택 : 1. 생물정보 기초 교육 커리큘럼
            2. 기업 공통업무 기본역량 습득
            3. 인턴십비 지급
            4. 수료증 발급
별도 공지사항 : 인턴십 기간 동안 정직원과 동일하게 출퇴근 규정 엄수
                 중도 이탈자 수료 불인정

[입사지원서 양식]

Posted by 人Co

2016/12/02 14:20 2016/12/02 14:20
Response
No Trackback , No Comment
RSS :
https://post-blog.insilicogen.com/blog/rss/response/229

들어가는 말

The Cancer Genome Atlas (TCGA)the Internal Cancer Genome Consortium (ICGC) 같은 대규모 암 유전체 연구 프로젝트를 통해 각기 다른 여러 기술적 플랫폼을 이용하여 다양한 형태의 데이터가 생산되고 있으며, 이러한 양질의 데이터를 자신의 연구에 활용하고자 하는 분들이 많을 것이라 생각한다. 그러나 전산적인 기술이 부족한 과학자들의 경우 유전체 데이터를 통합, 탐구, 분석하는 것이 쉽지 않은 일이다. 이러한 문제점을 해결하기 위하여 국가 단위의 연구 프로젝트 결과를 연구자들이 쉽게 활용할 수 있도록 분석 도구나 결과를 요약해 놓은 웹 페이지가 생겨나고 있다. 그중 암 유전체 연구에 있어서 매우 유용한 정보 사이트가 cBioPortal이다. cBioPortal은 암 유전체 연구자들의 데이터 접근장벽을 낮추기 위해서 개발되었으며 이를 이용하면 암 유전체 데이터로부터 새로운 생물학적 통찰력, 치료, 임상시험에 대한 단서를 얻을 수 있다.

cBioPortal에 대하여

cBioPortal은 다양한 층위의 암 유전체 데이터를 탐색하고 분석하며, 그 결과를 가시적으로 확인할 수 있는 온라인 포탈 사이트다. 자세히 설명하자면, 암 조직이나 세포로부터 생산될 수 있는 유전체, 후성 유전체, 전사체, 단백질 발현체와 같은 다양한 형태의 데이터를 연구자들이 이해할 수 있도록 분석, 정리하여 그 결과를 제공하고 있다. 샘플과 유전자, 그리고 pathway 정보들에 따른 유전적 변화를 관찰할 수 있고 그 결과는 임상 정보와 연계되어 있다. 포탈에서 제공하는 기능을 보면 유전적 수준의 결과를 네트워크 및 생존 분석, 환자 중심 정보와 같은 다양한 플랫폼에서 여러 방법으로 가시화하여 제공한다. 이 글을 통해서 cBioPortal에 대한 소개 및 실질적인 활용방법을 설명하여 사용자들이 필요한 연구에 잘 활용할 수 있도록 도움을 주고자 한다.

cBioPortal은 각 유전자, 샘플, 그리고 데이터 타입에 따라 시각화 및 분석을 가능하게 하여 다차원적인 암 유전체의 탐색을 용이하게 한다. 이를 통해 사용자는 암 연구의 샘플에 따른 유전자 변형 패턴을 시각화할 수 있으며, 다양한 암 종의 연구 결과에서 유전자 변이 빈도(gene alteration frequency)를 비교할 수 있다. 그리고 포탈에서는 생물학적 pathway 탐색, 생존분석, 유전자 변이 간의 상호 연관성 분석, 선별적 데이터 다운로드, 프로그래밍적 접근이 가능하며, 논문에 발표할 수준의 잘 정리된 시각화 결과를 제공한다.

cBioPortal에는 체세포 변이(somatic mutation), 유전자 수 증폭 또는 소실(DNA copy-number alterations, CNAs), mRNA와 microRNA(miRNA) 발현, 유전자 메틸화(DNA methylation), 단백질 또는 인산단백질(phosphoprotein)의 양과 같은 형태의 데이터가 통합되어 있으며, 데이터는 Cancer Cell Line Encyclopedia (CCLE) 같은 10개의 이미 논문화된 연구와 TCGA 파이프라인에서 현재 진행되고 있는 20개의 연구 결과가 포함되어 있다.

주요 검색기능 및 결과

cBioPortal에 있는 게놈 데이터는 웹 페이지에서 질의 또는 다운로드를 하거나 R이나 MATLAB과 같은 프로그램 패키지를 이용하여 접속할 수 있다. 사용자는 단일 연구 또는 여러 연구 결과에 대한 질의가 가능하고, 각각의 암 샘플에 관련된 유전적 변형도 확인해 볼 수 있다.

1. 질의 방법
cBioPortal의 첫 페이지를 보면 포탈에 있는 전체 암 종과 각 연구 프로젝트에 대한 정보가 트리 형태로 나와 있다(Fig 1). 사용자는 관심 있는 암의 종류와 암 종에 대한 각 연구 결과를 선택하고, 보고자 하는 유전자 정보(한 개 이상)를 넣고 검색을 실행한다. 연구를 선택할 때 단일 또는 여러 연구를 포함하여 질의가 가능하며 기존에 다른 사용자들이 정의한 유전자들(gene set)을 선택하여 진행할 수도 있다.

< Fig 1. 단일 연구 질의 실행방법 >


2. 질의 결과들
질의를 수행하고 나면 전체 결과의 요약 정보를 포함한 10개의 결과와 그 결과를 다운로드 받거나 즐겨찾기를 할 수 있는 정보들이 하위 메뉴 형태로 제공된다. 각각의 결과는 시각화되어 제공되고 직관적으로 수치적인 정보도 확인이 가능하다.

아래는 각각의 결과에 대한 정보이다.

2-1. OncoPrint
: OncoPrint는 각 실험정보에 대한 질의 유전자들의 변이 결과를 시각적으로 축약하여 표현한 결과이다(Fig 2). 각 유전자에 대한 변이정보, Copy Number Alteration(CNA), 유전자 또는 단백질 발현의 변화량을 색깔 별로 표현하여 보여주며 각 샘플에 대한 부가적인 정보는 블록에 마우스를 가져갔을 때, 확인할 수 있다.



< Fig 2. OncoPrint tab >


2-2. Mutual Exclusivity
: 암의 생물학적 기능은 다른 유전자나 다양한 기능의 작용에 의하여 조절된다. 이런 상황에 대한 유전자 간의 관계 정보가 상호 배타성(Mutual Exclusivity)이고, 이와 반대되는 개념이 동시 발생(co-occurrence)이다. 즉, 한 유전자의 발현이나 변이가 다른 유전자의 발현을 억제하거나 증가시키는 현상을 나타낸다. 두 유전자 간의 관련성은 odd ratio (OR)로 계산하여 제공하며 결과에 대한 신뢰성은 Fisher’s exact test를 통해 표현되어 있다 (Fig 3).

< Fig 3. The Mutual Exclusivity tab >


2-3. Correlation Plots
: cBioPortal에서는 유전자의 변이나 증폭, 소실에 대한 결과뿐 아니라, mRNA, 단백질 발현량 또는 DNA methylation과 같은 결과 간의 관계도 시각화하여 보여주는데 correlation plot 결과가 이에 해당한다. 사용자의 선택에 따라 각 유전자에 대한 다른 데이터의 관련성을 다양한 그래프의 형태로 보여준다. 각 유전자의 발현 패턴과 질병과의 연관성을 확인할 수 있고, 여러 샘플 중 어느 샘플에서 유전적 변이가 발생했는지 찾을 수 있어 매우 유용하다(Fig 4). 그 결과는 그래프에서 마우스를 점에 갖다 대면 자세한 정보를 확인할 수 있다.

< Fig 4. The Plots tab >


2-4. Mutations
: 변이(Mutation) 결과에서는 각 유전자의 nonsynonymous 변이정보(아미노산 서열이 변경된 경우)를 볼 수 있는데, Pfam protein domain 정보를 토대로 모든 변이의 단백질에서의 위치와 종류, 변이가 일어난 샘플 정보 등을 확인할 수 있다(Fig 5).

< Fig 5. The Mutation tab >

2-5. Survival
: 암 유전체 연구에서 중요한 정보 중 하나가 변이 발생과 환자의 생존과의 연관성이며, 이것을 확인할 수 있는 방법이 생존율 분석(survival analysis)이다. 생존율 분석은 Kaplan-Meier 방법으로 계산하며, Disease-free survival은 더 이상 암이 진행되지 않는 환자를 대상으로 생존율을 계산한 결과이다(Fig 6).

< Fig 6. The Survival tab >

2-6. Network
: Network는 암에서 변이가 발생한 유전자들 간의 연관성을 network 형태로 보여주는 결과이다(Fig 7). Human Reference Protein Database (HPRD), Reactome, NCI, 그리고 Memorial Sloan-Kettering Center (MSKCC) Cancer Cell Map의 유전자간의 상호 연관성 정보를 가지고 network를 보여주며, 유전자의 변이가 많은 유전자일수록 붉은색으로 표현된다. 오른쪽 메뉴에서 선택하면 cancer와 연관되어 있거나 FDA에 승인을 받은 약물과의 연관성도 동시에 확인할 수 있다.

< Fig 7. The Network tab >


글을 마치며

유전자의 염기해독 기술이 급속도로 발전함에 따라 시간적, 비용적인 지출이 줄어들고 있으며, 이로 인해 기존에 진행되었던 암 유전체 연구의 스케일이나 결과가 매우 빠르게 증가하고 있다. 이와 더불어 암과 같은 질병은 한가지 요인보다 다양한 요인들에 의해 생겨나고, 그 원인을 찾고 치료하기 위해서는 다양한 형태의 데이터 분석을 통해서만 실마리를 찾을 수 있다는 것이 다수의 견해이다. 대단위의 암 유전체 데이터를 분석하려면 암에 대한 전공지식뿐만 아니라 전산적, 통계적 지식과 기술이 필수적이나 모든 연구자가 그러한 능력을 갖추는 것은 단시간 내에 불가능한 것이 사실이다. 그동안 나름대로 생물정보학적인 연구를 진행했었던 경험으로 볼 때, 자신의 연구분야에 대한 최신 정보를 습득하는 일도 쉽지 않은 상황에 기초부터 생물 정보학을 연마하는 것은 시간 낭비일 수 있다고 보며, 앞서 소개한 것처럼 관련 전문가들이 구축한 정보들을 우선하여 살펴보고 그 이후에 어떻게 자신의 연구와 연결할 것인지를 고민해보는 것이 현실적으로 현명한 판단이라 생각한다. cBioPortal 이외에도 많은 유용한 정보가 온라인에 공개되고 있으니 많은 연구자들이 잘 활용하여 좋은 연구 결과의 결실로 연결되기를 바란다.



작성자 : Codes실 오태윤 책임컨설턴트 

Posted by 人Co

2016/11/25 17:04 2016/11/25 17:04
Response
No Trackback , No Comment
RSS :
https://post-blog.insilicogen.com/blog/rss/response/228

ISMB 2016 참석 후기

습하고 무더웠던 지난 7월 여름, 미국 플로리다주 올랜도에서 생물정보학 및 시스템 생물학 선도하는 ISMB(Intelligent Systems for Molecular Biology) 2016 학회가 있었습니다. 많은 분들이 참석하고 싶어했으나 올해에는 저와 이규열 팀장이 대표로 포스터 발표를 위해 참석하였습니다.



미국은 거대하고 다양한 볼거리가 많기에 평소 제 버킷리스트 중 하나였지만, 복귀 후 처리해야 할 업무를 생각하면 쉽지 않은 결정이었습니다. 특히 올랜도라는 지역은 2016년 성 소수자를 향한 총기 난사 사건이라는 좋지 않은 기억이 강하게 남아있었습니다.

어찌되었건 처음 무거웠던 마음을 내려놓으니 해외라는 기대와 설렘이 생겼고 학회참석을 위해 7월 7일 새벽 미국행 비행기에 올랐습니다. 군대 행군을 생각하면, 14시간 정도야 무어가 힘들겠냐는 섣부른 자신감과 그간 밀린 잠이나 실컷 자야겠다는 안일한 생각으로 시작된 비행은 2시간도 채 안 되어 저려오는 무릎과 쑤셔오는 허리, 끊어질 것 같은 목의 통증이 시작되었고 이동하는 동안 불만이 많았던 KTX의 편안함을 깨달을 수 있었습니다.

직항이 없는 까닭에 미국 댈러스에서 비행기를 갈아탔는데, 도착 당일 댈러스 백인 경찰을 향한 저격으로 흑백갈등 시위 및 집회의 소식은 저를 불안하게 했지만, 플로리다는 이래도 되나 싶을 정도로 조용하고 편안한 일상이 계속되고 있었습니다.

2003년 사스(SARS)로 전 세계가 공포에 떨고 있을 때 정작 당사자인 중국에선 별로 대수롭지 않게 생각하고 조용했던 것처럼 정작 본인은 괜찮은데 주변에서 너무 법석을 떤 것이 아닌가 생각이 들었습니다.


< 체크인 하고 받은 출입키와 안내서들 >

첫날 예약한 숙소는 학회가 열리는 스완&돌핀(Swan & Dolphin) 호텔에서 차로 20분 정도 떨어져 있는 힐튼 호텔이었습니다. 역시 관광도시라 그런지 숙소 주변은 온통 푸르고 깨끗하고 영화에서 봤던 모습 그대로여서 한국에 남아있는 걱정 따윈 순식간에 잊을 수 있었습니다. 여장을 풀고 가볍게 산책이나 하고 저녁이나 먹을까 싶어 숙소 근처에 있는 디즈니 스프링스라는 곳을 한 바퀴 휙 돌았는데 볼거리가 너무 많아 저녁 10시까지 걷는 강행군을 할 수밖에 없었습니다. 역시 디즈니 세상은 아이들의 꿈과 모험을 불러일으킬 수 있는 온갖 볼거리와 쇼핑거리를 선보여 주었고, 이를 보며 시종일관 고국에 두고 온 아들이 정말 좋아했을 텐데라며 아쉬워하는 한 아버지의 모습을 지켜보고 있자니 부성애가 무엇인지를 조금이나마 알 수 있었습니다. 유아용 미키마우스 면티를 하나씩 사 들고 숙소로 복귀한 후 48시간이나 되었던 길고 긴 첫날 하루를 마무리하였습니다.


< 만족스러운 크기의 공짜 커피 >

이튿날 숙박객에게 제공하는 공짜 커피 쿠폰으로 커다란 커피를 하나씩 들고 학회가 열리는 스완&돌핀 호텔로 이동했습니다.호텔에 도착한 후 간간이 돌아다니는 사람 중에 등 뒤에 포스터가 들어있을 것으로 추정되는 둥글고 기다란 통을 메고 어리둥절한 표정으로 어디로 가야할 지 고민하는 사람들이 보였기에 제대로 찾아왔다는 걸 재확인할 수 있었습니다. 학회 첫날이어서 그런지 학회 접수장은 예상과 달리 한산한 풍경이었고, 다소 의외였지만 줄도 안 서고 기다리지 않아도 되니 다행이란 생각이 들었습니다.


< 학회 참가 접수장 전경 >

접수를 마치고 누구나 그렇듯 학회 안내책자를 펼쳐 어떤 것들이 있나 확인하고 들을 만한 세션 선별을 위해 스케줄 표를 살펴보는데, 각 세션을 테마별로(Data, Disease, Genes, Systems 등) 친절하게 아이콘으로 표시되어 있어 동그라미 치는 데 상당히 도움이 되었습니다. 별거 아닌 거에 UX의 중요성을 느끼는 순간이었습니다. 학회 이름에 걸맞게 빅데이터나 가시화 같은 주제들이 적잖이 있어 상당한 기대감으로 일정을 잡았습니다.


< 메인 컨퍼런스 오프닝 행사장 >

학회 진행이나 프로그램은 이전 내용과 크게 달라지진 않은 것 같습니다. 학회 3일간의 일정은 하루가 시작되면 아침과 저녁으로 1시간씩 Keynote 발표를 하고, 5가지 형식(OP, WK, SS, TP, TT)으로 구성된 세션 발표가 있는데 TP(Technology Paper)의 경우는 각각 20분씩 진행됩니다. 세션 발표가 모두 끝나면 포스터 발표로 하루 일정이 마무리되는 형식이었습니다.

< 키노트 발표 모습 >

3일 동안 있었던 여섯 편의 키노트 발표는 각 분야에서 이름이 알려진 연사들이 최근의 이슈와 현재 진행 중인 연구들을 발표하여 참석자들의 많은 관심을 받았습니다. 암이나 단백질에 대한 심도 있는 연구보다는 생물정보 기술의 전반적인 소개와 최근 주목받는 머신러닝과 인공지능에 대한 컴퓨팅 알고리즘이나 질병 진단 자료를 이용한 텍스트마이닝을 통한 질병 관계 정보 확인 등에 관심이 갔고, 앞으로는 역학과 유전체가 함께 갈 수밖에 없지 않겠냔 생각이 들었습니다.

< 테마별 Technology Presentation >

테마별 세션발표는 주로 유전체와 단백질체에 대한 연구분야에서 알고리즘을 이용한 속도 향상과 대용량 데이터 처리를 위한 다양한 기술을 소개하고 있었습니다. 단백질 패스웨이 분석의 경우는 Spark 이용한 것도 있었고, PubMed와 GO 등 이미 생물정보 분야에선 기본이 되는 DB에 대한 텍스트마이닝 결과를 어떻게 효과적으로 통합해 유용한 결과를 만들어 낼 것인지에 대한 연구 결과도 보이고, 문헌데이터에 대한 생물정보 기반의 텍스트마이닝과 자연어처리 기술을 적용해 단백질 네트워크 분석 등에 적용된 사례를 보며 텍스트 역시도 데이터로서 충분한 가치가 있음을 확인할 수 있었습니다.

NGS 분석 및 네트워크 분석을 주제로 하는 것에선 효과적인 가시화 방법을 공유하고 싶었으나 안타깝게도 데이터베이스 구축에 관한 내용이 주가 되고 이렇게 표현되었다 정도의 설명뿐이라 다소 아쉽기도 했습니다. 가시화 부분은 아직까진 전산 엔지니어의 영역에 의지할 수밖에 없는 듯 합니다.

Deep Genomics란 곳에선 리암 니슨 닮은 분이 나와 그룹에서 진행하고 있는 Deep Binding 연구분야를 소개하고 앞으로의 비전을 제시하며, 생긴지 몇 년 안 된 그룹으로 현재 20여 명 정도로 앞으로도 생물정보 인력 충원을 위한 구인 중임을 어필했는데 불특정인을 대상으로 하는 구인광고 보다는 이렇게 직접 대상을 찾아와 함께하기를 권유하는 것이 더 효과적인 방법이지 않을까 싶고 학회를 어렵고 딱딱하게만 느끼는 저로선 처음 보는 모습이라 적잖이 신선해 보였습니다.


< Oral Presentation 을 위한 소회의장 >

첫날 Oral Presentation 세션은 어떻게 진행되는지 궁금해 주제와 상관없이 2명의 연사가 발표하는 것을 들었는데, 발표는 질문까지 포함해 5분 안팎으로 끝났던 것으로 기억합니다. 제가 들었던 것은 RNA 실험 및 분석 프로토콜에 관한 것으로 실험을 기반으로 하는 발표였기에 생물학 기본이 부족한 상태라 자료를 미리 보고 갈 필요가 있음을 느꼈습니다.

< 가시화 도구 포스터와 발표장 풍경 >

포스터 발표는 A부터 P까지 카테고리로 굵직굵직하게 구분해 전시되었는데, 주로 암을 대상으로 하는 질병 유전체 분석, 변이분석, 서열분석, 네트워크 분석을 위한 알고리즘과 시스템 환경 구축 등 다양한 시도들을 소개하고 있었습니다. 적잖은 포스터에서 클라우드 기반의 분석결과를 제시하는 것을 보았는데 이제 생물정보를 위한 시스템 환경은 클라우드가 필수가 된 거 같습니다.

현재 수행 중인 과제에 도움이 될까 싶어 대용량 데이터 분석과 가시화를 위한 도구를 개발하고 소개한 포스터에 그나마 관심을 두고 유심히 확인해 보았는데, 그래픽 분석은 Apache Spark를 이용하는 것이 이제 대세가 된 듯합니다. 대부분이 분산환경에서 Spark를 실행하고 결과를 출력해 보여주는 도구들을 소개하고 있었습니다.

학회 일정이 끝나고 발표시간에 제대로 이해하지 못해 확인할 것들만 잔뜩 만들어서 돌아오게 되어 스스로를 한탄할 수밖에 없었지만, 개인 맞춤형 유전체 분석 시대를 위한 전세계 연구자들의 노력 결과가 차츰 구체화 되고 있음을 눈으로 확인할 기회였으며, 앞으로도 지금처럼 생물정보 전문가들에 의한 다양한 주제가 다루어져 유용한 결과들을 접할 수 있는 학회가 되기를 바라며, 참석 후기를 마칩니다.


이미지 출처
- ISMB 2016 홈페이지 : https://www.iscb.org/ismb2016

성자 : 대전지사 Development팀
양성진 책임개발자

Posted by 人Co

2016/11/11 10:00 2016/11/11 10:00
Response
No Trackback , No Comment
RSS :
https://post-blog.insilicogen.com/blog/rss/response/227

어느새 무더운 여름이 지나고 서늘한 가을이 찾아 왔습니다. 어떻게 지난 여름 잘 버티셨나요? 이번 여름은 그 어느 해 보다 더 덥게 느껴지면서 사회적으로도 누진세 같은 이슈가 화제되곤 했었습니다.
어떻게 보면 우리 (주)인실리코젠도 더위와 싸우는 기업입니다. 좀 더 정확히 말하자면 서버실에 있는 분석 및 스토리지 서버들이 더위와 맞서 싸우고 있습니다. 대용량의 생물정보 데이터 분석을 위해 수십대의 분석 서버들이 열을 내며 24시간 쉬지 않고 일을 하고 있답니다. 이 열을 제대로 식혀주지 않으면 서버들은 곧 강제 종료되고 장시간 실행중이던 분석 작업도 중단되며 저장중이던 데이터나 장비에 치명적인 문제가 발생할 수도 있습니다.
 
<열화상카메라... 가 없어서 구한 다른 서버실의 열화상 카메라 사진>
 

그러다 보니 서버실의 더운 공기를 식히고 순환시켜주는 에어컨이나 공조장치들의 역할이 중요합니다. 보통은 에어컨에 적정온도를 맞춰 두고 24시간 가동하여 이런 문제를 대비하지만 언제나 그렇듯 사고는 예상치 못할 때 발생합니다.

의외로 이런 사고는 경험상 여름보다는 겨울이나 초여름에 잘 발생했습니다. 지난 겨울에는 실외기가 너무 추운 바깥 공기에 얼어붙어 버려서 냉매의 순환에 문제가 생겨 차가운 바람이 충분히 나오지 않는 문제가 생겼습니다. 그리고 보통 겨울에는 여름보다 조금 높은 온도를 에어컨에 설정해 두는데 갑자기 더위가 찾아오는 초여름에 너무 높아진 온도에 비해 충분히 차가운 바람을 내지 못하면서 서버실의 온도가 높아진 적도 있습니다.

이런 사고를 몇 번 겪었을 무렵 세상은 IoT(Internet on Things) 열풍이 불기 시작했습니다. 그중에서도 저의 관심을 끌었던 장비가 바로 라즈베리 파이(Raspberry Pi) 입니다. 라즈베리 파이는 영국 잉글랜드의 라즈베리 파이 재단이 학교와 개발도상국에서 기초 컴퓨터 과학의 교육을 증진시키기 위해 개발한 신용카드 크기의 싱글 보드 컴퓨터입니다. 크기는 작지만 하드디스크 대신 SD카드를 사용하고 HDMI 포트로 모니터와 연결도 가능하며 LAN포트도 있어서 인터넷 연결도 되는 엄연한 컴.퓨.터 입니다.

<스마트폰 보다 더 작은 컴퓨터, 라즈베리파이>

라즈베리 파이의 장점은 일반 USB 포트뿐만 아니라 다양한 통신 포트도 제공해서 여러가지 센서들도 제어할 수 있다는 점입니다. 예를 들어서 전기 신호를 켜고 끄도록 프로그램을 만들면 발광 다이오드에 불을 켤 수도 있고, 작은 모터를 동작 시킬 수도 있습니다. 초음파 센서나 감광센서를 이용하면 누군가 센서 앞을 지나가는 것을 알 수도 있습니다. 이젠 정말 좋은 아이디어가 있으면 누구나 직접 만들어 낼 수 있는 세상이 온 것입니다.


<다양한 센서를 조합하면 구현하지 못할 아이디어가 없다>

저는 이 라즈베리 파이에 몹시 흥미를 느꼈습니다. 그리고 이 작은 컴퓨터를 이용해 회사가 겪고 있는 어떤 문제를 해결하는데 사용하고 싶었습니다. 바로 우리 서버실을 높은 온도로부터 지켜줄 수 있는 장치를 만들고 싶었습니다.

저는 이 프로젝트의 이름을 Rainbow Guard Project 라고 이름을 지었습니다.

보통 서버들은 host name이라고 부르는 별명을 가지고 있습니다. 보통은 node0, node1, node2 이렇게 이름을 짓거나 소속 기관의 영어 약자로 붙여주곤 합니다. 디자인에 강한 우리 인실리코젠은 각 서버들의 성격에 맞는 색을 이름으로 지어 줬습니다.

  • 강력한 파워를 자랑하는 분석 서버에게는 BLACK
  • CPU가 많아 언제나 많은 분석량을 자랑하는 서버에게는 RED
  • 많은 고객이 찾아오는 웹사이트를 운영하는 서버에는 GREEN
  • 테스트를 많이 해서 정신이 오락가락한 서버에게는 PURPLE

Rainbow Guard Project 이렇게 다양한 색깔의 레인보우를 지켜주겠다는 의미를 지닙니다.

<애네들이 생각 나도 모른척 하세요, 아~재 소리 듣습니다...>

Rainbow Guard Project는 크게 3부분으로 나뉩니다.

1. 서버실의 온도를 체크하고 기록
2. 특정 온도 이상으로 온도가 올라갈 경우 서버실 관리자에게 경고 메일 발송
3. 24시간 동안의 서버실 온도 현황 조회

첫 번째 기능을 위해 먼저 라즈베리 파이와 온도센서를 연결하는 작업을 진행했습니다. 기왕이면 평상시 정상 작동 때와 온도가 높을 때를 구분할 수 있도록 LED도 있으면 좋겠네요. 이런 기능을 위한 회로도를 설계해 보고 납땜질도 하면서 깔끔하지는 않지만, 동작은 하는 온도 감시 및 알림 회로를 만들어 라즈베리 파이와 연결하였습니다. 저도 V=IR이라는 공식밖에 모르지만, 열심히 구글링하고 공부하면서 만들 수 있었습니다.

<PPT로 회로 설계도면을 만들고, 겨우겨우 납땜해서 만든 모듈>

리눅스에는 crontab 이라는 스케줄러가 있는데요, 온도센서의 값을 읽어와서 저장하는 프로그램을 만든 후 이 crontab의 스케줄에 추가해 주면 정기적으로 온도 감시가 진행됩니다. 덤으로 온도가 높아 졌을때 서버실 밖에 있는 사람들이 빨리 알아챌 수 있도록 음악이 나오게 셋팅해 뒀습니다. 경고 상태에서 나오는 음악은 f(x)의 'Dangerous' 입니다. 듣기만 해도 위험한 상태라는걸 알 수 있게 해줍니다.


<원래는 마이클잭슨의 Dangerous를 재생 시키려고 했는데 음원을 못 구해서...>

경고 상태가 되면 설정된 서버실 관리자들에게 다음과 같은 메일이 발송됩니다. SMS 문자를 보낼 수도 있지만, 유료 서비스라서 메일을 보내도록 설정해 뒀습니다. 어짜피 스마트 시대에 메일이 오든 문자가 오든 틈틈이 확인하는 습관이 있어서 상관은 없습니다.

마침 이 글을 작성하는 동안 경고 메일을 수신했습니다. 앞서 말씀드린 것처럼 봄, 가을 같은 환절기에는 에어컨의 적정온도가 변경되어 간혹 이런 경고가 발생하기도 합니다. 이번에는 날씨가 선선해 지면서 건물 중앙 관리 시스템이 적정온도를 조금 높이다 보니 서버실의 온도가 높아져 경고가 발생했습니다. 서버실 자체 에어컨의 온도를 조금 더 낮춰 해결하였습니다.

<토요일 새벽 6시에 경고 메일을 받은 서버관리자가 긴급 출동하여 초기에 대처>
 

경고 알림 메일에 있는 URL을 클릭하면 지난 24시간 동안의 온도 현황을 그래프와 함께 볼 수 있는 웹페이지로 이동하게 됩니다. 이 사이트는 Python Django를 이용하여 구현하였습니다. 제가 디자인 감각은 꽝이라서 정말 필요한 정보가 보이게끔만 만들어 봤습니다. 지금은 회사 동료들과 함께 조금씩 예쁘게 업그레이드하는 중입니다.


<저의 html 레벨은 15년 전에 멈춰 있습니다...
(그렇다고 배경에 보노보노를 넣고 싶진 않았어요 ㅠㅠ)>


이렇게 경고 알림 메일을 받으면 몇몇 직원들이 급히 서버실로 출동하여 상태를 점검하고 위기의 우리 서버들을 더위로부터 구출해 냅니다. 제가 납땜질이 서툴러서 회로의 한 부분이 끊어져 잠시 운영하지 못한적도 있지만 지금은 24시간 서버실에서 제 역할을 하고 있는 중입니다.


<일부러 서버실에서 더운 곳에 둬서 빨리 경고가 울리도록 설치>
 
위에서도 잠시 언급했지만 저는 주입식 교육을 통해 V=IR이라는 공식만 기억하는 동물세포 실험실 출신의 생물학 전공자입니다. 하지만 다양한 분야의 융합을 통하여 가치를 생성해 나가는 생물정보 분야의 동료들과 함께 일하면서 새로운 분야에 대한 도전 의지도 키울 수 있었던 것 같습니다. 잘 모르는 분야라도 꾸준히 보고, 듣고, 배우다 보니 생물학 너머 다양한 분야의 기술과 노하우를 배울 수 있었습니다. 그렇다고 아주 잘 하는 건 아닙니다. 생물 정보 분석을 위한 넓고 얕은 지식 정도 되겠네요. 여러분들도 생물정보 분석을 하면서 리눅스, 코딩, 통계 등의 난관에 부딪혀 많이 힘든 상황을 겪으실 것 같습니다. 하지만 포기하지 말고 꾸준히 밀고 나가다 보면 경계 너머의 다양한 즐거움을 느끼게 되실 거라고 믿습니다.  
 

<이미지 출처>
  • IDC HOWTO - http://idchowto.com/?p=12787

  • RayHightower.com - http://rayhightower.com/blog/2012/12/03/ruby-on-raspberry-pi/

  • SUNFOUNDER - https://www.sunfounder.com/rpi2-sensorv2.html

  • 후레쉬맨 - http://blog.daum.net/gkglh16/3

  • f(x) - http://ppulset.tistory.com/552


작성자 : BS실 SP팀 심재영 선임 컨설턴트

Posted by 人Co

2016/10/31 18:33 2016/10/31 18:33
Response
No Trackback , No Comment
RSS :
https://post-blog.insilicogen.com/blog/rss/response/226



« Previous : 1 : ... 28 : 29 : 30 : 31 : 32 : 33 : 34 : 35 : 36 : ... 75 : Next »