« Previous : 1 : 2 : 3 : 4 : 5 : 6 : ... 38 : Next »

최근 미국의 전기차 기업 테슬라에서 사내 CCTV가 해킹당해 회사 내부의 모습이 노출되는 사건이 있었습니다. 또 송유관 운영회사 콜로니얼 파이프라인이 랜섬웨어 공격을 받아 시스템이 마비되어 수많은 자동차가 연료를 공급받지 못해 대혼란에 빠지는 사태가 발생하기도 했습니다. 두 사건 모두 해킹으로 벌어진 일입니다.


[그림 1] CCTV 해킹으로 인해 노출된 테슬라 회사 내부
 
해킹 사고는 주로 소프트웨어(SW) 보안취약점을 공격 경로로 이용합니다. 소프트웨어 보안취약점이란 소프트웨어 개발 시 결함이 될 수 있는 논리적인 오류나 버그, 실수 등 이후 취약점으로 발생할 수 있는 근본 원인을 말합니다. 시스템에 보안취약점이 존재하고 그로 인해 정보가 노출된다면 해커는 해당 정보를 이용해 시스템을 공격하는 것입니다. 그럼 개발자는 어떻게 해커들의 공격을 방지할 수 있을까요? 이를 위해 '시큐어코딩(Secure Cording)'이 필요합니다.
 
 
 
시큐어코딩이란 무엇인가요?
 

[그림 2] 코딩 화면
 
시큐어 코딩은 해킹 등 사이버 공격의 원인인 보안취약점을 제거해 안전한 소프트웨어를 개발하는 SW 개발 기법을 말합니다. 개발자의 실수나 논리적 오류로 인해 발생할 수 있는 문제점을 사전에 차단하여 대응하고자 하는 것입니다. 정보보호가 SW 개발의 중요한 주제로 떠오르는 지금 시큐어 코딩은 선택이 아닌 필수가 되었습니다.
 
 

시큐어 코딩 가이드
 
시큐어 코딩은 개발단계에서 적용되기 때문에 개발자의 코딩 작업이 핵심 대상이 됩니다. 그러나 개발자로서 취약점을 모두 고려하는 프로그래밍이란 어려운 일입니다. 따라서 어떠한 규칙에 따라 코딩을 하면 되는지에 대한 기준이 있으면 좋을 것입니다. 그리고 실제로 국내에서는 2012년 12월부터 행정안전부에 의해 시큐어 코딩에 대한 법규가 제정, 시행되어 그 기준을 제시하고 있습니다.
 

[그림 3] 행정기관 및 공공기관 정보시스템 구축·운영 지침
(출처:행정안전부고시 제2021-3호, 2021.1.19.)

그리고 그 기준은 다음과 같이 50개의 소프트웨어 보안 약점 항목으로 구성되어 있습니다.


[그림 4] 소프트웨어 개발 보안 가이드
(행정안전부고시 제2021-3호, 2021.1.19.)
 
이번 블로그 시간에는 소프트웨어 개발 보안 가이드를 기반으로 시큐어코딩의 7가지 유형에 대해 살펴볼 것입니다. 개발 경력이 없으신 분들도 이해할 수 있도록 최대한 쉽게 설명하겠습니다. :)



1. 입력데이터 검증 및 표현
 
입력데이터 검증 및 표현이란 폼 양식의 입력란에 입력되는 데이터로 인해 발생하는 문제를 예방하기 위해 점검하는 보안 항목을 의미합니다. 쉽게 말해서 사용자가 비정상적인 데이터를 입력하여 시스템에 손상을 주거나 정보를 수정 및 탈취하지 못하도록 방지하는 것입니다. 이는 주로 SQL 인젝션(SQL Injection) 공격을 막기 위한 코딩이라고 할 수 있습니다. SQL(Structured Query Language)은 DB 관리에서 가장 중요한 핵심 요소로 실제로 저장된 데이터를 수정, 삭제, 삽입할 수 있는 기능이 있습니다. 예를 들어 은행 업무 시스템에서는 SQL을 이용해 계좌의 잔액을 조절한다고 볼 수 있는 것입니다. 이토록 중요한 SQL이 악의적인 해커 마음대로 실행될 수 있다면... 정말 치명적인 문제가 될 것입니다. 이를 방어하기 위해 사용자가 입력한 데이터를 확인해 공격 시도로 의심되는 단어를 치환하거나 차단하는 방식을 이용합니다. 이것이 바로 입력데이터 검증 및 표현의 가장 핵심요소라고 말할 수 있겠습니다.

[그림 5] 안전하지 않은 코드의 예 JDBC API
 

안전하지 않은 코드의 예로, 외부에서 받는 데이터인 'gubun'의 값을 검증 없이 사용하고 있습니다. 이 경우 gubun의 값으로 a' or 1=1 이 들어간다면 board 테이블의 전체 데이터가 조회됩니다.



[그림 6] 안전한 코드의 예 JDBC API

안전한 코드의 예로, 파라미터를 받는 PreparedStatement 객체를 상수 스트링으로 생성하고 파라미터 부분을 setString 등의 메소드로 설정해야 합니다.



2. 보안 기능
 
보안 기능이란 소프트웨어 개발 구현단계에서 코딩하는 기능인 인증, 접근제어, 기밀성, 암호화 등을 올바르게 구현하기 위한 보안 항목을 의미합니다. 주로 암호와 같이 중요한 정보를 암호화 없이 저장하거나 프로그램 내부에 하드 코딩되어 노출의 위험성이 있는 경우, 인증과 권한 관리를 부적절하게 구현할 시 발생하는 문제가 있습니다. 서두에 말씀드린 테슬라 해킹 사건이 이 항목에 해당합니다. 해커가 이중인증시스템의 취약점을 파악하고 이를 이용해 보안 체계를 우회한 것입니다. 보안 기능은 비인가 접근을 방어하고 저장된 정보를 암호화하여 취약한 기능이 존재하지 않도록 하는 것이 중요하다고 말씀드릴 수 있겠습니다.
 


3. 시간 및 상태
 
시간 및 상태는 동시 또는 거의 동시 수행을 지원하는 병렬 시스템이나 하나 이상의 프로세스가 동작하는 환경에서 시간 및 상태를 부적절하게 관리하여 발생할 수 있는 보안 약점입니다. 프로그래밍을 하다 보면 하나의 자원을 다수개의 프로세스가 사용해야 하는 경우가 생깁니다. 이때 자원 공유가 적절히 진행되지 않아 프로그램이 꼬일 수 있게 됩니다. 예를 들어, 프로세스 A는 ①파일이 존재하는지 확인하고 ②파일을 읽는 과정을 진행합니다. 프로세스 B는 파일을 삭제합니다. 만약 프로세스 A의 과정①이 진행되고 과정②가 시작되기 전 프로세스 B가 파일을 삭제해버린다면 프로세스 A가 삭제된 파일 읽기를 시도하므로 *레이스컨디션이 발생합니다. 이 밖에도 종료되지 않는 반복문이나 재귀문을 사용하여 무한루프에 빠지는 것도 시간 및 상태 점검 항목에 포함됩니다.

*레이스컨디션(Race Condition): Race Condition은 두 개 이상의 프로세스가 공용 자원을 병행적으로(concurrently) 읽거나 쓸 때, 공용 데이터에 대한 접근이 어떤 순서에 따라 이루어졌는지에 따라 그 실행 결과가 달라지는 상황을 말한다.


 
4. 에러 처리
 
에러 처리는 이름 그대로 에러를 처리하는 방식이 부적절하거나 누락되어 발생하는 보안 항목을 의미합니다. 종종 개발자가 디버깅의 편의성을 위해 에러 메시지를 화면에 출력하는 경우가 있습니다. 에러 메시지는 시스템과 관련된 중요 정보를 포함하는 경우가 많아 공격자의 악성 행위를 도울 수 있습니다. 또한, 오류가 발생할 상황을 적절하게 검사하지 않았거나 잘못된 처리를 한 경우도 에러 처리 항목에 포함됩니다. 에러 처리는 가능한 최소한의 정보만을 담고 있어야 하며, 광범위한 예외 처리보다는 구체적인 예외 처리를 통해 보안 공격을 사전에 방어하는 것이 중요합니다.
 

[그림 7] 안전하지 않은 코드의 예 에러처리
 
안전하지 않은 코드의 예로, try 구문에서 예상되는 예외 상황을 catch 하지만, 그 오류에 대해 추가로 아무 조치를 하지 않고 있습니다. 이런 상황이라면 사용자는 프로그램 내부에서 어떤 일이 일어났는지 전혀 알 수 없게 됩니다.

[그림 8] 안전하지 않은 코드의 예 에러처리
 
예외 catch 후 적절한 조치를 수행한 예
 


5. 코드 오류
 
코드 오류는 구현 단계에서 개발자의 실수나 지식 미달로 인한 오류를 예방하기 위한 점검 항목입니다. 주로 형(Type)변환 오류, 자원 반환, NullPointer 참조가 이에 해당합니다. 이 부분은 개발 경험이 없는 경우 이해하기가 조금 어려우실 수 있습니다. Null 값을 체크하지 않고 변수를 사용한다든가 실수로 스레드와 같은 자원을 무한하게 할당하여 시스템에 부하를 주는 경우가 있습니다. 개발자가 잘못된 코딩 습관을 들인다면 코드 오류 항목에서 번번이 보안 취약점에 걸리게 됩니다. 본인만의 보안 코딩 규칙을 만들어서 습관을 들이는 것을 추천합니다.



6. 캡슐화
 
캡슐화란 객체 지향 방법론에 중요한 개념으로 객체와 필드의 은닉을 통해 외부의 잘못된 사용을 방지하는 것을 의미합니다. 그런데 가끔 시스템의 데이터나 기능을 불충분하게 캡슐화하거나 잘못된 방법을 이용함으로써 보안 취약점으로 작용하는 경우가 있습니다. 부적절한 캡슐화는 정보은닉의 기능을 잃어버립니다. 시스템의 중요 정보가 노출되어 공격자는 이 정보를 이용해 식별 과정을 우회할 수 있습니다. 변수 제어 함수가 노출된다면 공격자는 원하는 값으로 데이터를 외부에서 수정할 수 있게 됩니다.


 
7. API 오용
 
API(Application Programming Interface)란 응용프로그램에서 사용할 수 있도록 운영체제나 프로그래밍 언어가 제공하는 기능을 제어할 수 있게 만든 인터페이스를 뜻합니다. 이렇게만 설명하면 명확한 개념이 잘 떠오르지 않습니다. 쉽게 말씀드리면 API는 프로그램들이 서로 소통하는 것을 도와주는 매개체 역할을 합니다. 음식점에서 주문을 받고 서빙을 해주는 웨이터에 비유할 수 있죠. 이렇듯 개발자는 편리하게 개발하고 유용한 정보를 얻기 위해 API를 활용합니다. 그러나 의도된 사용에 반하는 방법으로 API를 이용하거나, 보안에 취약한 API를 이용한다면 심각한 보안 취약점이 될 수 있습니다. 예를 들어, 만약 공격자에 의해 로컬 DNS 캐시가 오염된 상황에서 DNS만 확인한다면 공격자의 네트워크로 경유하거나 공격자의 서버를 도착지로 인식할 수도 있습니다. 이를 방지하기 위해 보안에 취약한 API 사용은 피해야 하며 DNS가 아닌 IP를 확인하는 것이 중요합니다.
 


마치며
 



지금까지 소프트웨어 개발 보안 가이드 시큐어 코딩 7가지 유형에 대해 알아보았습니다. 실제로 개발 보안 가이드를 보시면 더욱 자세한 내용을 확인하실 수 있습니다. 개발 단계뿐만 아니라 분석, 설계 단계의 보안 기법도 자세히 설명되어 있기에 꼭 한번 읽어보시는 것을 추천해 드립니다.

앞으로 디지털 트랜스포메이션과 IoT를 비롯한 SW 시장은 더욱 확대될 것입니다. 하지만 우리가 구성한 네트워크가 보안 위협의 통로가 될 수 있다는 것을 잊지 말아야 합니다. 이제 민관기관에서도 시큐어 코딩을 적극적으로 채택하고 있다고 하니, 시큐어 코딩에 대한 전문성을 길러보시는 것은 어떨까요? :) 오늘 내용이 여러분에게 많은 도움이 되셨길 바랍니다.
 


Posted by 人Co

2021/05/28 16:33 2021/05/28 16:33

[Webinar] 제7회 유전체 데이터 분석 교육

Posted by 人Co

2021/05/28 15:56 2021/05/28 15:56
Response
No Trackback , No Comment
RSS :
https://post-blog.insilicogen.com/blog/rss/response/382

가상 환경의 기업을 꿈꾼다! Gather.Town



오늘은 비대면 플랫폼이 속속 등장하고 있는 현시점에서, 재택근무 중 사내 직원들과의 소통, 고객사와의 소통을 위한 플랫폼에 대하여 블로그를 작성해보았습니다.
코로나 19가 사그라지지 않고 계속되기 때문에 많은 기업이 재택근무를 시행하게 되었습니다. 저와 같이 일하던 몇몇 분들은 재택근무로 자리를 비우게 되어 의사소통이 어려워졌습니다.
이런 불편한 점을 해결해 줄 수 있는 기술이 있습니다. 언제, 어디서나 가상 공간의 형태로 실시간 소통을 주고받을 수 있는 장소를 만들어주는 서비스인 Gather.town(개더 타운)이 바로 그것입니다.


기존의 화상 회의 서비스

아무래도 코로나 19사태로 가장 큰 활용도를 보여준 서비스는 화상 회의 서비스인 Zoom, Team, Google Meet 등이 아닐까 싶습니다. 특히 Zoom은 학교 화상 서비스를 이용해 수업을 진행하고 많은 기업에서 일대일 혹은 다대다 의사소통을 진행하기 위해 사용되고 있는 서비스입니다. 하지만 기존 화상 회의 서비스의 문제점이 다양하게 존재했습니다. 장시간 화상 통화를 하게 되면 극심한 피로를 가져온다고 합니다. 그래서 Zoom Fatigue(줌 피로)라는 단어가 생겨났습니다.


[그림 1] Zoom Fatigue 


 
'장시간의 화상 통화는 피로를 유발한다.'
Zoom Fatigue(줌 피로)

최근 마이크로소프트에서 화상 회의 후 사람들이 극심한 피로감을 느낀 점에 대해 수치로 조사하여 공개하였습니다. 화상 회의를 하면 모니터의 본인 얼굴과 계속 마주하며 부담감과 피곤함을 느껴 계속 신경이 쓰일 수밖에 없게 됩니다. 이처럼 실시간 감시가 이루어지는 환경에서는 휴식이 자유롭게 보장되는 경우가 거의 없다고 합니다. 이러한 문제를 보완하기 위해서는 30~45분마다 휴식을 취하고 화면에서 벗어나 음료를 마시고 5분 동안 신선한 공기를 마시거나 워밍업(warming-up) 시간이 필요하다고 밝혔습니다.

이와 같은 경험으로 발표할 때 목소리로만 발표하는 것보다 직접 얼굴을 비쳐 발표하는 것이 피로감이 더 크다고 느낀 바가 있으며,
프레젠테이션이 끝났을 때 기운이 빠지는 것으로 보아 해당 수치에 많은 공감이 되었습니다.

[그림 2] 마이크로소프트에서 조사한 줌 피로 수치
 


Gather.Town(개더 타운)


[그림 3] Gather.Town
하지만 이러한 Zoom fatigue를 예방할 수 있는 획기적인 화상 회의 서비스가 나타났습니다. 바로 개더 타운(Gather.Town)인데요. Zoom이나 Teams와 같은 화상 회의 솔루션의 일종이지만, 개더 타운은 가상 공간과 아바타를 적극적으로 도입한 것이 특징입니다.
예를 들어, Office라는 가상 공간을 만들고, 각 참여자는 고유한 아바타를 가지고 가상 공간을 공유를 받은 후 다른 아바타에 접근함으로써 그 사람과 화상 회의를 할 수 있습니다.

이처럼 새로운 방식으로 일대일 화상 회의는 물론 다대다 화상 회의도 가능합니다.
다양한 가상 공간의 UI를 사용자가 직접 만들 수 있고, 자신만의 캐릭터들도 꾸밀 수 있습니다.
개더 타운에서의 다양한 기능을 활용한다면 기존 온라인 콘퍼런스가 단방향 세미나 형태에 가까웠던 것을 다양한 장소에서 콘퍼런스를 진행할 수 있기에 가치가 높게 평가되고 있습니다.

[그림 4] 개더 타운 화상회의 사진
 


현실 세계의 규칙을 담은 개더 타운!

개더 타운은 마치 게임처럼 방향키를 사용해 아바타를 움직이면서 다양한 가상공간을 이동할 수 있고, 모임의 성격에 따라 캠퍼스, 루프탑, 공원 등 다양한 맵을 제작할 수 있게 되어 화상 회의를 지루하지 않게 진행할 수 있습니다.
또한, 다른 메타버스 서비스들과는 달리 가상 오피스에서도 현실 세계의 규칙을 그대로 적용했다는 점이 가장 인상 깊었습니다!
직접 카메라를 켜고 이야기를 할 수 있으며, 아바타 간의 거리가 서로 멀어질수록 화면도 흐려지고, 소리도 점점 작아집니다.
그래서 같은 공간 안에서도 특정 사람들과 소통이 필요할 때, 따로 소회의실을 만들지 않아도 아바타를 움직여 바로 모임을 할 수 있다는 장점이 있습니다.

개더_타운_UI.gif
[그림 5] 개더 타운 UI
 


직방, 원격 근무 상시화... "오프라인 출근 없앤다"

직방에서는 본사 사무실 운영을 중단하고, 비대면 원격 근무를 상시화해 업무 환경의 디지털 전환에 선제로 대응한다는 방침이라고 합니다. 코로나 19로 시작된 원격 근무가 기본 근무 형태로 자리 잡는 모습이며 서비스로 개더 타운을 도입해 활용 중이라고 합니다.
개더 타운을 이용하면서 전통적인 오프라인 출근 혹은 사무실 개념이 없어지고, 약 200여 명의 전 직원이 원하는 장소에서 근무하게 됩니다. 또한, 수도권 거점별로 직방 라운지를 개설해 운영한다고 합니다. 직방 라운지는 외부 근무나 오프라인 행사가 있으면 직원들이 자유롭게 방문해 사용할 수 있는 공간으로 꾸려진다고 합니다.
 
이처럼 코로나 19사태로 인해 변화된 사태에 대해서 빠르게 대처하는 모습에 인상 깊었습니다.
사무실과 흡사한 가상 공간이 생긴다면 좀 더 의사소통이 수월해질 수 있다 판단했습니다.
이처럼 코로나 19사태가 지속화되거나 혹은 원격 근무가 기본 근무 형태로 자리 잡게 된다면 개더 타운의 전망이 밝을 것이라 생각합니다.
 
[그림 6] 직방, 온라인 가상업무 공간 개더 타운
 


개더 타운 전망

2020년 말부터 재택근무를 도입한 기업이 늘어나면서 실리콘밸리에서 시작한 가상 오피스 서비스인 개더 타운은 메타버스 기반 화상 회의 서비스로 큰 성장력을 보여주고 있습니다.
이미 실리콘밸리의 대다수 기업에서 도입하여 사용하고 있으며,"여러 가지 상황에서 이용할 수 있고 기능이 다양해 좋다"라는 호평을 받고 있습니다.
개더 타운의 가장 큰 장점으로는 장소의 제약이 없으며 대기업 혹은 신생기업에서 개더 타운의 가상 공간을 통해 비용을 절감할 수 있다고 생각했습니다.
 


마치며

개더 타운은 메타버스의 기술 중 하나이며, 코로나 19 상황을 맞아 비대면 도구로 일상을 파고들고 있습니다. 이미 SK텔레콤, 넥슨, Naver 등의 다양한 기업들이 메타버스의 기술에 관심을 보입니다.
메타버스 기술들이 질서 있게 사회에 정착된다면 분야에 상관없이 많은 부분에서 활약할 수 있을 것이라는 생각합니다.

마지막으로 개더 타운을 활용해 인실리코젠을 만들어보았으며 몇 가지 장점들을 적으며 글을 마치겠습니다.
첫 번째로 접근성이 뛰어났습니다.
사용자가 사용하기 전에 여러 가지 절차를 겪어야 한다면 해당 서비스를 이용하기에는 연령대별로 불편함을 느낄 것으로 생각합니다.
하지만 개더 타운은 가상 공간의 링크를 만들고 해당 링크로 접속할 때 간단한 아바타 명과 접속하기 위한 비밀번호만 기재한다면 쉽게 누구나 참여할 수 있습니다.

두 번째로 재현성이 훌륭했습니다.
공간을 만들 때 public 공간과 private 공간을 나눌 수 있으면서 개인적인 대화의 프라이버시를 지킬 수 있었습니다.
또한, 거리감에 따라 목소리의 들리는 정도가 잘 구현되어 실제 환경에서 대화하는 듯한 느낌을 받았습니다.

마지막으로 딱딱한 화상 회의 서비스보다 재미있는 환경과 아기자기한 분위기를 연출한 것에 대해 정말 높게 평가하고 싶습니다.
이처럼 원격 근무의 단점들을 보완해서 나온 개더 타운을 사용한다면, 기업 분위기를 높일 수 있다고 생각하고 더 좋은 환경에서 근무할 수 있다 생각합니다. :)


[그림 7] 인실리코젠 개더 타운



참고자료
작성 : BS실 이병준 개발자

Posted by 人Co

2021/05/15 19:57 2021/05/15 19:57
, , , , ,
Response
No Trackback , No Comment
RSS :
https://post-blog.insilicogen.com/blog/rss/response/381

나만 알고 싶은 OmicsBox



'유전체 데이터는 점차 쌓여가고···쌓여가는 데이터 처리는 해야겠고···이왕 처리하는 거 효율적으로, 내가 원하는 방향으로 처리하고 싶은데···심도 있는 분석은 또 어떻게 진행해야 하는 걸까···' 이런 의문 품어보신 적 다들 있으시죠?! 있을 겁니다! 저 또한 그랬으니까요!

제 경우에는 OmicsBox라는 솔루션이 저의 이러한 의문을 해소해주었습니다. 제가 OmicsBox를 처음 접한 건 바야흐로 대학원 시절. 그 당시에는 OmicsBox로 리뉴얼 되기 전인 Blast2GO 버전이었습니다. 저는 그 당시 De Novo Transcriptome 분석을 진행했었고, BLAST 분석 이후의 후속 분석인 Functional Analysis(GO, KEGG, InterProScan)를 Blast2GO를 이용하여 진행했었습니다.

만약 그 당시의 저에게 Blast2GO가 없었다면, 저는 아마 졸업을 못 했을 겁니다. (생각만 해도 끔찍하네요.)
서론이 길었네요 :D 자, 그럼 이렇게 저를 무사히 졸업시켜주는데 일조했던 OmicsBox(구 Blast2GO)! 과연 어떤 기능을 하는 생물정보 솔루션인지 이제부터 차근차근 알아볼까요?



나만 알고 싶은 OmicsBox

OmicsBox 기능을 알아보기 전에 OmicsBox는 무엇인지에 대해 먼저 알아보겠습니다.

OmicsBox는 새로운 genome 분석을 위한 최고의 생물정보학 플랫폼(Platform)임과 동시에 산업, 학술 및 정부 연구기관의 생물학자를 위한 사용자 친화적인 생물정보학 데스크톱 애플리케이션(Desktop application)입니다. 이러한 OmicsBox는 기능 유전체학의 선두주자로서 세계적으로 인정받고 있으며, 이는 7,000개 이상의 과학 연구 인용으로 입증되었습니다. 또한, OmicsBox는 genomics, transcriptomics, metagenomics의 NGS 데이터 분석에 최적화(de novo 파트)되어 있으며, 필요에 따라 데이터 분석에 필요한 다양한 모듈(Module)을 결합하여 사용할 수 있습니다.


[그림 1]. OmicsBox OverView

  • 아래는 OmicsBox의 주요 기능을 나열해 봤는데요,
  • 클라우드 플랫폼(Cloud platform)을 활용한 애플리케이션(Application) 고속 실행 및 견고하고 안전한 백엔드(Back-end) 제공
  • Blast 결과의 Gene Ontology mapping
  • Functional Annotation
  • InterProScan domain 검색
  • GO-Slim Reduction
  • KEGG map mapping
  • 통계 정보 차트
  • 다양한 데이터의 import와 export format 지원
  • Eukaryote, prokaryote에 알맞은 model을 이용한 유전자 부위 예측
  • 발현값을 이용한 pairwise/time course 별 분석
이뿐만 아니라 OmicsBox는 아래와 같은 강력한 장점도 가지고 있습니다.



Advantages of OmicsBox

Powerful Tables



[그림 2]. Powerful Tables
풍부한 사용자 인터페이스(Interface)를 통해 대용량 데이터세트를 쉽게 처리할 수 있고, 모든 테이블은 필터링과 정렬을 할 수 있으며, 가장 중요한 것은 다른 결과 세트와 결합할 수 있다는 것입니다. 또한, 후속 분석 단계의 하위 집합을 쉽게 생성하고 추출할 수 있습니다.

Workflows


[그림 3]. Workflows

Workflow manager를 사용하여 생물정보학적 workflow를 생성, 실행 및 저장할 수 있으며, 선택한 분석 단계를 끌어와 workflow를 생성하고 모든 파라미터(Parameter)를 한 곳에서 구성하고 검토할 수 있습니다.
  
Genome Browser


[그림 4]. Genome Browser

Genome Browser는 여러 트랙(Track)을 통해 alignment(.bam), gene annotation(.gff) 및 variant 정보(.vcf)를 결합할 수 있습니다. 그뿐만 아니라 navigation, 필터 및 검색 옵션을 사용하여 쉽고 탐색적인 방법으로 결과를 확인할 수 있습니다.

Omics Cloud Platform



클라우드 플랫폼(Cloud platform)은 대부분의 무거운 작업이 수행되는 OmicsBox에 견고하고 안전하며 자동 확장이 가능한 백엔드(Back-end)를 제공합니다. 또한, 이 시스템을 사용하면 표준 PC에서 매우 까다로운 생물정보학 애플리케이션(Application)을 고속으로 실행할 수 있습니다.
 
자 어떤가요? 전반적으로 OmicsBox에 대해 간략히 알아보았는데, 글을 읽다 보니 내 데이터를 어떻게 처리하면 좋을지 구상이 잡히셨나요? {OK} 아직 잘 안 잡히셨다고요? 괜찮습니다.:-)
이제부터 설명해 드릴 OmicsBox의 4가지 모듈을 살펴보고 나면 구상이 잘 잡히실 겁니다.
그럼 한번 살펴볼까요?



Four modules of OmicsBox


[그림 6]. Four modules of OmicsBox

Genome Analysis
  • Quality Control : 샘플의 품질 관리를 수행하기 위해, FastQC와 Trimmomatic을 사용하여 Reads를 필터링하고, low quality bases를 제거할 수 있습니다.
  • De Novo Assembly : ABySS를 기반으로 하는 assembly 기능을 통해 reference genome 또는 특정 하드웨어(Hardware) 요구 사항 없이 전체 genome sequence를 재구성할 수 있습니다.
  • Repeat Masking : 다운스트림(Down-stream) 유전자 예측을 개선하기 위해 RepeatMasker를 사용하여 진핵생물 genome의 반복적이고 복잡성이 낮은 assemble된 DNA sequence를 마스킹(Masking)할 수 있습니다.
  • Gene Finding : Genome 구조를 특성화하기 위해 원핵생물(Glimmer 사용) 및 진핵생물(Augustus 사용) 유전자 예측을 수행할 수 있으며, 진핵생물 유전자 예측은 RNA-seq 인트론 힌트를 지원합니다.
  • Genome Browser : 트랙(Track) 형태로 annotation을 시각화하여 genome sequences(.fasta), alignments(.bam), intron-exon structure(.gff) 및 variant data(.vcf)와 결합할 수 있습니다.

Transcriptomics
  • Quality Control : 샘플의 품질 관리를 수행하기 위해, FastQC와 Trimmomatic을 사용하여 Reads를 필터링하고 low quality bases를 제거할 수 있습니다.
  • De Novo Assembly : Reference genome 없이 de novo transcriptome을 생성하기 위해 Trinity 프로그램을 이용하여 짧은 Reads를 조립할 수 있습니다.
  • RNA-Seq Alignment : 초고속 유니버설(Universal) RNA-seq aligner인 STAR를 사용하여 RNA-seq 데이터를 reference genome에 alignment 할 수 있습니다.
  • Quantify Expression : HTSeq 또는 RSEM을 사용하여 reference genome의 유무와 관계없이 gene 또는 transcript 수준에서의 발현을 정량화할 수 있습니다.
  • Differential Expression Analysis : NOISeq, edgeR 또는 maSigPro와 같이 잘 알려진 다양한 통계 패키지(Package)를 사용하여 실험 조건 간 또는 시간이 지남에 따라 차등적으로 발현된 유전자를 검출할 수 있습니다. 또한, 풍부한 시각화는 결과를 해석하는 데 많은 도움이 됩니다.
  • Enrichment Analysis : 차등 발현 결과를 functional annotation과 결합함으로써, Enrichment 분석은 과잉 및 과소 표현된 생물학적 기능을 식별할 수 있도록 해줍니다.

Metagenomics
  • Quality Control : 샘플의 품질 관리를 수행하기 위해, FastQC와 Trimmomatic을 사용하여 Reads를 필터링하고 low quality bases를 제거할 수 있습니다.
  • Taxonomic Classification : Kraken에서 현재의 종(세균, 고세균, 바이러스)을 식별하고, 다단계의 Pie chart인 Krona와 샘플 간의 비교 막대 그래프로 결과를 시각화할 수 있습니다.
  • Metagenomics Assembly : 클라우드(Cloud)에서 빠르고 쉽게 대규모 데이터세트를 조립하기 위해 MetaSPAdes와 MEGAHIT 중에서 선택할 수 있습니다.
  • Gene Prediction : 가능 유전자와 단백질을 식별하고 추출하기 위해 일반 Reads에는 FragGeneScan, 조립된 데이터에는 Prodigal을 사용할 수 있습니다.
  • Functional Interpretation : EggNOG-Mapper 및 PfamScan을 사용하여 높은 처리량의 functional annotation을 얻을 수 있고, 결과를 GO graph 및 chart로 시각적으로 표현하고 비교할 수 있습니다.

Functional Analysis
  • High-Throughput Blast and InterProScan : CloudBlast 및 CloudInterProScan을 사용하여 선택한 reference 데이터세트에 대해 빠른 sequence alignment 및 domain 검색을 수행할 수 있습니다.
  • Gene Ontology Mapping : UniProt 및 Gene Ontology Consortia의 최신 데이터베이스에서 사용 가능한 functional annotation을 사용하여 잠재적인 homologous와 domain을 연결할 수 있습니다.
  • Blast2GO Annotation : Blast2GO 방법론을 사용함으로써, source annotation 품질 및 ontology 계층을 고려하여 가장 신뢰할 수 있는 기능 label을 새로운 sequence 데이터세트에 유연하게 할당할 수 있습니다.
  • Enrichment Analysis : 서로 다른 enrichment 분석 방법 (Fisher Exact Test 및 GSEA)을 사용하여 과다 및 과소 표현된 분자 기능을 식별할 수 있습니다.
  • Functional Interpretation : 다양한 시각화를 통해 annotation process를 평가할 수 있을 뿐만 아니라 실험 및 기능 분석 결과의 생물학적 해석을 도울 수 있습니다.

Genome 분석, Transciptome 분석, Metagenome 분석 받고 Functional Annotation 분석까지! NGS 분석 대부분 분야를 섭렵한 OmicsBox, 어떠신 것 같나요? 구상이 어느 정도 잡히시고 있나요? 점점 OmicsBox 매력에 빠져들고 계신가요? :))
그럼 이쯤에서 이런 질문을 던질 수도 있습니다. "Genome 분석, Transcriptome 분석, Metagenome 분석, Functional Annotation 분석까지 기능은 매우 좋은데 어떻게 이용해야 할지 잘 모르겠어요···"
걱정하지 마세요! 저희에게는 앞서 언급되었던 장점 중 하나인 workflows가 있습니다!



OmicsBox Workflows

Genome Analysis Workflows
  • Eukaryotic Genome Analysis Workflow
  • Prokaryotic Genome Analysis Workflow
  • Long Reads Eukaryotic Genome Analysis Workflow
  • Long Reads Prokaryotic Genome Analysis Workflow

[그림 7]. Eukaryotic Genome Analysis Workflow
 

Transcriptomics Workflows
  • De Novo Transcriptome Characterization Workflow
  • Transcript-level Analysis Workflow
  • Gene-level Analysis Workflow



[그림 8]. De Novo Transcriptome Characterizatioin Workflow
 

Metagenomics Workflows
  • Taxonomic Classification Workflow
  • Functional Annotationi Workflow



[그림 9]. Taxonomic Classification Workflow
 

Metagenomics Workflows


[그림 10]. Functional Analysis Workflow
 
Raw data만 넣어주고, 각 단계의 파라미터(Parameter)만 잡아주면~ 자동으로 output까지 산출되는 workflow! 참으로 간단하죠? {OK}
OmicsBox workflow만 있으면 어렵던 유전체 데이터 분석이 앞으로는 재미있게 느껴질 수 있습니다.



마치며
이번 포스팅(Posting)에서는 OMICS 데이터 분석을 용이하게 해주는 생물정보학 솔루션 OmicsBox에 대해 알아보았는데요. Genome 분석부터 Functional Annotation 분석까지 많은 기능이 있는 아주 매력적인 솔루션이라고 생각이 됩니다. 더군다나 어떤 기능을 어떻게 사용해야 하는지 잘 모르더라도 강력한 기능인 workflow가 있어서 손쉽게 output을 얻을 수도 있구요. 만약 NGS 데이터 분석이 아직 어렵고 낯설게 느껴지는 분들이 계신다면 이번 포스팅의 주인공인 OmicsBox를 강력! 추천해 드립니다. 후회하지 않으실 거에요 :D
 
만약 OmicsBox와 친해지고 싶으시다면 consulting@insilicogen.com으로 메일 주세요.
친절히 안내 드리도록 하겠습니다.
마지막으로 긴 글 읽어주셔서 감사드리며, 모두 건강한 나날 보내시길 바랍니다.
감사합니다.
 
OmicsBox : BIOINFORMATICS MADE EASY


Posted by 人Co

2021/04/30 17:17 2021/04/30 17:17
, , , , , ,
Response
No Trackback , No Comment
RSS :
https://post-blog.insilicogen.com/blog/rss/response/380



바이오-인공지능 기술을 실용적 소프트웨어로!


㈜인실리코젠은 첨단 바이오기술을 in-silico 상에서 구체화하고 가치를 만들어내는 선도기업입니다. 최근의 인공지능, 빅데이터 기술과 결합하여 의료계와 농림식품수산업계 등 바이오 산업 전반에 무한한 가능성을 제공하고 있습니다. 생명과학의 최신지식과 기술, 데이터를 의미기반 모델링하고, 예측 모델을 만들고, 성능을 개선하고, 사용자 인터페이스를 만드는 전체 과정에서 소프트웨어 기술의 중요성은 아무리 강조해도 지나치지 않습니다.
당사는 파이썬, R 언어로 데이터 분석, AI 모델을 구축하며, 파이썬 백엔드(django) API와 반응형 웹, Flutter, Android를 이용한 모바일 앱 개발을 주력으로 하며, 사내 Gitlab 프로젝트 관리하에 지속적 통합(CI)과 동료 간 코드리뷰를 기본 개발환경으로 활용합니다.   

귀하의 SW 개발 능력을 바이오-인공지능 분야에 발휘하고 싶은 분들과 함께하고 싶습니다.


[채용분야]

파이썬(Python) 프로그래머
- 지역 및 인원 : 본사(용인) 0명(신입, 경력)
- 담당업무 : Django 백엔드 서버 개발

Jupyter, pandas 데이터 분석, AI 모델 개발
- 자격요건 : 파이썬을 이용한 데이터 분석/웹 개발 경험

HTML / CSS / JavaScript 기본 활용 가능
- 우대사항 : 오픈소스 개발 경험 (Github 계정 공유)

반응형 웹 프론트엔드 개발 경험

모바일 앱 프로그래머
- 지역 및 인원 : 본사(용인) 0명(신입, 경력)
- 담당업무 : 모바일 앱 개발

Android, iOS 개발
Flutter 개발
- 자격요건 : 모바일 앱 개발 경험(Flutter 우대)
애플 앱스토어, 구글 플레이에 모바일 앱 등록 경험
- 우대사항 : 오픈소스 개발 경험(Github 계정 공유)


웹 퍼블리셔 / UI 개발자 / Front End Developer
- 지역 및 인원 : 본사(용인) 0명(신입, 경력)
- 담당업무 : 웹퍼블리싱

UI 개발
- 자격요건 : HTML5/CSS3 기본 지식

웹표준, 웹접근성을 고려한 마크업
반응형 웹, 크로스브라우징 이슈 개선 가능
(경력) 관련 업무 2년 이상- 우대사항 : Bootstrap 활용 및 Git사용

CSS 전처리기(SCSS) 사용
번들러 사용 경험
디자인 & 협업도구(XD, 포토샵, slack 등) 기본 활용
JavaScript를 활용한 동적구현 가능
Django 프로젝트 경험
인근거주자


[전형절차]

1. 서류전형 : 2021.04.28(수) ~ 2021.05.14(금)
     - 입사지원서(당사양식)
     - 포트폴리오 제출(자유 형식, URL포함)
     - 서류전형 합격자에게만 1차 면접 요청(이메일 통지)

2. 1차 실무자 면접 : 2021.05.10(월) ~ 2021.05.18(화)

     - 제출한 포트폴리오로 5분간 자기소개 PT 진행
     - 1차 면접 합격자에게만 2차 면접 요청(이메일 통지)

3. 2차 임원 면접  : 2021.05.17(월) ~ 2021.05.21(금)
     - 2차 면접 합격자에게만 3차 추가서류 제출 요청(이메일 통지)

4. 추가서류 제출  : 2021.05.20(목) ~ 2021.05.27(목)
     - 하단 제출서류 참고


5. 최종합격 통보 : 2021.05.28(금) 예정
     - 입사예정일 : 2021.06.27(월)


[채용형태]
신입(인턴 3개월 계약 포함), 경력(경력에 따라 수습계약 포함)


[근무환경]
- 근무제 : 주 5일 근무
- 복리후생 : 4대 보험, 퇴직연금 및 성과급, 유연근무제 (장기근속자)
- 휴가제 : 연차, 경조휴가, 충전휴가(장기근속자)
- 지원 : 경조사비, 주차비, 교육훈련비, 도서 등 지원


[접수방법]
서류제출방법 : E-mail 첨부 제출 (ms@insilicogen.com)


[제출서류]
1) 서류전형 시
 ① 자사 입사지원서 : 파일명 `입사지원서_성명_지원분야.docx`로 저장
 ② 개인정보 이용 동의서 포함

2) 1차 면접전형 시(서류전형 합격자에게만 1차 면접 요청_이메일 통지)
 공통 : 포트폴리오(PDF) 제출 및 발표(자기소개 및 경력 위주 내용, 5분 이내)

3) 3차 서류 제출(2차 면접 합격자에게만 3차 추가서류 제출 요청_이메일 통지)
 ① 공통 : 건강검진확인서 및 병력확인서 제출
 ② 경력지원 시
  - 전 근무지의 근로자 원천징수 영수증(퇴사연도, 직전연도)
  - 고용보험이력확인서 : 고용보험 사이트에서 발급 가능

Posted by 人Co

2021/04/27 15:28 2021/04/27 15:28
Response
No Trackback , No Comment
RSS :
https://post-blog.insilicogen.com/blog/rss/response/379

메타버스에서-NFT(non-fungible-token)-가-만드는-마켓플레이스_20210413.gif

최근에 메타버스(Metaverse) 관련 기사, 디지털 화폐(digital currency) 관련 용어가 구글 트렌드(Google Trends)에서 급격하게 많아졌습니다.
블록체인(Blockchain) 기술의 발전으로 스마트 컨트렉트(Smart contract), Defi(Decentralized finance), 메타버스, NFT(non-fungible token)와 같은 용어들이 자주 언급되면서 간단하게나마 그 중의 가장 최근 붐(Boom)을 일으킨 메타버스와 NFT에 대해서 소개하겠습니다.





새로운 입학식이 생겼습니다. 바로 가상입학식입니다. 신종 코로나바이러스 감염증(COVID-19) 장기화로 각종 행사가 비대면으로 전환된 가운데 순천향대학교는 대면 입학식 대신 가상 입학식을 진행하였습니다. VR(Virtual Reality) 플랫폼(platform)을 통해 본교와 흡사한 맵으로 구현된 가상 공간에서 신입생들의 아바타(Avatar)가 참여하였습니다. 이렇게 현실이 아닌 가상 공간을 '메타버스'라고 말합니다. 메타버스란 초월(meta)과 우주(universe)에 합성어로 우주를 넘어서는 세계 즉, 3차원 가상 세계를 의미합니다.


[그림 1] 메타버스로 구현된 순천향대 대운동장에서 열리는 2021년 신입생 입학식 전경>

 
입학식을 넘어서 가상화폐 기술의 발전으로 이제는 가상세계의 부동산, 미술품, 게임 아이템 등을 매매하는 일이 현실이 되었습니다. 예를 들어 메타버스 게임 '디센트럴랜드(Decentraland)'는 가상세계의 부동산을 매매할 수 있는 웹 VR 방식의 3차원 게임으로 블록체인 기술의 가상화폐를 접목함으로써 현실 세계 부동산 거래와 흡사한 방식의 트렌드(Trends)를 볼 수 있습니다. 도심지의 부동산값은 비싸며 외곽으로 나가면 저렴합니다. 실제로 가상 부동산 1㎢ 정도의 땅이 한화로 6,500만 원 정도에 거래된 사례도 있습니다. 이 전에 온라인상의 거래는 서로 간의 채팅을 통해 현금거래로 이루어져 사기 및 해킹(Hacking) 등 안전성 문제로 거래하기 쉽지 않았지만, 블록체인 기술로 서로 간 가상화폐로 거래가 이루어지면서 이러한 문제를 해결하고 사용자들 사이 거래에 대한 신뢰가 높아지게 되었습니다.
 

[그림 2] 디센트럴랜드에서 판매되는 부동산 및 아이템. MANA 라는 토큰(token)으로 구매 가능
- 1 MANA 는 2021년 4월 7일 기준 약 1,100원

 
그러면 위의 디센트럴랜드에서 부동산이 내 소유임을 어떻게 확인할 수 있을까? 디센트럴랜드에서 땅은 NFT로 저장됩니다. NFT 는 'non-fungible token'의 약자로 대체 불가능한 토큰을 의미합니다. 일반적인 블록체인 기반 토큰(비트코인, 폴카닷 등)은 발행량이 정해져 있고 각각이 똑같은 가치를 가진다고(예로 1 비트코인의 가치는 누가 가지고 있든 똑같다) 하면 NFT는 발행량이 하나이고 그 하나의 원하는 txt, audio, video 파일 등을 저장하고 거기에 소유권(private key의 권한)을 가지게 되면 그 nft를 소유하게 되는 것입니다. 쉽게 말하면, 똑같은 만 원짜리 지폐라 할지라도 한국의 유명한 K-pop 가수 BTS의 사인이 들어간 지폐와 그렇지 않은 지폐는 가격이 다를 수 있습니다. 즉, 사인한 지폐는 비로소 대체 불가능한 것(non-fungible)이 되는 것입니다. 따라서 가상 부동산 데이터를 NFT에 저장하여 그 소유권을 가짐으로써 다른 어떤 누구도 그 데이터를 복제하거나 가져갈 수 없도록 하는 것입니다.
 
[그림 3] NFT의 대한 관심도 보여주는 구글 트렌드

 
이처럼 NFT 붐이 일어나면서 새로운 직종이 생겼습니다. 바로 디지털 아티스트(Digital artistist)입니다. 그들은 자신의 작품을 NFT화 하여 판매를 하고 있습니다. 비플(Beeple)이라는 예명으로 알려진 디지털 아티스트 마이크 윙켈만(Mike Winkelmann) 의 NFT 작품 '매일: 첫 5000일' (EVERYDAY: THE FIRST 5000 DAYS)의 경매 낙찰가는 6,934만 달러 (약 790억 원)였습니다. NFT 시장이 커지면서 디지털 아티스트들은 계속 늘어나고 있습니다. 이러한 NFT 광풍에 대해 비플은 CNBC 인터뷰에서 “인터넷이 처음 등장했을 때도 큰 호응을 받으면서 버블이 생겼고 붕괴된 바 있다”면서 “지금 NFT 버블이 있는 것도 사실이지만 NFT 기술은 피할 수 없을 것”이라고 말했습니다.
 

[그림 4] 디지털 아티스트 비플(Beeple)의 EVERYDAYS: THE FIRST 5000 DAYS , 뉴욕 크리스티 경매(Christie's)에서 3월 11일 약 780억 달러에 낙찰된 디지털 아트



 
이게 어떻게 가치 있는 자산이 될까 여전히 의문을 가질 수 있겠지만, 누군가의 작품을 산다는 건 그 작품뿐만 아니라 그 사람의 명성 및 역사를 같이 살 수 있기 때문입니다. 세계에는 수많은 (거의 똑같은) 레오나르도 다빈치(Leonardo da Vinci)의 모나리자(Mona Lisa) 작품이 있지만, 그의 작품만이 그 가치가 높은 이유입니다. 특정 개인은 그 모나리자 작품이 가치가 없다고 생각할 수 있지만, 시장에서 단 한 명만이라도 그 가치를 높게 본다면 가격은 거기에 맞춰지게 됩니다. 심지어 다빈치는 이제 세상의 존재하지 않기 때문에 가치는 더 상승하게 됩니다.



 
트위터 공동 개발자이자 CEO인 잭 도시(Jack Dorsey)는 “just setting up my twttr”이라는 자신의 첫 트윗을 NFT 로 만들어 경매에 올린 결과 290만 달러 (약 32억 원) 가격이 형성되었습니다. 심지어 AI 로봇으로 유명한 소피아(Sophia)도 NFT 제작 열풍에 합류했습니다. 기회는 모두에게 열려있습니다. 자신의 이더리움(ETH) 기반 지갑을 이용하여 nft 제작을 가능하게 해주는 nft 플랫폼 레어러블(Rarible)에서 누구나 쉽게 자신이 만든 이미지, 영상 등을 NFT 화하여 시장에 팔 수 있습니다. 특별한 본인의 사진, 작품을 NFT로 바꿔서 수익을 내는 것이 점점 대중화되고 있습니다.
 

[그림 5] NFT 제작 및 판매 플랫폼 레어러블
 
 

 

디지털 자산인 NFT는 결국 무형의 것입니다. 이러한 무형의 것에 사람들의 관심이 주목되고, 대규모 시장이 형성되고 큰돈이 오가는 것이 아직 믿기 어려운 건 사실입니다. 디지털 아티스트 비플이 말한 것처럼 NFT 트렌드의 버블(Bubble)이 있는 건 사실일 수도 있지만, 이 혁신적인 기술은 기존의 모든 사업 및 시장에 새로운 영향을 줄 수 있을 것 같습니다.




이 주제를 준비하면서 메타버스의 생태계가 생각보다 매우 크다는 것을 알게 되었습니다. 마치 영화 The Matrix(1999)처럼 언젠가는 현실과 메타버스와의 경계가 모호해지는 시대가 도래할 수도 있을 것 같습니다. 최초 인터넷망이 구축되었을 때부터 지금까지 인간의 삶의 모든 부분의 변화가 찾아왔듯이 블록체인 기술은 앞으로 많은 부분을 바꿔나갈 것입니다. 마찬가지로, NFT는 아직은 대부분 사람에게 매우 낯설고 생소한 용어이지만, 앞으로 5년, 10년 후에 이 용어는 누구나 다 아는, 혹은 누구나 하나쯤은 가진 그런 것일지도 모르겠습니다.






작성 : insilico Lab 임의현 컨설턴트

Posted by 人Co

2021/04/14 14:41 2021/04/14 14:41
, , , , , ,
Response
No Trackback , No Comment
RSS :
https://post-blog.insilicogen.com/blog/rss/response/378



우리가 먹고 있는 청양고추, 사실은 독일 바이엘사에 로열티를 주고 종자를 구매 후 작물을 재배하여 섭취하고 있는 현실 알고 계셨나요? 그뿐만 아니라 제주 감귤, 파프리카, 고구마와 양파의 종자도 대부분 해외에서 사들여 먹고 있는 것입니다.
최근 세계적인 유전자 가위 업체들은 항산화·항노화 성분이 기존 콩보다 2배 이상 많은 콩을 개발해 미국 농무부(USDA)로부터 Non-GMO 판정을 받아냈다고 하는데요, 즉, 유전자변형식품이 아니라는 뜻으로 볼 수 있습니다.
이는 이미 선진화된 기술력을 가진 해외 기업들이 우리가 먹고 있는 식량을 좌지우지할 수 있는 여지가 더욱 커졌다는 말이기도 합니다.
다행히 우리나라에서도 디지털 육종 전환 사업이란 것을 통해 육종 기간을 6년에서 3년으로 줄이고 육성 품종의 상품화율을 5%에서 50%로 대폭 끌어올리는 것을 목표로 국내 종자 산업 첨단화를 위한 사업이 진행 중인데요,
이 디지털 육종에 표준화되고 객관화 된 표현형 데이터가 매우 중요합니다.
 
디지털 육종과 표현형 데이터? 다소 생소하게 느껴질 수 있겠지만, 블로그를 통해 그 궁금증 하나둘씩 해결해드리고자 합니다.
오늘 블로그는 종자 산업의 패러다임 변화, 디지털 육종과 표현형 데이터에 대하여 작성해보았습니다.




기후 및 환경 변화 등의 이유로 우수한 신품종을 빠르게 육성하기 위해서는 종묘단계에서 우수한 개체를 선발하는 것이 무엇보다 중요한데 이를 위해 경험 중심의 전통육종[1]에서 빅 데이터 기술과 인공지능기술(AI)로 신속한 의사결정이 이뤄지는 디지털육종[人Co블로그:https://www.insilicogen.com/blog/370]으로 전환이 필수적으로 요구되고 있습니다.

최근 유전자분석 기술(NGS)의 도움으로 유전체 정보는 폭발적으로 증가했으나 표현형[2] 정보의 측정 및 분석기술에 한계가 있다는 점이 육종 기술 도입의 한계로 지적되었습니다.

그러나 최근 RGB, NIR 카메라 및 영상 기술이 발달함에 따라 이를 이용해 크기, 수, 이상 현상 등 작물의 표현형을 정확하고 빠르게 대량으로 수집할 수 있게 되었고, 수집된 데이터를 바탕으로 다양한 기술을 이용해 영상정보(사진, 양상)를 디지털화하고 우수 경제 형질과 연계해 우수한 품종을 선발하는 표현체 이용 기술이 주목을 받고 있습니다.

이러한 표현체 연구는 작물의 형태적 특징을 영상 기술을 통해 수치화 및 객관화하여 분석하는 기술로써 표현형과 연관된 유전자의 연관 관계를 밝혀 그 특성을 이용한 우수 품종 개발을 지원할 수 있는 아주 유용한 방법이라 할 수 있습니다. 즉, 각 개체의 표현형질과 유전적 특성을 미리 알 수 있어 육종 시 원하는 형질을 가진 모본과 부본 간의 교배가 가능하므로 우수 경제 형질을 가진 개체를 선발할 수 있으며 육종 기간 단축을 통해 노력과 시간의 감소 효과를 얻을 수 있습니다.

따라서 전통농업기술과 분자육종, ICT 및 인공지능 등 첨단 기술을 접목한 표현체 연구를 기반으로 차세대 디지털육종 시스템으로 변환을 통해 육종 기간 단축과 우수후보 발굴 등 신품종 개발 효율성을 높일 수 있습니다.



 
[Fig.1] 표현형 자료를 이용한 벼 육종 자료 (출처:A quantitative genomics map of rice provides genetic insights and guides breeding Nature Genetics (2021))
 



 
이러한 표현체 연구를 위해서는 총 4단계의 과정으로 재구성하였습니다.
 

[Fig.2] 표현형 자료 예시
 

  • 데이터베이스 구축 단계
    • 각 재배 및 사육 단계에서 육안 또는 영상, ICT 장비를 이용해 데이터를 체계적으로 수집하는 단계로, 데이터를 수치화하고 객관화시켜 신뢰할 수 있는 표현체 빅데이터를 구축해야 함.
    • 기온, 습도, 날씨 등 다양한 환경 요소를 비롯하여 작물의 성장과 발달 단계에 맞는 정확한 정보(온톨로지)를 통해 수치화하여 수집하는 단계.
  • 지식정보 그래프 구축 단계
    • 수집 데이터를 '노드'-'엣지'의 그래프로 구현하는 단계로 서로의 데이터 관계를 명확하게 정의하여 표현형, 기능, 유전형의 관계를 체계적으로 구축하는 단계.
  • 연관 관계 분석 단계
    • 각 수집 요소에 대하여 알고리즘을 적용하는 단계로 표현형 및 환경정보와 유전형의 연관 관계에 대하여 중요도를 부여하여 특정 표현형에 대한 쿼리 결과의 순위를 제공하는 단계로 이를 뒷받침하는 유전형의 정보도 제공.
  • 맞춤형 분석 단계
    • 데이터베이스를 재구성하거나 탐색을 통해 자신과 가진 데이터를 비교하거나 분석할 수 있는 플랫폼을 제공하는 단계로 특정 표현형에 대한 집단 비교 분석 및 AI 기술 도입을 통해 최적의 교배 지침을 제공하는 단계.

기존 전통육종에서 디지털육종으로의 전환을 유도할 수 있는 표현형 데이터는 유전체 데이터와의 결합과 AI 기술 적용을 통해 새로운 미래 먹거리를 발굴에 활용할 수 있습니다.




그러나 이러한 표현형 데이터는 무엇보다 표준화와 객관화가 중요합니다. 특히 단위는 무척이나 중한데 이를 간과한 사례가 있습니다. 단위가 헷갈려 1,400억 원짜리 우주선이 폭발한 사례[중앙일보]에서 보는 것처럼 주요 단위인 야드와 미터법의 혼동으로 이와 같은 엄청난 피해를 남겼습니다. 표현형을 수집할 때 정확한 용어와 단위 사용은 필수 요소입니다. 이렇게 체계적으로 수집된 표현형 데이터가 유전형 데이터를 만났을 때 진정한 위력을 발휘할 수 있는 것입니다.


[Fig.3] 단위 헷갈려 1,400억짜리 우주선이 폭발[중앙일보]


 

 
이러한 사례를 보자면 "커피는 건강에 좋다?"라는 기사를 통해 확인할 수 있습니다. 커피는 산화방지제가 풍부하고 스트레스를 감소시켜 주며 간 건강에 도움을 준다고 알려졌지만, 과다 섭취하게 되면 골관절염과 비만을 높일 수 있습니다. 해당 연구결과는 'MR-PheWAS분석법'을 이용해 영국 바이오뱅크 내 30만 명의 헬스데이터를 질병정보와 연계 분석하여 얻어진 연구결과입니다. 여기서 MR-PheWAS(MR phenome-wide association studies, MR-PheWAS)분석법이란 의무기록정보 기반 표현체 연관 분석 방법으로 특정 집단 내의 다양한 개체들에서 나타나는 표현형과 유전형과의 연관성을 연구하는 방법으로, 이를 통해 단순히 커피를 마시는 사람과 비교하는 관찰적 기법이 아니라 임상 정보와 연계하여 위와 같은 연구결과를 도출하였습니다. 이러한 분석이 가능한 것은 임상 정보와 같은 방대한 표현형 정보가 바탕이 되었기 때문입니다. 즉, 데이터가 서로 융합이 될 때 더욱더 가치를 발하는 것입니다.
 
 

[Fig.4] 커피는 건강에 좋다? 지나치면 골관절염·비만 위험 키운다[연합뉴스]
(출처:다양한 커피잔[Cyril Saulnier 제공)

표현형 데이터는 말 그대로 야장(野帳)을 디지털화한 것입니다. 단지 기입하고 엑셀로 관리하는 용도가 아니라 적재적소에 활용할 수 이용할 수 있도록 데이터베이스 구축과 데이터의 시계열 분석 및 복합 쿼리를 통해 필요한 정보를 추출할 수 있도록 해야 합니다. 즉 디지털 야장(野帳)을 통해 개체 및 집단에 대한 데이터 분석, 가시화, 통계 분석을 지원할 수 있어야 합니다.
 
 
 
오늘 블로그에서 다루었던 디지털 육종 분야에서의 표현형 데이터는 단순히 아날로그식 기재방법으로 축적하는 것이 아닌, 대량의 표현형 데이터를 상황에 맞게 사용하기 위하여 데이터베이스 구축이 필요할 것입니다.
이를 위해 공공기관과 민간 기업에서 홍수처럼 쏟아지는 많은 양의 데이터를 적절히 관리하고 분석할 수 있도록 빅데이터 구축 사업을 꾸준히 진행하고 있는데요, 디지털 육종을 위한 표현형 데이터도 데이터베이스 구축을 통해 그 활용도와 효용성을 극대화할 수 있을 것입니다.



 
  • 표현형

표현형은 어떤 생명체의 겉으로 관측이 가능한 특정 모습이나 성질을 의미하며 유전형과 반대되는 개념.

멘델의 완두콩 실험을 설명하기 위해 처음 표현되었으며, 현대에 이르러서는 그 개념이 크게 확대되었습니다. 초기 멘델이 형질의 특성을 설명하기 위해 사용된 이 개념은 '유전자형이 곧 표현형으로 드러난다' 는 개념이었으며 완두콩의 '동그랗다'와 '주름지다' 등과 같이 실제 겉으로 드러나는 모양을 표현형이라고 부를 수 있습니다.

표현형은 우리가 흔히 마주할 수 있는 머리카락 색, 눈 색, 키 등과 같은 외향적인 모습뿐만 아니라 특징적인 행동, 발생, 생리학적 특성 또한 포함합니다. 이러한 표현형은 초기 유전형에 의해 결정되며 향후 환경적 요인에 의해 변할 수도 있습니다.

  • 육종의 개념

육종이란 농작물이나 가축을 개량하여 경제(실용) 가치가 더 높은 새로운 품종을 개발하고 증식하여 보급하는 기술입니다. 육종의 목표는 수량 증대와 품질 향상, 내재해성, 내병성, 맛, 향기(풍미), 모양, 사육 환경 등이 다양한 경제 형질로 정해질 수 있습니다.

육종의 대상은 농경을 시작한 이래로 산업적으로 유용한 형질(표현형)을 가진 모든 생물체가 그 대상이었습니다. 경주 능력을 목표한 '서러브레드' 경주마, 우리가 즐겨 먹는 마블링이 우수한 1등급 '한우', 매운맛의 강자 '청양고추', 가난에서 벗어나게 해준 수확량의 제왕 '통일벼', 밀을 대체할 벼 품종 '가루미' 등 동식물을 망라하고 인간에게 유용한 경제 형질을 가진 모든 분야에서 육종이 이루어져 왔습니다.

이렇게 다양한 특징을 가진 농작물 또는 가축을 만드는 것이 전통적인 분리육종만으로는 수십 년 이상을 필요로 하므로 현대 육종방법에서는 최첨단 과학기술을 사용하여 종자 개발을 진행하고 있습니다.

  • 전통육종과 분자육종

전통 육종 - 직접 식물 또는 동물을 교배하고, 재배(사육)하여 선발한 개체를 다시 재배하여 확인 작업을 거쳐 품종화시키는 방법이기에 최소 7년에서 20년 이상의 시간이 소요되며 겉으로 드러난 표현형만을 기준으로 하므로 육종의 목표가 되는 형질 외에 다른 형질의 내재성을 모르는 등 그 한계가 분명합니다.

분자 육종 - 육종기술에 분자 마커를 활용한 분자생물학 기술을 접목한 새로운 육종방법으로 마커를 통해 각 개체의 유전적 특성을 규명하고 효율적으로 우수한 개체를 판별하는 기술입니다. 유용한 형질을 가진 개체를 찾고 교배하는 것은 전통과 같으나 자손 세대의 재배 없이 분자마커를 이용해 원하는 개체를 찾을 수 있으며 많은 시간을 단축하거나 눈으로 확인할 수 없는 경우 등 개체 선발에 도움을 줍니다.

작성 : BS실 이규열 수석개발자
 


 

Posted by 人Co

2021/04/11 14:38 2021/04/11 14:38
, , , , , , ,
Response
No Trackback , No Comment
RSS :
https://post-blog.insilicogen.com/blog/rss/response/377

人CoDOM Awards 2020, 영예의 수상자는?

 
안녕하세요? 人CoDOM의 네비게이션 MD협의회 입니다.

저희 인실리코젠은 매년 人CoDOM 우수작성자를 선정하는 행사가 있습니다. 올해는 노력상, 인기상 그리고 MD상으로 다양한 기준을 통해 우수작성자를 선정하였습니다. 과연, 영예의 수상자는 누구일까요?
 
 
 
 
수상자를 소개하기 전, 人CoDOM을 알고 계신가요?
이미 많은 분이 사용하고 계시지만, 생소하신 분들을 위해 간략하게 소개 하겠습니다.
 
人CoDOM은 생물정보 1위 기업인 ㈜인실리코젠에서 운영하는 생물정보(Bioinformatics) 분야의 지식 커뮤니티입니다. 人CoDOM의 특징은 위키 문법으로 작성되었기에 생물정보에 관심 있는 분이라면 누구나, 언제든지 작성하고 수정할 수 있다는 것입니다.
 
人CoDOM은 2014년부터 많은 생물정보 전문가와 개발자들의 노력으로 끊임없이 성장하여, 콘텐츠 수가 2,000편이 넘을 뿐만 아니라 월평균 이용자 수가 5만 명에 다다르고 있습니다. 人CoDOM은 크게 Article, Bioinformatics, Data Science 등의 카테고리로 구분되어 있어 관심 분야의 내용을 쉽게 작성하거나 구독하실 수 있습니다.
 
(주)인실리코젠의 모든 멤버들이 유익한 글로 人CoDOM을 빛내주셨습니다. 지난 2020년 한 해 동안 人Co인들이 공유해주신 내용 중, 人CoDOM 발전에 크게 이바지한 훌륭한 콘텐츠를 다양한 기준을 통해 선정해 보았습니다.
 
 
 
人CoDOM Awards 2020 - 노력상
 
첫 번째로 소개해 드릴 상은 노력상입니다.
[정보화사업/사업수행] 콘텐츠를 작성해주신 BS실 박병준 선임님께서 수상하셨습니다. 노력상은 사용자가 원하는 알찬 내용으로 작성해주신 콘텐츠로 선정합니다. 사업을 원활하게 수행하고 싶으시다면 [정보화사업/사업수행] 콘텐츠를 읽어보시는 걸 추천해 드립니다.
 
 
 
<노력상을 수상하신 BS실 박병준 선임님과 최남우 사장님의 기념사진>
 
노력상의 의미를 상을 받고 나셔야 알았네요. (웃음) 제가 人CoDOM을 쓰는 이유는 제가 하는 일을 다른 사람들이 편하게 이해할 수 있었으면 하는 마음으로 작성하고 있습니다. 앞으로도 그런 마음 변치 않고 쉽게 이해할 수 있는 글을 써보도록 노력하겠습니다. 감사합니다.
 
 
人CoDOM Awards 2020 - 인기상
 
두 번째로 소개해 드릴 상은 인기상입니다.
인기상은 [16s rRNA] 콘텐츠를 업데이트한 insilico Lab 조항철 주임님께서 수상하셨습니다. [16s rRNA]은 2020년 한 해 동안 가장 많이 구독된 콘텐츠로 인기상에 선정되었습니다. 미생물 분야에 입문한 연구자라면 필수로 짚고 넘어가야 할 [16s rRNA] 人CoDOM에서 바로 확인하세요.
 
 
 
<인기상을 수상하신 insilico Lab 조항철 주임님과 최남우 사장님의 기념사진>
 
우선 제가 업데이트한 콘텐츠를 방문해주시고, 사랑해주신 모든 분과 콘텐츠 원작자분께 감사의 인사 올립니다. 많이 부족한 내용이었음에도 생물학적으로 기본이 되는 내용이라 많은 분이 방문해주신 것으로 생각됩니다. 이분들 덕분에 상을 받을 수 있었고, 이번 기회를 발판 삼아 앞으로도 많은 분에게 도움이 될 수 있는 콘텐츠를 만들 수 있도록 노력하겠습니다. 다시 한 번 감사의 인사 올리며, 모두 건강한 나날 보내시길 바랍니다. 감사합니다.
 
 
人CoDOM Awards 2020 - MD상
 
마지막으로 소개해 드릴 상은 MD상입니다.
MD상은 작성된 모든 콘텐츠를 MD협의회가 살펴보고 투표한 결과와 함께 각종 측정지표에서 높은 점수를 받은 콘텐츠로 선정하였습니다. 영예의 콘텐츠는 insilico Lab 송하나 선임님께서 업데이트한 [계통수]입니다. 계통수의 정의부터 분석 방법 및 사례까지 알고 싶으시다면 [계통수]를 눌러 보시길 바랍니다.
 
 
 
<MD상을 수상하신 insilico Lab 송하나 선임님과 최남우 사장님의 기념사진>
 
안녕하세요. insilico Lab 송하나입니다. 人CoDOM은 생물정보학을 공부하시는 분들에게 매우 유익한 사이트가 아닐까 싶습니다. 저 또한 人CoDOM을 보며 부족한 부분을 공부했고, 이해한 내용을 바탕으로 연구자들에게 더 편리하게 연구할 수 있는 내용을 공유하고자 작성했는데요, 이 콘텐츠가 우수작으로 선정되어 매우 영광입니다(기본적인 이론의 틀을 잡아주신 초기 작성자분 감사드립니다). 생각지도 못한 선정에 약간은 놀랐지만, 더 좋은 양질의 콘텐츠를 제공해야겠다는 생각이 들었습니다. 人Co인 모두가 생물정보학 분야의 연구자들을 위해 부단히 노력하고 있습니다. 이런 人CoDOM이 널리 알려져 人Co인 뿐만 아니라 모든 연구자도 참여할 수 있기를 바라봅니다.
 
 
<시상식 이후 人CoDOM의 가치와 미래 방향성에 관해 설명하는 최남우 사장님>
 
"우리는 국내 생물정보 1위 기업입니다."
 
학창시절 모두 경험해 보았습니다. 열심히 공부한 친구들이 잘 정리된 노트를 공유하여 주변의 많은 사람에게 선한 영향을 끼치는 것을 발견했을 겁니다. 우리도 人CoDOM을 통해 생물정보 분야의 지식을 공유하여, 현업 연구자들과 미래 바이오 산업을 이끌어갈 인재들에게 도움을 주고 나아가 대한민국 바이오 산업의 발전을 이끄는 선순환 구조를 만들고 있다고 생각합니다. 지금처럼 학습한 지식을 주변과 공유하는 문화를 이어갔으면 합니다.
 
지난 7년 동안 人CoDOM에 2,024편의 콘텐츠가 등록됐습니다. 지금 이 순간도 人CoDOM에는 다양한 글들이 작성되고 있으며, 질적인 면에서도 빠르게 성장하고 있습니다. 앞으로도 기존 콘텐츠 업데이트와 신규 작성글을 통해 양질의 콘텐츠로 가득한 대한민국 대표하는 생물정보 지식의 공유의 장으로 발전했으면 합니다.
 
 
새로운 시작, 새로운 멤버
 
지난 한 해 동안 신규 작성과 기존 글 업데이트 등을 통해 人CoDOM의 우수한 콘텐츠를 만들어주신 모든 분께 이 자리를 빌려 깊이 감사드립니다.
 
 
<최남우 사장님과 신규 출범한 MD협의회 4기 위원들:
(왼쪽부터) 김형민 주임, 이용태 주임, 최남우 사장, 손효정 주임, 전지현 주임>
 
 
2021년에는 새로운 위원으로 구성된 MD협의회 4기가 출범하였습니다.
앞으로 더 나은 콘텐츠 제공과 한층 더 발전된 人CoDOM을 위해 노력하겠습니다.
많은 관심과 성원 부탁드립니다.
 
 
작성 : MD협의회
 

Posted by 人Co

2021/04/02 15:08 2021/04/02 15:08
Response
No Trackback , No Comment
RSS :
https://post-blog.insilicogen.com/blog/rss/response/376



유전체학의 발전은 인간의 질병을 이해하는 새로운 문을 열어주고 있으며 혁신적인 정밀 치료에 점점 더 많은 정보를 제공하고 있습니다.
2015년도에 전 세계 시퀀싱 스토리지 용량은 연간 1 페타바이트에 이르렀고, 7개월마다 용량이 두 배씩 지속적해서 증가하고 있습니다. 유전체 데이터는 향후 5년 동안 연간 수백 페타바이트를 생성할 것이며 2025년도까지 연간 스토리지가 거의 1 제타 바이트가 필요할 수도 있습니다. 이렇게 증가하는 질병 유전체 시퀀싱 데이터의 처리, 저장 및 분석에 유용한 솔루션인 Intel Select Solution을 소개하고자 합니다.




지난 3월 4일 저희 인실리코젠의 공식 페이스북을 통해서도 간략하게 소개해드렸었는데요, 당시 자세하게 설명해 드리지 않아 궁금한 점이 많으셨을 거로 생각합니다.
그래서 오늘은 Intel Select Solution - GATK Best Practice에 대해 상세히 설명해 드리고자 합니다.


Intel Select Solution은 컴퓨팅, 스토리지 및 네트워크에 특정 소프트웨어 워크플로우를 최적화하여 검증된 결과를 제공하는 것을 목표로 하여 세계 최고의 데이터 분석을 위한 솔루션 서비스 제공을 목표로 개발되었습니다.

해당 서비스 라인 중 GATK Best Practice는 유전체 분석을 위한 고성능 데이터 분석 컴퓨팅 클러스터 하드웨어 및 최적화된 워크플로우 소프트웨어 시스템입니다. 대용량 유전체 변이 분석을 위해 Intel 기술을 활용하여 GATK 파이프라인을 최적화할 수 있도록 Broad Institute에서 개발하였으며, 복잡한 설정 및 구성을 위한 검증 및 인증을 제공하여 유전체 수준의 데이터 분석을 빠르게 진행할 수 있도록 특별히 설계되었습니다.

더불어 Intel Select Solution - GATK Best Practice의 성능 및 품질은 Intel에서 인증을 받았고, 자사의 생물정보 분석 컨설팅 서비스와 결합하여 "Inco X Intel Select Solution - GATK Best Practice"가 탄생하였습니다.

하드웨어는 소규모에서 초대형 클러스터 슈퍼컴퓨터로 확장할 수 있도록 설계되었습니다. 맞춤형 시스템은 특정 요구 사항을 충족하도록 빠르고 동적으로 구성할 수 있으며, 강력한 최신 API 기반 소프트웨어로 리소스를 검색, 구성 및 모니터링하는 도구가 포함되어 있습니다.


[사진 1] Intel Select Solution - GATK Best Practice_설치된사진


 
  • 1. 최적화되고 효율적인 파이프라인 지원
  • 2. 최적화된 턴키 솔루션
  • 3. 사전 패키지된 WDL(워크플로우 설명 언어) 스크립트
  • 4. 다양한 애플리케이션 지원
  • 5. 간편한 IT 지원
  • 6. 더 많은 유전체 데이터에 액세스 가능
  • 7. 향상된 통계 기능
  • 8. 오픈 소스 소프트웨어
  • 9. 유연한 애플리케이션 구조
  • 10. 구현 용이성
  • 11. 확장성
  • 12. 설치 시간 단축
  • 13. 라이선스 비용이 없는 오픈 소스 소프트웨어
  • 14. 다양한 상용 솔루션도 적용 가능
  • 15. 최적화된 구성으로 최고의 효율성




다음 편에서 자세히 소개하겠지만, 하드웨어 구성과 사양이 궁금하신 분들은 아래 페이지에서 먼저 확인하실 수 있습니다.




유전체 연구는 질병을 이해하고 진단하는 것에 매우 중요한 역할을 합니다. 현재 연구원들이 이러한 기술을 사용하여 대규모 유전체 데이터 저장소를 구축하고 해당 데이터를 이해하게 됨에 따라 유전체 데이터 및 분석이 빠르게 발전하고 있습니다. Intel Select Solution - GATK Best Practice는 질병 유전체 연구를 위한 최고의 유전체 분석 솔루션으로, Broad Institute가 릴리즈 하는 GATK는 Intel Select Solution을 기반으로 구동, 검증, 배포되고 있어 GATK를 사용하여 대용량의 유전체 변이 분석을 하고자 하는 고객이 쉽게 시스템을 구축할 수 있는 장점이 있습니다. 그 결과 유전체 분석을 위해 맞춤화된 하드웨어 및 소프트웨어 솔루션으로 더 빠른 분석 및 최적화된 분석 환경을 제공합니다. 또한, Intel Select Solution - GATK Best Practice의 기본 구성으로 Human Whole Genome Sequencing 25~30 sample 데이터를 하루 만에 분석할 수 있으며, 서버 node를 확장함에 따라 더욱 많은 샘플을 빨리 처리할 수 있는 장점을 갖고 있습니다.





질병 유전체 시퀀싱 데이터의 처리, 저장 및 분석에 유용한 솔루션인 Inco X Intel Select Solution - GATK Best Practice에 관심 있으신 분은 인실리코젠으로 문의해주시고, 또한 후속편으로 Inco X Intel Select Solution - GATK Best Practice 하드웨어 구성사양, 작동원리 및 성능 벤치마킹 정보도 안내할 예정이오니 많은 관심 부탁드립니다.


작성 : iLAB 용승천 선임컨설턴트

Posted by 人Co

2021/03/21 19:45 2021/03/21 19:45
, , , , , ,
Response
No Trackback , No Comment
RSS :
https://post-blog.insilicogen.com/blog/rss/response/373



우리는 빅데이터와 인공지능이 대세를 이루고 있는 시대에 살고 있습니다. 과거 산업혁명과 비교해서 4차 산업혁명 시대는 다양한 산업 분야와 산업 생태계에서 격세지감을 느낄 정도의 변화가 일어나고 있으며 그중에 바이오 헬스 산업은 향후 핵심적인 융합산업 분야로 주목받고 있습니다. 바이오 헬스 산업의 가장 기본이 되는 데이터 구축을 위해 국가 차원에서 바이오 빅데이터 구축 사업을 통해 바이오 데이터 구축 및 표준화로 미래 기술을 선점할 수 있는 기반을 만들기 위해 노력하고 있습니다. 이러한 기조에 맞춰 인실리코젠도 보건복지부, 과학기술정보통신부, 산업통상자원부가 컨소시움을 이루어 2년 동안 총 2만 명의 임상정보와 유전체 데이터 수집을 목표로 하는 국가 바이오 빅데이터 구축 시범 사업의 일환인 희귀질환 빅데이터 플랫폼 구축 사업 일부에 동참하여 희귀질환 극복을 위한 노력에 일조하고 있습니다. 이번 시간에는 희귀질환을 극복하기 위한 국내외 연구 기관에 관해 이야기하고자 합니다.




우선 희귀질환의 정의는 법률적으로 유병(有病) 인구가 2만 명 이하이거나 진단이 어려워 유병인구를 알 수 없는 질환으로 보건복지부령으로 정한 절차와 기준에 따라 정한 질환을 말합니다. 국내 희귀질환 관련 법률은 개인적/사회적 부담을 감소시키고, 국민의 건강 증진 및 복지 향상에 이바지하는 것을 목적으로 2015년에 희귀질환관리법이 제정되었으며, 국가관리대상 희귀질환 지정은 희귀질환관리법에 따라 유병인구 수, 질환 진단에 대한 기술적 수준, 질환 진단을 위한 인력 및 시설 수준, 질환에 대한 치료 가능성 등을 기준으로 희귀질환관리위원회의 심의를 거쳐 희귀질환으로 지정하게 되어 있습니다. 국내 기준과 달리 미국은 유병인구 20만 명 미만이거나 인구 1,500명당 1명, 유럽은 인구 2,000명당 1명, 일본은 유병인구 5만 명 미만이거나 인구 2,500명당 1명으로 발병하는 질환을 희귀질환으로 정의하고 있으며, 아직 세계적으로 합의된 정의는 없는 상태입니다.

희귀질환 환자의 질병에 대한 이해를 높이고, 질환에 대한 빠른 진단과 치료의 적용, 그리고 치료법 개발을 위해선 질환 데이터베이스 구축이 필수적이었기에, 이전에는 질환 데이터베이스 구축을 주로 희귀질환 관련 기관 및 단체가 주도하여 개발하고 유지되는 경우가 많았으나, 최근엔 국가 혹은 연합 단위로 데이터베이스를 구축하고 다양한 서비스를 제공하는 방향으로 변화하고 있습니다.

다음은 대표 희귀질환 관련 기관과 단체, 그리고 그 데이터베이스에 대한 특성을 말씀드리겠습니다.



  • 미국 국립희귀질환기구(NORD)
NORD는 1982년 희귀 질환 치료법 개발에 대한 재정적 인센티브를 지원하는 것을 골자로 한 희귀질환의 약물에 관한 법률이 미 국회를 통과하여, 이를 주도적으로 이끌었던 희귀질환 환자 지원 단체들이 연합하여 1983년 NORD(National Organization for Rare Disorders)로 조직되어, 현재까지 꾸준한 활동을 펼치고 있습니다. NORD 웹 사이트(https://rarediseases.org)에는 약 1,300여 개의 희귀질환 목록을 유지하고 있으며, 지원 기관들과 치료법 등에 대한 자세한 정보를 포함하고 있습니다.


<그림1. 미국 국립희귀질환기구 (NORD) 웹사이트>
 
  • 미국 유전병 및 희귀질환정보센터
GARD(Genetic and Rare Diseases Information Center)는 미국국립보건원(NIH)과 미국 국립인간게놈연구소(NHGRI)에서 지원받아 운영되는 센터로 희귀질환 환자의 지원, 희귀질환 진단 및 치료지원, 연구자 연결, 연구 및 치료 자금 지원 연결, 희귀질환에 대한 교육 등을 주된 활동으로 하고 있습니다. GARD 사이트(https://rarediseases.info.nih.gov/) 내에 희귀질환의 정보를 서비스하고 있으며, 질환 정보, 유전 여부, 진단 및 치료정보뿐만 아니라 환자를 지원하기 위한 지원기관, 전문가 목록, 질환 관련 콘퍼런스 및 이벤트 일정 등을 제공하고 있습니다.
 

<그림2. 미국 유전병 및 희귀질환정보센터 (GARD) 홈페이지>
 
  • Global Genes
Global Genes(https://globalgenes.org/)는 희귀유전질환 환자와 그 가족을 위한 국제 비영리 단체입니다. 이 기구는 희귀유전질환에 대한 의식을 고양하기 위한 공교육 제공과 소셜 미디어를 통한 지역사회 지원 체계를 구축하고, 치료와 치료법을 찾기 위한 연구 자금 지원을 하고 있습니다. 또한, GARD 등에서 유전정보를 참고하여 정보를 제공하고 있으며, 희귀유전환자와 그 가족에게 질환의 진단 및 치료를 지원받을 수 있는 기관 목록을 함께 제공하고 있습니다.
 

<그림3. Global Genes 홈페이지>
 
  • 유럽희귀질환환자연맹(EURORDIS)
EURORDIS(European Organization for Rare Diseases)는 유럽연합 내에 있는 70개국 837개 희귀병 환자 조직을 대표하는 비영리 기구로 1997년에 설립되었습니다. EURORDIS는 환자, 가족, 환자 그룹을 연결하고 모든 이해당사자를 모아 질환을 연구하고 환자를 대상으로 하는 다양한 서비스를 제공하고 있습니다. 또한 세계희귀질환의 날을 제정하여 국제적인 관심과 이해를 촉구하고 있습니다. 연맹 자체에서 운영하는 데이터베이스는 보유하고 있지 않지만, 대신에 관련 정보는 프랑스 국립보건의학연구소의 Orphanet을 이용하도록 유도하고 있습니다.
 

<그림4. 유럽희귀질환환자연맹 (EURORDIS) 웹사이트>
 
 
  • 스웨덴 희귀질병정보센터(Swedish Information Centre for Rare Diseases)
스웨덴에서는 질병이 인구 1만 명당 1명 미만에 장애를 일으킬 때 희귀질환으로 정의하고 있으며, 이러한 정의를 기반으로 2019년 2월까지 440여 개의 희귀질환에 대한 정보를 제공하고 있으며, 스웨덴 국립 희귀질환연구소(NFSD, https://www.socialstyrelsen.se/)와 스웨덴 대학병원 및 다양한 의료 전문 센터와 연계하여 환자의 진단 및 지표를 지원하고 있습니다.
 

<그림5. 스웨덴 희귀질병정보센터 웹사이트>
 
 
  • 일본 희귀 및 미진단 질환 이니셔티브(IRUD)
일본은 2015년 일본 의료연구개발청(AMED)에서 일본의 희귀 및 난치성 질병 프로젝트의 일환으로 IRUD(the Initiative on Rare and Undiagnosed Disease)를 시작하였고, 2018년 3월까지 3,083명의 환자와 그 가족을 대상으로 총 8,837개의 시료를 수집하여 추출한 엑솜(Exome) DNA 염기서열 해독 정보와 의료 정보를 결합해 희귀질환을 연구하고 있습니다. IRUD는 희귀 및 미진단 질환의 기초 연구에도 큰 도움이 되고 있으며, 확보한 환자 및 가족 엑솜 DNA 정보를 바탕으로 데이터베이스를 만들어 이를 통해 전 세계와 공동 연구를 늘려가고 있습니다. 이제까지 몰랐던 질병 관련 변이나 유전자도 찾아내어 엑솜 외의 DNA 영역까지 모두 해독해 RNA, 후성유전 등 다양한 유전학 영역을 탐구하고 있습니다.
 

<그림6. 일본 희귀 및 미진단 질환 이니셔티브 (IRUD) 웹사이트>
 
 
  • 질병관리청 희귀질환 헬프라인
국내의 경우 질병관리청에서 2012년부터 일부 희귀질환에 대해 전국 단위의 전문가 네트워크를 구성하여 환자 임상자료 및 생체자원을 수집하고 있으며, 이를 통해 희귀질환의 진단, 치료 및 예후 등에 대한 임상정보와 시료를 수집, 분석하여 한국인의 임상적 특성을 규명하고 국내외 관련 전문가들과 정보 공유를 통해 해당 질환의 진료와 치료기술을 개발하고, 환자들의 조기 진단 및 진료의 질 향상에 기여하기 위해 헬프라인을 운영하고 있습니다. 국내 6개 질환 (시신경척수염, 아밀로이드증, 유전성 부정맥, 전신홍반성루푸스, 조직구증식증, 크론병)에 대한 전문가 네트워크를 운영하고 있으며, 2020년 11월 1,014개의 질환에 대한 증상, 원인, 진단, 치료 등의 정보를 제공합니다. 또한, 관련 임상시험 정보 제공을 위해 미국국립보건원의 ClinicalTrials.gov 데이터베이스로 연결을 제공하고 있습니다.
 

<그림7. 질병관리청 희귀질환 헬프라인>
 
  • 한국생명공학연구원 희귀난치질환연구센터
한국생명공학연구원(KRIBB)의 바이오의약연구부 소속 희귀난치질환연구센터는 빅데이터 기반의 희귀난치성 신경계 질환의 정밀, 맞춤의료연구 인프라 구축을 통해 희귀난치성 신경계 질환의 진단과 치료를 위한 원천기술 개발을 목표로 희귀난치성 신경계질환의 임상시료와 임상정보, 유전체 정보를 확보하여 한국인 유전체표준변이지도 작성하고 고급 데이터베이스를 구축하고 있습니다. 현재까지의 연구 성과는 뇌 발달장애 원인 신규 변이 발견 및 동물 모델 개발로 소아간질, 자폐 , 지적장애를 유발하는 TSC 유전성 뇌 발달질환의 in-vivo 동물 모델 제작과 in-vitro 신경줄기세포 배양 시스템을 이용하여 뇌 발달질환 진단 표지자 발굴을 위한 시스템이 구축되었고, 질환 특이적 대용량 NGS 유전체 데이터 생산 및 분석 파이프라인 구축으로 대용량 NGS(Next Generation Sequencing) 유전체 데이터와 다중 이형 바이오 빅데이터 처리, 가공, 분석을 위한 시스템을 구축하였습니다.
 
  • 한국희귀질환재단
한국희귀질환재단(Korean Foundation for Rare Disease)은 시민과 지자체, 기업, 단체 등의 후원과 참여로 이루어지는 순수 공익재단으로, 그 모체가 되는 '한국희귀질환연맹'의 지난 10년 동안의 활동을 통해 파악된 희귀질환 환자와 가족들의 충족되지 못한 욕구와 간절한 염원을 담아 희귀질환찾기, 유전상담 서비스 지원, 효율적인 희귀질환 치료를 위한 R&D 연구 지원, 진단 사업 지원, 자원봉사 네트워크 구축 및 관리 지원, 특수 보육 교육 프로그램 개발 및 지원 사업 등을 보다 전문적이고 효율적으로 제공하기 위해 설립되었습니다.
 

<그림8. 한국희귀질환재단 홈페이지>
 
 

 
이상이 국내외 대표적인 희귀질환 관련 단체에 대한 간략한 설명이었습니다. 위의 단체들은 각기 지역과 국가, 질환에 특화된 환자와 가족을 대상으로 하는 다양한 서비스를 제공하고, 진단과 치료를 위한 지침과 성과를 지속해서 업데이트하고 있습니다. 말라리아의 경우 아프리카에서는 너무나 흔한 질환이지만 북유럽의 경우는 희귀질환인 경우가 있듯이 전 세계가 연구 성과를 공유하고 지속해서 정보를 수집하고 분석한다면 희귀질환 극복의 시기를 앞당길 수 있을 것이라 기대하며 위의 단체와 기관은 설립 목적을 잊지 않고 질환 극복의 그 날까지 계속해서 정진해 나가기를 바라며 이만 희귀질환 관련 기관 소개를 마칩니다.
 
 
작성 : 대전지사 양성진 책임 개발자

Posted by 人Co

2021/02/28 20:23 2021/02/28 20:23
,
Response
No Trackback , No Comment
RSS :
https://post-blog.insilicogen.com/blog/rss/response/372



« Previous : 1 : 2 : 3 : 4 : 5 : 6 : ... 38 : Next »