Jupyter는 웹환경에서 실행코드와 문서를 함께 작성하면서 실행 결과 및 가시화 결과 (차트 등)을 확인할 수 있는 웹 어플리케이션 프로그래밍 도구입니다. 동작하는 코드와 그 결과를 문서와 함께 직접 만들고, 또 변경하며 관리할 수 있다는 장점때문에 데이터 분석 실무에 폭넓게 사용되고 있습니다. 당사 R&D Center와 컨설팅팀에서도 일부 생물정보 분석을 Jupyter Notebook으로 수행하고, 그 결과를 고객에게 제공하고, 직접 시연하면서 좋은 반응을 얻고 있습니다.

pandas는 효과적인 데이터분석을 지원하는 python 모듈입니다. R에서 자주 사용되는 DataFrame, 즉 엑셀 쉬트 같은 2차원 테이블 데이터를 파이썬에서도 좀더 파이썬스럽게 사용할 수 있습니다. 이전에는 데이터 분석한다 하면, R로만 해야하는 경우가 많았었는데, pandas가 등장한 뒤로, 파이썬에서도 손쉽게 DataFrame 데이터를 다루고, 프로그래밍할 수 있게 되었습니다. 데이터 분석분야에 R이 더 좋으냐, Python이 더 좋으냐 논란이 있기도 했습니다. (R vs Python for Data Science: The Winner is …) 각각 장단점이 있습니다만, 객체지향적이고, 성능 더 좋고, 응용프로그램을 만들기 좋다는 점 때문에 점점 Python을 활용한 데이터 분석이 점점 더 부각되고 있습니다. 특히, Jupyter 환경에서 pandas로 데이터 분석하고, 동작코드를 잘 문서화해두면, 기존의 어떤 데이터 분석 환경보다 더 나은 생산성을 기대할 수 있습니다.

본 블로그 포스팅을 통해, Jupyter와 pandas의 데이터 분석 사례를 쉬운 예제와 함께 소개해보고자 합니다. (Python, Jupyter, pandas는 모두 잘 설치되어 있다고 가정합니다. 설치 방법은 별도의 문서를 확인하세요)

이번에 소개할 데이터 분석 예제는 다음과 같은 성적표입니다.

위 데이터를 갖고, 1반과 2반은 통계적으로 유의한 성적차이가 있는지, 유의한 차이를 나타내는 과목은 어떤 과목인지, 성적 패턴이 비슷한 학생은 누구인지 등등, 저 데이터를 이용해서 알 수 있는 정보들이 많습니다. 이를 Jupyter로 분석해 보겠습니다.

다음 링크를 클릭하면, Jupyter 문서를 볼 수 있습니다. --> 성적 데이터 분석 사례

Jupyter의 장점이 분석용 프로그램 코드가 함께 문서화된다는 것입니다. 링크의 설명을 참고하세요, (링크의 메뉴에 보면 json 파일 다운로드가 있습니다. json 파일과 아래 성적표.xlsx 파일을 하나의 디렉토리에 두고 Jupyter를 실행하시면, 본 문서 겸 프로그램을 직접 구동할 수 있습니다.)

.

잘 보셨나요? 이 예제는 간단한 성적표이지만, 실제 실무의 많은 데이터들이 이것과 비슷합니다. 생물정보 분석한다면 가로는 유전자 혹은 유전좌위, 세로는 샘플인 데이터를 많이 다루겠지요. 핵심 개념과 활용 방법은 비슷합니다. 모쪼록 이 자료가 데이터 분석 실무를 수행하는데 도움이 되길 바랍니다. 다음 기회에 또 다른 유용한 통계 분석기능을 소개하겠습니다.



작성자 : R&D센터 김형용 책임 개발자

Posted by 人Co

2016/01/22 14:53 2016/01/22 14:53
Response
No Trackback , No Comment
RSS :
https://post-blog.insilicogen.com/blog/rss/response/197

2015년 (주)인실리코젠 송년회 후기!

人Co의 2015년도를 한마디로 표현해 보자면 다사다난 이라는 말이 적절할 것 같습니다. 생물정보 전문기업이라는 비전을 제시하고 있는 人Co가 기존에 수행하고 있는 생물정보 분석/컨설팅, SW판매/컨설팅 및 용역사업, 연구과제들을 수행하는 반면 시대흐름에 맞춰 새로운 비지니스 모델을 발굴하기 위해 힘겨운 병행을 하였습니다. 그런 가운데 人Co인들이 협력하여 새로운 비지니스 모델도 어느 정도 윤곽이 드러나고 있고, 수행했던 모든 사업들도 성공적으로 마무리하여 오늘... 12월 18일, 얼마전에 개소식을 마친 人CoFLEX에서 2015년도 송년회를 개최하였습니다.



올해 송년회의 사회는 2015년 7월에 人Co에 합류하신 이지현 주임님께서 맡아주셨습니다. 좌중을 압도하는 특출한 말솜씨를 앞세워 송년회 분위기를 한껏 띄워주셨습니다.



송년회의 첫번째 순서는 프로젝트 리뷰였습니다. 올해 각 팀별로 수행한 사업의 성과를 팀장이나 팀원이 발표하고 그 가치를 공유하고, 서로의 노고에 박수를 쳐주기 위한 자리였습니다. 슬라이드 하나하나를 보면서 들을때마다 완벽하지 않은 환경속에서도 사업의 성공적인 마무리를 위해 애쓰신 흔적이 역력하였습니다.



DX팀, Consulting팀, Convergence팀, Descign팀, 리서치실, 솔루션그룹, 대전지사, 시맨틱스그룹, MD협의회 모두모두 수고 많으셨습니다.



다음으로 사장님의 송년사가 이어졌습니다. 매 행사때마다 좋은 말씀 많이 해주시는데, 오늘 송년사의 키워드는 협력이었습니다. 강조하신 문구를 적어보면...
여러 사람들이 다르지만, 모두 연결되어 있고, 다르기 때문에 매력을 느낄수 있다. 역사적으로 보았을 때 동일하게 반복되어져 온 사실이고, 이 다름과 연결속에서 성장이 있었고 발전이 있었다. 그 과정을 겪으면서 사람과 집단이 성장할 수 있으니, 그렇기 때문에 협력을 하는 것이 중요하다.



다음 순서는 선물교환 순서였습니다. 직원들이 각자 1만원 상당의 선물을 준비하여 자신이 뽑은 사람에게 선물을 주고 덕담한마디씩 해주는 시간을 가졌습니다.
제가 기억에 남는 선물은 조관희 팀장님의 지푸드 식권이었습니다. 선물도 주고받고 덕담도 주고받고... 모두들 즐거웠던 선물교환 행사였던 것 같습니다.



다음 순서는 영화관람이었습니다. 특별히 이번 영화관람은 극장에 가지않고 人CoFLEX에서 자유롭게 식사하면서 영화관람을 했습니다. 편하게 식사하면서 영화도 볼 수 있는 人CoFLEX... 이제 극장 갈 필요 없을 것 같네요... ^^

마지막 순서는 전체 회식이었습니다. 영화 보면서 든든히 배도 채웠겠다... 회사 근처 세계맥주전문점에서 2015년도 마지막 회포를 풀었습니다.



이후에도 2차 회식자리를 마련하여 올해의 마지막을 활활 불태웠습니다. 저에게는 올해 송년회가 벌써 10번째 행사였습니다. 10년 세월을 돌아보니 처음 입사했을때 5명이었던 인원이 지금은 40명이 넘는 튼실한 강소기업으로 자리 잡은 느낌입니다. 저의 작은 바램이 있다면, 오늘 송년회 자리에 참석하여 희노애락을 함께 나누었던 人Co들이 10년, 20년, 앞으로도 쭈~~~욱 오늘과 같은 날을 계속 맞이했으면 좋겠습니다.

작성자 : 경영지원실 박병준 선임

Posted by 人Co

2015/12/29 16:26 2015/12/29 16:26
Response
No Trackback , No Comment
RSS :
https://post-blog.insilicogen.com/blog/rss/response/196



인실리코젠은 지난 10년간 생물정보 전문기업으로 한 걸음 한 걸음 성장해 왔으며, 새로운 바이오 빅데이터 시대를 향해 한 걸음 더 나아가고 있습니다.

또한 인실리코젠은 국내 외 다양한 협력기관들과 협력하여 생물정보 분야의 선두주자로서 위치를 굳건히 하고 있습니다.

당사의 사업 확장을 위한 전문 인력 보강을 위해 관련 업무를 담당하실 인재를 모집합니다. 관심있는 분들의 많은 지원 바랍니다.

[상세모집요강]

병역특례 대상자 지원 가능(당사 전문연구요원 병역특례 지정업체임)

[전형절차]
위 일정은 구인 진행상황에 따라 변경될 수 있습니다.


[
채용형태
]
경력
: 정규직 0(상호 검증기간 1개월)
신입
: 인턴직 0(인턴 3개월 후 정규직 전환(검증통과자))
병역특례 입사 가능


[
근무환경
]
- 4
대보험
-
5일 근무
-
퇴직연금 및 성과급
- 야근 시 석식 제공

-
경조사휴가 및 지원
-
자기개발 지원
-
주차비 지원
-
체력단련 지원
- 장기근속자에 대한 충전휴가 및 유연근무제


[
접수기간 및 방법
]
-
마감일 : 20151211()
-
이력서양식 : 자사 입사지원서
-
접수방법 : e-메일접수(recruit@insilicogen.com) 


[
제출서류]

1. 자사 입사지원서 : 파일명 `입사지원서_성명_지원분야.docx`으로 저장
2.
서류전형 합격자는 포트폴리오(PPT) 제출 및 발표(경력위주, 5분 이내)



[
기타사항]

1. 기본예의 등 소양이 되어 있는 자(필수)
2.
해외 출장이나 개인 신용에 결격사유가 없는 자
3.
채용절차 진행 중 당사에 부합하는 지원자가 조기 채용 시 본 채용공고는 위 일정과 상관없이 종료될 수 있습니다.
4.
최종합격 후 입사지원서 및 제출서류 내용에 허위사실이 발견될 경우 채용이 취소될 수 있습니다.
5.
최종합격 후 원천징수영수증, 고용보험이력확인서, 경력증명서 제출(경력직)
6.
제출된 서류는 일체 반환하지 않습니다.
7.
절차별 합격자는 E-mail을 통해 개별 안내해 드립니다.
8.
연봉 : 회사내규 및 경력에 따른 협의


[
문의처
]
-
인실리코젠 채용담당자
- E-mail
을 통해 문의하여 주시기 바랍니다.(mst@insilicogen.com)

Posted by 人Co

2015/12/01 08:14 2015/12/01 08:14
Response
No Trackback , No Comment
RSS :
https://post-blog.insilicogen.com/blog/rss/response/195

집단지성의 힘과 위키

1989년, 알래스카 해상에서 5,300 갤런의 원유를 싣고 가던 유조선이 좌초되었습니다. 유출된 원유의 양은 1,100만 갤런으로 당시까지 발생한 해양 원유 유출 사고 중 사상 최악으로 기록되고 있습니다(참고: 엑슨발데스 원유 유출 사고, 현재 최악의 사고는 딥워터 허라이즌 기름 유출 사고). 이 사고로 일대에 서식하던 바다새, 해달, 수달 등 해양생물이 집단 폐사하였고, 현재에도 그 영향으로 그 지역의 각종 해양 동물 개체 수가 계속해서 감소 하고 있다는 보고가 있습니다.

당시 하루 1만명이 넘는 사람들이 방제에 동원되었고 1년동안 20억 달러의 천문학적인 비용을 들여 사고수습에 힘썼습니다. 하지만 유출된 기름은 젤리상태로 물과 엉겨 붙어 분리가 어려웠고 심각한 환경오염을 일으켰습니다. 결국 이 문제는 17년이나 지속되었습니다.


(좌) : 원유유출으로 피해를 입은 동물들 / (우) : 원유유출 범위 (출처 : 구글)

이를 고민하던 국제기름 유출 연구소(OSRI)는 '이노센티브(InnoCentive)' 라는 한 기업에 이 문제를 의뢰하게 됩니다. 이노센티브는 전 세계의 수많은 사람들에게 문제를 공유하고 해결책을 찾아주는 '문제의 집단 해결' 서비스를 제공하는 전문기업입니다. 문제를 올리자 전세계의 수많은 사람들의 아이디어가 올라왔고, 마침내 단 3개월 만에 한 시멘트회사 엔지니어의 아이디어로 17년간 해결하지 못했던 문제를 해결하게 됩니다.

대중은 전문가보다 똑똑하다.

'군중의 지혜(wisdom of crowd)'의 저자 제임스 서로위키(James Surowiecki)는 집단은 지능적일 수 있고, 심지어 그 집단 안의 가장 똑똑한 사람보다도 더 똑똑할 수 있다고 말합니다. 실제로 그는 유리병 안의 구슬 수를 예측전문가와 다수의 비전문자에게 예측하도록 했는데 비전문자 여러명의 결과가 실제 구슬의 수에 가까웠다고 합니다.

우리는 이미 페이스북과 트위터 등을 통해 개개인이 모여서 만들어내는 대중의 강력한 힘을 느끼고 있습니다. 문제가 생겼을 때 많은 사람들이 도서관이나 전문가를 찾는 대신 인터넷 커뮤니티에 질문을 올리고 그 답을 찾습니다. 개인의 힘은 미미하지만 개인이 모이면 전문가보다 더 큰 힘을 발휘하는 것, 이것이 바로 집단지성 입니다.

우리 주변에서 집단지성을 이용한 사례들을 쉽게 찾아 볼 수 있습니다. 4천만명이상의 사용자를 보유하고는 네이버의 지식교류서비스 '지식iN' 또한 그 중 하나로, 무엇이든 궁금한것을 올리면 이내 여러 사람들의 답변이 달리는 것을 볼 수 있습니다. 소프트웨어/하드웨어의 소스코드를 공개하고 누구나 수정할 수 있도록 한 '오픈소스' 또한 집단지성을 이용한 예 입니다.

위키(Wiki), 그리고 人Co 인들이 느끼는 집단지성의 힘

집단지성의 힘을 잘 활용한 예 중 하나는 위키(Wiki)시스템이라고 할 수 있습니다. 위키는 웹브라우저를 이용해서 사용자 누구나 내용을 쉽게 추가하고 수정할 수 있는 웹사이트를 말 합니다. 위키는 한사람의 의해 만들어지는 문서가 아니기 때문에 많은 사용자의 지속적인 협력이 있어야 더욱더 휼륭해지고 풍성한 웹 사이트가 됩니다. 전 세계의 많은 사람들이 이용하고 있는 위키피디아(http://wikipedia.org)가 대표적인 예라고 할 수 있습니다.

사용자 삽입 이미지
위키를 창안한 워드 커닝엄 (출처 : 위키피디아)

(주)인실리코젠에서도 수 년간 사내 인트라넷으로 위키시스템을 사용하고 있습니다. 人Co인들 모두 개인이 모여 만들어 내는 큰 힘을 직접적으로 느끼고 있습니다. 업무 중 일어나는 모든 일들이 사내위키를 통해 기록되고 공유되며, 누구든 자유롭게 자신의 의견을 추가 합니다. 이렇게 만들어진 인실리코젠의 위키는 전문가보다 더 전문적인, 그리고 실질적인, 생생한 정보들이 축적되어있고 지금도 만들어지고 있습니다.

전 세계 수많은 사용자들의 참여로 위키피디아가 매우 휼륭한 방향으로 발전할 수 있었지만, 특정분야의 전문지식을 얻고자하는 사람들에게는 여전히 위키피디아에서 얻을 수 있는 정보는 한계가 있습니다. 예를 들어, Biopython의 역사와 주요 특징에 대한 정보는 찾을 수 있으나, 좀 더 세부적으로 Biopython의 SeqIO 모듈이 제공하는 기능과 사용법에 대한 내용들은 추가로 다른 책이나 웹 사이트에서 찾아봐야 합니다. 더군다나 영어와 한국어 간 위키 자료의 양 차이도 매우 커 대부분의 문서는 영어로 되어있습니다. 이러한 한계를 극복하고자 만들어진 전문분야 위키 중 하나로 생물정보분야의 人CoDom (인코덤, http://incodom.kr)이 있습니다.



마치며

한편에서는 집단지성의 한계와 신뢰성에 대해 지적하고 있습니다. 구성원의 의지와 참여도가 낮으면 당연히 결과물의 질이 낮아질것이고, 일부 사용자의 악의적인 활동을 통제하는 것 또한 쉽지 않습니다. 근본적으로 참여자들의 지식이 편향되어 있다거나 다른 사람의 의견에 쉽게 동조하는 경향이 있다면 이 또한 신뢰할 수 없는 결과물을 만들어내는 요인이 됩니다. 실제로 미국 국립과학원 회보(PNAS)에 실렷던 한 연구에서는 질문을 할때, 다른 이의 대답을 알려주었을 경우가 그렇지 않을 경우에 비해 대답의 다양성이 줄었다는 보고가 있습니다.

그럼에도 불구하고 집단지성을 무시할 수 없는 것은 기술의 발달로 점점 더 쉽게 자신의 의견을 공유 할 수 있는 환경이 되고있기 때문입니다. 대중이 만들어 내는 집단지성의 힘은 그 누구도 부인 할 수 없습니다. 그러므로 집단지성의 한계와 특징를 알고 올바르게 활용한다면 누구나 전문가 안부러운 '지성'을 가질 수 있을 것입니다.



작성자 : 데이터사이언스센터 솔루션그룹
김지예 개발자

Posted by 人Co

2015/11/30 09:29 2015/11/30 09:29
Response
No Trackback , No Comment
RSS :
https://post-blog.insilicogen.com/blog/rss/response/194



일정

일시 : 201512월 14(월)~ 12월 16(수)

장소 : KT인재개발원 1연수관 207호


내용

식물 유전체 데이터 분석 및 활용

(자세한 프로그램 내용은 http://kobicedu.labkm.net 참고)



신청방법

신청기간 : 2015년 11월 30일(월) ~ 2015년 12월 2(수)

선발인원 : 30

교육대상 :

  1) 식물 유전체 분석에 대한 이해와 분석 방법의 교육이 필요한 연구원 및

     대학원생 등

  2) 모든 교육 일정에 참석이 가능한 교육생 (3일 일정 필수 참석)

선발안내 : 2015년 12월 3일(목) ~ 2015년 12월 4일(금)

교육비 : 무료 (중식 무료제공)

준비물 : 유무선 인터넷이 가능한 개인 노트북

신청방법

  - 온라인 신청 http://kobicedu.labkm.net

문의

  - ㈜인실리코젠 (031-278-0061, edu@insilicogen.com)

  - 문의게시판 이용 http://kobicedu.labkm.net/labboard/board/QnA

Posted by 人Co

2015/11/27 16:50 2015/11/27 16:50
Response
No Trackback , No Comment
RSS :
https://post-blog.insilicogen.com/blog/rss/response/193



« Previous : 1 : ... 34 : 35 : 36 : 37 : 38 : 39 : 40 : 41 : 42 : ... 75 : Next »