컴퓨터공학 전문가가 본 AI 신약개발 "이미 상당수준"
- 김진구
- 2019-11-13 06:15:16
- 영문뉴스 보기
-
가
- 가
- 가
- 가
- 가
- 가
- "후보물질 발굴·검증, 임상시험에 활용…관건은 역시 데이터"
- 강재우 고려대 교수, '바이오플러스 2019'서 사례 소개
- AD
- 12월 3주차 지역별 매출 트렌드 분석이 필요하다면? 제약산업을 읽는 데이터 플랫폼
- BRPInsight
[데일리팜=김진구 기자] 'AI(인공지능)'를 이용한 신약개발에 글로벌 제약사들이 큰 관심을 보이고 있다. 후보물질 발굴부터 임상시험, 승인을 거쳐 시장에 진출까지 10년 넘는 세월과 이에 따르는 비용을 AI가 획기적으로 줄여줄 것이라는 기대다.

강재우 고려대 컴퓨터과학과 교수는 12일 서울 코엑스에서 열린 '바이오플러스 2019'에서 AI 신약개발이 이미 현실로 다가오고 있다고 설명했다.
그는 'AI 기반 의약품 개발'이라는 세션에 발표자로 나섰다. 그는 AI가 특히 후보물질 발굴과 검증, 임상시험 분야에서 강점을 보일 것으로 예상했다.
또, 실제 이와 관련한 사례를 소개하고 글로벌 경진대회에서 잇따라 우승한 경험을 덧붙였다.
◆후보물질 발굴ㅣ구글 제친 구글모델
그에 따르면 AI가 신약개발 과정에서 가장 두각을 나타낼 단계는 후보물질 발굴이다.
현재 후보물질 발굴은 주로 문헌검색을 통한 수동적인 방식을 통해 이뤄진다. 전 세계 최대 의학논문 사이트인 '펍메드'에서 관련 논문을 일일이 읽고, 가설을 세우는 식이다.
그러나 펍메드에 새로 실리는 논문은 보수적으로 계산해도 하루 5000건이나 된다. 사람이 일일이 확인하기란 불가능한 것이다. 여기에 AI가 기여할 수 있다는 것이 강 교수의 설명이다.
그는 AI의 '인간 언어학습 능력'에 집중했다. 그는 구글의 '딥러닝' 기술을 기반으로 'BioBERT'라는 프로그램을 지난 1월 만드는 데 성공했다. 이 프로그램에 원하는 의학 관련 질문을 입력하면 AI가 답변하는 식이다.
구글이 앞서 공개한 'BERT'의 제약바이오 분야 확장판 격이다. 구글은 위키피디아의 언어를 딥러닝으로 학습시켜 BERT라는 프로그램을 만든 바 있다. 위키피디아의 언어를 데이터로 입력시켰다.
BioBERT에선 위키피디아 대신 펍메드와 PMC(또 다른 의학논문 검색사이트)의 언어를 학습시켰다. 160억개의 단어가 데이터로 입력됐다.
BioBERT의 능력은 전 세계적으로 인정받았다. 제약바이오 분야 AI 경진대회 중 하나인 'BioASQ'에서 1위를 거머쥐었다. 구글은 2위였다. 구글의 모델을 갖고 와서 구글보다 나은 프로그램으로 재탄생시킨 것이다.
그는 "프로그램이 얼마나 정확한 대답을 하는지 보는 테스트였다"며 "(BioBERT를 통해) 후보물질 발굴에 걸리는 기간과 노력을 상당히 줄일 수 있을 것"으로 내다봤다.
◆후보물질 검증ㅣ최적의 물질 검색
가설을 세웠다면 이를 검증하는 것이 그 다음 단계다. 강 교수는 여기서도 AI가 기여하는 바가 많다고 설명했다.
실제 경험을 덧붙였다. 올해 치러진 'IDG-DREEM'이라는 대회였다. 미국 뉴욕의 마운트시나이의대 교수들이 본인들의 가설을 문제로 내면, 전 세계 AI 전문가들이 답변을 찾는 방식으로 진행됐다.
여기서 강 교수팀은 2년 연속 우승을 했다. 올해는 공동우승이었다. 미국 일리노이주립대와 중국 중화대의 컨소시엄, 노스캐롤라이나주립대 등과 같은 위치에 섰다.
교수들이 낸 문제는 '갑상선수질암에서 특정 약물과 병행했을 때 가장 효과적인 물질이 무엇인지 ZINC15(제약바이오분야 화합물 DB)에서 찾으라'는 것이었다.
서로 다른 구조의 약물이라도 기전이 비슷할 경우, 비슷한 약물로 인식하도록 강 교수팀은 기계학습 모델을 학습시켰다. 그 결과 10개 물질을 검색하는 데 성공했다. 이 가운데 7개 물질은 관련 논문이 있는 것으로도 확인됐다.
◆임상시험ㅣ환자·바이오마커 선택
AI는 임상시험 과정에서도 도움을 줄 것으로 강 교수는 예상했다. 그는 "특정 약물이 어떤 환자에게, 혹은 어떤 바이오마커에 특히 효과적인지 미리 입력된 환자정보를 통해 예측할 수 있다"고 말했다.
2016년 아스트라제네카가 생어(Sanger)와 함께 대회를 개최했다. 환자의 유전정보와 약의 효과를 공개한 뒤, 어떤 암에 가장 효과가 클지 예측하는 것이 문제였다.
앞 단계인 후보물질 발굴·검증보다 더 많은 데이터 작업량이 들어간다고 강 교수는 설명했다. 당시 최신 기종의 전문가용 컴퓨터였음에도 자체적으로 한 문제를 푸는 데 20시간이 넘게 걸렸다. 결국 20대를 추가 구입해 처리속도를 20배로 높인 끝에 1시간으로 줄였다.
이 대회에 첫 출전한 강 교수팀은 2위를 했다. 이듬해인 2017년 미국 국립암연구소(NCI)가 주최한 대회에선 1위로 올라섰다.
그는 "2016·2017년 대회의 경우 주최 측에서 미리 정리해둔 양질의 환자정보를 활용했기 때문에 성공할 수 있었다"며 "데이터를 정제하는 것은 AI에서 굉장히 중요한 문제다. 실제 현장에서도 정보의 양과 질이 매우 중요하게 작용할 것"이라고 말했다.

이어진 발표에서도 데이터의 중요성이 강조됐다. 미국 다케다제약에서 AI 신약개발 관련 업무를 담당 중인 신현진 박사는 "망망대해에 떠 있는 기분이다. 사방이 물인데 마실 물이 없다"고 비유했다.
데이터는 많지만 쓸 만한 데이터는 없다는 지적이다. 그는 "머신러닝이 발전하려면 표준화된 데이터가 나와야 한다. 그러나 현재는 저마다 데이터의 형식이 달라서 사용하기 어렵다"고 설명했다.
그는 "장기적으로 전쟁에서 이기려면 보급이 가장 중요하다"며 "AI 신약개발도 마찬가지다. 데이터의 양과 질 모두가 중요하다. 질이 낮으면 정확도가 떨어지고, 양이 적으면 편향된 결과를 내놓을 우려가 있다"고 강조했다.
관련기사
-
제약바이오 미래...콜라보·오픈이노베이션이 해답
2019-10-29 14:20:00
-
"AI는 신약개발 끝판왕…갈증해소 가능성 제시"
2019-08-30 12:20:25
-
내년 제약 지원 153억 편성…AI 신약개발 교육 13억
2019-08-29 09:00:05
-
AI 신약개발, 양질 데이터 확보 관건…협업 시스템 절실
2019-08-28 06:20:52
- 댓글 0
- 최신순
- 찬성순
- 반대순
-
등록된 댓글이 없습니다.
첫 댓글을 남겨주세요.
오늘의 TOP 10
- 1"근무약사 연봉 1억"...창고형약국, 파격 급여 제시
- 2플랫폼 도매금지법 간담회, 편파운영 논란…"복지부 협박하나"
- 3'마운자로', 당뇨병 급여 적정성 확인…약가협상 시험대
- 4"눈 영양제 효과 없다고요? '이것' 확인하셨나요?"
- 5부광약품, 회생절차 유니온제약 인수 추진…"생산능력 확충"
- 6제네릭사, 카나브·듀카브 이어 듀카로 특허공략 정조준
- 7경보제약, ADC 생산 전면에…종근당 신약 속도 붙는다
- 8대통령 발 공단 특사경 지정 급물살...의료계 강력 반발
- 9국내 개발 첫 GLP-1 비만약 나올까...한미약품, 허가 신청
- 10대통령 직접 나선 공단 특사경...임의지정 아닌 법개정 탄력









