신승우 대웅제약 AI신약팀장 "데이지, 모든 연구원들이 사용 중...AI 신약개발 성공사례 만들겠다"
[AI 신약개발 심층인터뷰] "3명 팀 체계적 운영 통해 8억종 화합물 분자 기반 AI모델 구축 ...올해 LLM 신약개발 모델도 도전"
(사진 왼쪽부터)AI신약팀 서미현 팀원, 신승우 팀장, 신호선 팀원. 3명이서 독자적인 AI 신약개발 시스템인 '데이지(DAISY, Daewoong AISYstem)'를 구축했다.
[메디게이트뉴스 임솔 기자] 인공지능(AI) 신약개발에 대해 국내외 관심이 뜨겁다. 국내 제약회사들도 관련 조직을 만들고 AI에 대한 공부가 한창이다. 이미 4년 전인 2021년 AI신약팀을 세팅해서 관련 성과를 내고 있는 곳이 대웅제약 AI신약팀이다.
대웅제약은 2024년 독자적인 AI 신약개발 시스템인 '데이지(DAISY, Daewoong AISYstem)'를 구축했다. 이 시스템은 8억 종 화합물의 분자 모델 데이터베이스인 '다비드(DAVID, Daewoong Advanced Virtual Database)'를 활용해 후보물질 발굴을 지원하며, 비만 및 항암 연구 분야에서 뚜렷한 성과를 보여주고 있다. 특히 데이지는 현재 △가상 탐색 △도킹 시뮬레이션 △분자동역학(MD) △약물 흡수·분포·대사·배설·독성(ADMET) 등 4단계에 걸친 모든 신약개발 AI 시스템을 구축했다.
대웅제약 신승우 AI신약팀장은 "지난해 데이지 시스템을 오픈한 이후 내부 연구원들이 약 600번 정도를 이용했다. 기본적으로 하루에 한 번 정도는 쓰는 것으로 보인다"라며 "처음에는 실험을 위주로 하는 신약개발 연구원들이 AI 통한 신약개발을 신뢰하지 않았다. 하지만 신약개발에 AI를 도입하면서 성과를 도출하다 보니 인식이 바뀌고 있다"고 말했다.
신 팀장은 이어 “올해는 LLM(Large Language Models) 기반 신약개발 모델을 만들고자 한다”며, “AI를 활용해 후보물질 발굴부터 전임상 진입까지 1년 이내로 가능하게 된다면 의미 있는 성공 사례가 될 것”이라고 강조했다.
다음은 신승우 팀장과의 일문일답.
2021년 3명이서 AI신약팀 출발...데이지, 다비드, 다비스 구축 등 성과
ㅡ대웅제약 AI신약팀은 언제 어떻게 탄생했나. 처음 AI신약팀이 태동한 역사와 함께 팀 구성과 구성원들의 전문성, 현재 하고 있는 업무 등에 대해 소개를 부탁드린다.
팀장인 본인은 질병관리청 유전체 센터에서 바이오마커 발굴 연구, 한국고등과학원(KIAS)에서 단백질 구조 예측 연구, 순천향대학병원에서 유전체 연구를 진행한데 이어 신테카바이오에서 2년 6개월 정도 AI신약개발에 대한 연구를 진행했다. 유전체, 단백체 및 신약관련 연구 등 신약개발에 필요한 다양한 경험을 쌓았다.
AI신약팀은 2021년 12월에 처음 팀이 만들어질 때부터 3명이서 시작했다. 팀원 한 명은 수학을 전공했고, 다른 한 명은 식품공학을 전공한 후 석사 때 머신러닝을 전공했다. 팀원들은 모든 신약 개발 업무를 공유하는데 다들 AI와 관련한 이해도가 빠르고 신약개발 AI모델 개발도 직접 한다. 맨 처음 시작할 때는 정말 신약개발 인프라가 하나도 없었다. 1년 정도 조직을 셋업하고 신약개발 툴(tool)을 만들어서 신약개발 과제에 적용하기 시작했다.
AI신약팀은 우선 '다비드(DAVID)'라는 화합물 DB를 구축하고 AI를 적용해 빠른 가상 탐색을 할 수 있게 했다. 이 과정에서 화합물 DB의 전처리 단계가 필요한데 CPU(중앙처리장치) 200대 정도를 돌려 한 달 반 정도에 걸쳐 프로세싱을 했다. 그래서 가상탐색을 더 빠르게 및 정확하게 할 수 있었고, 이를 기반으로 신약후보물질 탐색 툴(tool)인 '다비스(DAVIS, Daewoong AI VIrtual Screening)' 시스템을 구축했다.
또한 신약개발의 90% 이상 실패하는 ADME/T(약물의 흡수, 분포, 대사, 배설 및 독성) 단계에서 성공률을 높이기 위해서 대웅 자체 AI ADME/T 예측 시스템인 DAI4ADME을 개발했다. 이 AI 예측 시스템은 TDC(ADMET Benchmark Group) 사이트의 ADME/T 23개 항목 중 17개 분야에서 세계 정상 수준을 기록하기도 했다.
신승우 AI신약팀장은 "AI신약개발을 하기 위해선 AI를 활용하고 데이터를 해석하는 사람의 인사이트가 가장 중요하다"고 말했다.
ㅡ기존에 발표가 많이 되긴 했지만 대웅제약 신약개발 시스템 '데이지'는 무엇인가.
현재 AI신약팀이 신약개발과 관련한 AI 모델을 '데이지'에 전부 다 올려놨다. 올려진 모델은 가상탐색, 도킹, ADMET 예측, 단백질 구조예측, 단백질-화합물 결합 구조 분석 등이 가능하다. 대웅제약 연구원이라면 누구나 그 웹에 접속해서 신약개발을 할 수 있도록 모델을 구축했다.
올려진 AI 모델들은 먼저 인실리코(in silico, 컴퓨터 시뮬레이션이나 가상 실험을 통해 연구하는 방식) 신약 개발을 진행할 경우 단계를 나눠보고 어떤 단계에서 어떤 AI 알고리즘을 적용 할 수 있는지를 분석을 통해 개발했다. AI 모델을 만들 때 기본적으로 공개 데이터를 많이 사용하고 여기에 대웅제약의 자체 데이터를 합쳐서 대웅제약 신약 연구에 좀 더 잘 맞는 AI 모델을 구축했다. 일단 AI 모델을 만든 다음 내부 연구원들의 피드백을 반영해 대웅제약에 맞는 AI 모델로 최적화했다.
특히 이렇게까지 가능했던 이유가 그만큼 대웅제약 경영진이 적극적인 지원을 해줬기 때문이다. 데이터를 프로세싱하는 데만 2개월 이상 걸리고, 코딩하고 프로그램을 만들면서 결과가 도출되기 전까지 수많은 시간과 비용 투자가 필요하다.
모든 연구원들이 신약개발에 AI 적용 시작...신약개발 비용과 시간 줄이고 효율 높이고
ㅡ연구원들이 신약개발 시스템에 대해 어떻게 생각하고 활용하고 있나.
처음에는 실험을 위주로 하는 신약개발 연구원들이 AI를 통한 신약개발을 신뢰하지 않았다. 하지만 신약개발에 AI를 도입하면서 성과를 도출하다 보니 인식이 바뀌기 시작했고, 현재 회사 내 연구원들로부터 많은 협조 요청이 들어오고 있다.
보통 신약개발 연구원들은 AI 신약개발 시스템에 대해 접근성이 떨어져 이용하기 힘들어 한다. 이 문제를 극복하기 위해 AI신약팀은 편하게 AI 신약개발 툴(tool)을 쓸 수 있게 웹(Web)베이스로 시스템을 만들었다. 이를 통해 도킹 등 다양한 AI 신약개발 과정에서 예측하고 싶은 항목에 대해 메뉴를 클릭하면 2, 3분 이내에 결과를 받아볼 수 있도록 신약 개발 시스템을 개발했다.
연구원들이 실험을 진행하려면 시간과 비용이 많이 필요하다. 하지만 AI를 이용한 신약개발은 단 몇 분만에 그 결과를 예측할 수 있다. 예를 들어 100개의 화합물이 있다면 AI모델로 예측한 다음 20개만 성공 가능성이 있다고 할 경우, 그 20개에 대해서만 실험을 진행하면 된다. 그만큼 신약개발에 들어가는 비용과 시간을 줄일 수 있다. 전체적인 과정을 봤을 때는 성공확률도 2배 이상 높다. 실험을 위주로 해오던 연구원들도 AI의 장점을 점점 이해하고 있고 신약개발에 AI을 적용하고 있다.
ㅡ데이지 개발 이후 현재 어떤 단계까지 와있나. 전임상과 임상, 예측 등 어느 단계에서 주로 활용하고 있나. 실제 유의미한 신약개발 기간 단축 성과가 있다고 판단하고 있나.
데이지 시스템은 작년에 오픈했는데 내부 연구원들이 약 600번 정도를 이용했다. 기본적으로 하루 한 번 정도 쓰는 것으로 보인다. 도킹, 가상탐색, 단백질 결합 분석 등 전임상 단계에서 많이 이용한다.
데이지는 연구원들에게 화합물 구조에 어떤 변화를 줬을 때 얼마나 좋아지고 나빠지는지, 얼마나 바뀔 수 있을지, 성공인지 실패인지 가늠할 수 있도록 도와준다. 빠르게 기존 물질에 비해 성공 가능성을 미리 가늠해볼 수 있고 제대로 구조를 설계했는지 확인할 수 있다. AI 분석 결과를 통해 설계에 오류가 있으면 즉시 확인할 수 있다. 연구원들이 직접 데이지에서 검색을 해보고 지속적인 소통을 통해 연구에 적용해 나가고 있다.
신약센터에 여러가지 팀이 있고 다수의 과제를 진행하고 있다. AI신약팀이 모든 과제에 참여해서 신약개발 초기 단계에서 스크린이나 약효가 있을만한 것을 AI 모델로 예측한다. 예측된 약물을 갖고 과제 연구원들이 약효나 활성에 대해 찾아본다. AI가 전 단계에서 다 관여하는 것이다.
내부적으로 비만이나 항암 등에 관심이 많다. 비만 관련 신약개발 팀은 1년동안 탐색을 하지 못하다가 AI 모델을 이용해 2개월만에 활성물질을 발견한 성과가 있었다. 화합물로부터 특정 효능을 세계 최초로 예측하기도 했다. 이런 식으로 연구를 지속하면서 AI가 신약개발에 있어서 필수적이라고 보고 시스템을 구축해 나가고 있다.
AI 활용하고 데이터 해석하는 사람의 인사이트가 가장 중요
ㅡ대웅제약이 바라보는 ‘AI 신약개발의 본질적 경쟁력’은 무엇이라고 생각하나. 내부 기준에서 보는 차별성과 리더십 요소는.
'사람'이 가장 중요하다. AI를 활용하고 데이터를 해석하는 사람의 인사이트가 가장 중요하기 때문이다. 아무리 인프라에 비용을 투자해도, 인사이트 있는 인력이 없다면 인프라를 제대로 활용할 수 없고 AI 신약개발은 제대로 작동하기 어렵다. AI신약팀은 신약개발에 대한 높은 이해도와 AI모델을 잘 적용한다는 자부심을 가지고 있다. 여러 컨퍼런스에서 발표를 많이 하다보니 대웅제약에서 구축한 AI시스템에 대해 관심을 많이 받곤 한다.
ㅡ향후 2~3년간 데이지의 발전 방향에 대한 전망은. 글로벌 AI 신약개발 시장에서 대웅제약이 선도할 수 있는 영역은 질환 또는 품목 등에서 어디에 있다고 보나?
LLM 모델을 신약개발에 응용하려고 연구하고 있다. 최신 트렌드를 반영한 신약개발 AI 툴을 만들어 다시 데이지에 올려 AI 모르는 사람들이라도 신약개발에 최신 AI모델을 활용할 수 있도록 노력하고 있다.
대웅제약이 오픈AI나 구글 딥마인드처럼 AI 모델을 개발하는 것은 현실적으로 쉽지 않다. 항암제, 대사질환 등 경쟁력 있는 특정 영역에 최신 AI 모델을 도입하고 신속히 적용하는 것이 더 실질적인 전략이라고 본다. 경쟁력이 있는 분야에 빨리 적용하고 빨리 결과를 도출하는 방향으로 가야 한다. 그렇게 해야 10~15년 걸리던 신약개발 기간을 5년 안으로 줄일 수 있다.
현재 전 임상단계에서만 AI 모델을 적용하고 있지만, 향후 임상 단계에서도 AI모델을 적용해 신약개발과 관련한 모든 과정에 참여해서 성과를 만들고자 한다.
ㅡAI 신약개발 시스템을 구축하면서 어려운 점이 있다면?
첫째, 데이터 확보가 가장 중요하다. 좋은 데이터만 이용해선 AI모델을 만들기 힘들다. 나쁜 데이터와 좋은 데이터를 모두 갖추고 있어야 하고, 여기서 의미 있는 데이터를 선택하고 판단할 수 있어야 한다. 이런 정밀한 데이터를 통해 학습된 AI모델이야말로 정확한 예측이 가능하다. 공공기관 데이터는 물론 병원이 가지고 있는 광대한 데이터의 공개가 중요하다. 이 데이터를 토대로 AI모델에 추가해 나가면서 더욱 정밀하고 정확한 AI모델을 만들 수 있다.
둘째, AI 신약개발 인력에 대한 문제다. 앞으로 갈수록 인력이 더 필요한데 신약개발 인력이 많지 않다. AI를 이해하면서도 신약개발에 대한 다양한 이해가 있어야 하기 때문이다. 현재 우리나라는 AI 신약개발 연구 인원이 절대적으로 부족하다. 이를 위한 국가나 대학 차원으로 인력 확충을 위한 프로그램을 많이 만들어야 한다고 생각한다.
8억 종 화합물의 분자 모델 데이터베이스 '다비드(DAVID)'로 찾은 유효 물질 장면.
다음 목표는 LLM 신약개발 모델...국내를 넘어 세계 시장까지 도전
ㅡ다른 제약바이오회사들이 AI 신약개발과 관련한 조직을 세팅할 경우 어디부터 이해하고 출발해야 할까.
제일 먼저 회사 입장에선 AI 신약개발 중요성과 필요성에 대한 공감대를 가지고 있어야 한다. 다음으로 AI 신약개발 인사이트를 가진 리더급을 찾아야 한다. AI 신약개발팀을 만들고 싶다고 해서 무작정 투자만으론 완성할 수 없다. 분명한 인사이트를 가진 리더급이 AI 신약개발을 위해 어떻게 전체 워크플로우를 만들 것인지를 정해야 한다. 그리고 나서 연구인력 확보, GPU 인프라 확보 등이 중요한 요소가 될 것이다.
ㅡ고대안암병원 등과의 협업을 진행한다고 밝혔다. 대웅제약의 AI 신약 시스템과 어떤 방식으로 연결되는지, 실제 데이터가 공유될 수 있는 구조인가.
고대안암병원은 약물을 개발하려고 수소문하다가 대웅제약이 선도에 있다고 판단하고 스크리닝과 실험에 대한 공동 연구를 진행하고 있다. 대웅제약은 타겟 단백질에서 결합 가능한 화합물을 찾고 데이터를 만들어 제공하면, 고대안암병원이 그에 따른 실험을 진행하는 식으로 협력하고 있다. 이런 방식을 3개월만에 의미 있는 물질을 도출하기도 했다.
ㅡ임상의사들이 AI와 신약개발에 관심이 있다면 같이 협력 가능한 부분이 있나.
신약개발에 관심 있는 의사들이 데이터를 보고 해석해준다면 좋은 결과를 낼 수 있다. 신약개발을 위해선 데이터의 양과 데이터 퀄리티가 생명이기 때문이다. 임상의사들이 데이터가 어떤지 정확한 판단을 할 수 있기 때문에 모델을 정교하게 만들 수 있다. 그래서 앞으로 다양한 민간병원과 협력을 하려고 한다.
ㅡ마지막으로 대웅제약 AI신약팀의 포부는.
올해는 LLM 신약개발 모델을 만들고 싶다. 국내를 넘어서 세계에서도 좋은 모델이 되기를 기대한다. 관련 논문을 발표하고 해당 모델이 실제 적용돼 성과를 내는 것이 중요하다.
대웅제약 AI신약팀은 국내에서 가장 체계적으로 운영되고 있는 팀이 아닐까 생각한다. 활성이나 약효를 연구하는 신약개발 연구팀과 함께 신약 후보물질을 발굴하고 1년만에 전임상까지 간다면 실제 AI 신약개발의 성공사례를 만들 수 있을 것이다.
한편, 신승우 대웅제약 AI신약팀장은 9월 2일 메디게이트뉴스 주최로 열리는 '미래 헬스케어 트렌드 컨퍼런스'에서 'AI 신약개발 첫 성공사례, 우리가 만든다'를 주제로 특별강연을 펼칠 예정이다.
댓글보기(0)