[메디게이트뉴스 이지원 기자] 생성형 인공지능(AI) 기술이 발전하면서 AI의 활용 범위가 일반적인 질의응답과 코딩 보조를 넘어 문헌 분석, 데이터 처리, 연구 산출물 작성, 컴퓨팅 자원 관리 등 과학 연구 전 과정으로 확장되고 있다.
앤트로픽은 6월 30일 과학자를 위한 AI 워크벤치 '클로드 사이언스(Claude Science)'를 베타 출시했다고 밝혔다. 클로드 사이언스는 연구자들이 주로 사용하는 도구와 패키지를 통합하고, 검증 가능한 연구 산출물을 생성하며, 컴퓨팅 자원에 유연하게 접근할 수 있도록 지원하는 어플리케이션이다.
분절된 연구 도구 한곳에…챗봇형 AI 넘어 연구 수행형 워크벤치로 확장
과학 연구는 여러 도구와 데이터베이스를 오가는 경우가 많다. 연구자는 각각 다른 스키마를 가진 데이터베이스를 확인하고, 별도 데이터 파이프라인과 뷰어가 필요한 파일 형식을 다뤄야 한다. 문헌 검색, 통계 분석, 코드 실행, 클러스터 작업도 서로 다른 환경에서 진행되는 일이 많다.
클로드 사이언스는 이런 과정을 하나의 연구 환경으로 묶는 것을 목표로 한다. 회사 측에 따르면 클로드 사이언스는 문헌 분석과 다단계 연구 수행을 돕고, 그림과 원고를 작성하며, 출판 준비가 될 때까지 반복 수정을 지원한다.
연구 결과물의 재현성도 강조됐다. 클로드 사이언스가 그림을 만들면 해당 그림을 생성한 코드와 실행 환경, 생성 과정 설명, 메시지 기록이 함께 남는다. 이를 통해 연구자는 입력값을 이해할 수 있고, 수개월이 지난 뒤에도 작업을 더 쉽게 검증하고 재현할 수 있다.
과학 연구에 필요한 시각 자료도 생성한다. 3D 단백질 구조, 게놈 브라우저 트랙, 화학 구조 등을 기본적으로 렌더링하며, 연구자는 자연어로 그림 수정도 요청할 수 있다. 예를 들어 격자선을 제거하거나 축을 로그 스케일로 바꾸라고 지시하면 에이전트가 관련 코드를 수정하는 방식이다.
별도의 리뷰어 에이전트도 포함됐다. 리뷰어 에이전트는 인용과 계산을 점검하고, 잘못된 인용이나 추적하기 어려운 수치, 코드와 맞지 않는 그림을 표시한다. 회사 측은 실행 과정에서 오류를 확인하고 수정하는 구조라고 설명했다.
사진=앤트로픽
유전체·단일세포·단백질 구조 분석 등 생명과학 연구 지원
클로드 사이언스는 생명과학 연구에 활용할 수 있는 60개 이상의 스킬과 커넥터를 제공한다. 대상 분야는 유전체학, 단일세포 분석, 단백질체학, 구조생물학, 화학정보학 등이다.
사용자는 범용 조정 에이전트와 대화하면서 연구를 진행한다. 이 에이전트는 필요한 경우 다른 전문 에이전트를 실행하거나, 사용자가 만든 전문 에이전트와 협업할 수 있다. 연구실에서 이미 쓰는 모델이나 데이터셋, 파이프라인도 연결할 수 있다.
생명과학 데이터베이스와 모델 연계도 이뤄졌다. 클로드 사이언스는 유니프로트(UniProt), 단백질 데이터 뱅크(PDB), 앙상블(Ensembl), 리액톰(Reactome), 클린바(ClinVar), 켐블(ChEMBL), 지오(GEO) 등 여러 데이터 소스를 질의하고 종합할 수 있다. 엔비디아(NVIDIA)의 바이오네모 에이전트 툴킷(BioNeMo Agent Toolkit)을 활용해 Evo 2, Boltz-2, OpenFold3 등 생명과학 모델과 라이브러리에도 연결된다.
대규모 분석을 위한 컴퓨팅 자원 관리 기능도 들어갔다. 단백질 구조 예측이나 유전체 데이터 분석처럼 연산량이 큰 작업에서 클로드 사이언스는 분석 계획을 세우고, 연구자가 쓰는 HPC 클러스터나 온디맨드 GPU 자원에 작업을 제출할 수 있도록 지원한다.
다만 새로운 자원에 접근하기 전에는 사용자 확인을 거치도록 설계됐다. 연구자는 작업이 제출되기 전 결정을 검토하거나 취소할 수 있다. 회사 측은 단일 GPU부터 수백 개 GPU까지 분석 규모를 확장할 수 있다고 밝혔다.
데이터 보안과 관련해서는 연구실의 기존 인프라를 활용하는 방식을 제시했다. 대규모 또는 민감한 데이터셋은 노트북, Linux 장비, HPC 로그인 노드 등 기존 시스템에 남기고, 각 분석 단계에 필요한 맥락만 클로드로 전송되도록 했다는 설명이다.
사진=앤트로픽
조직 표적 치료제·장문 리뷰·교종 연구 등 활용
앤트로픽은 지난 몇 달 동안 연구자들이 클로드 사이언스 베타 버전을 단일세포 RNA 시퀀싱 분석, CRISPR 스크린 설계, 단백질 구조 예측, 화학정보학 등에 활용했다고 밝혔다.
매니폴드 바이오(Manifold Bio)는 조직 표적 치료제 후보 선정에 클로드 사이언스를 사용했다. 이 회사는 특정 장기나 세포 유형으로 향하는 치료제를 설계해 약물이 필요한 부위에서 작용하고, 다른 부위에 미치는 영향을 최소화하도록 한다.
회사 측에 따르면 클로드 사이언스는 각 조직과 표적 후보를 두고 표면 발현, 수송, 안전성 등을 평가했다. 이후 매니폴드 바이오가 내부 데이터에서 학습한 기준에 따라 후보를 순위화했다. 매니폴드 바이오는 클로드 사이언스가 단순 코딩 보조 도구와 달리 적절한 데이터를 수집하고 과거 프로그램의 맥락을 반영해 판단을 적용했다고 설명했다.
앨런 인스티튜트(Allen Institute)의 신경과학자 Jérôme Lecoq는 장문 리뷰 작성을 위한 다중 에이전트 기반 '컴퓨테이셔널 리뷰 템플릿'을 구축했다. 약 20개의 맞춤형 스킬로 구성된 이 시스템은 수천 편의 논문을 읽고 핵심 주장과 주요 정량 결과를 추출해 이를 근거 데이터베이스에 저장했다.
이후 파이프라인은 리뷰의 흐름을 구성하고, 섹션별 초안을 작성하며, 각 섹션을 전문 하위 에이전트에 배정했다. 각 섹션에서는 전담 에이전트가 근거 데이터베이스를 바탕으로 정량 비교 그림도 생성했다.
앤트로픽은 "이 과정에서 핵심 요소는 액터-크리틱 페어(actor-critic pairs)의 활용"이라며 "하나의 에이전트가 내용을 만들고, 별도 리뷰어 에이전트가 정확성과 인용 충실도를 평가하는 구조가 쓰였다"고 설명했다.
엔트로픽은 "클로드 사이언스 이전에는 Lecoq의 팀이 이런 리뷰를 작성하는 데 최대 2년이 걸렸다"며 "현재 그는 10건가량의 리뷰를 보유하고 있으며, 그중 다수는 100쪽이 넘고, 인용은 리뷰어 에이전트가 점검했다. 연구팀은 현재 도메인 전문가들과 함께 AI 기반 비평 에이전트를 추가로 개선하고 있다"고 부연했다.
UCSF 뇌종양센터(UCSF Brain Tumor Center)의 Stephen Francis 교수는 교종의 분자역학 연구에 클로드 사이언스를 활용했다. 교종은 뇌의 교세포에서 시작되는 원발성 종양의 한 종류다. Francis 교수 연구팀은 효과가 작은 수천 개의 생식세포계열 변이가 개인의 감수성에 어떻게 영향을 미치는지 분석하고 있다.
앤트로픽에 따르면 Francis 교수는 클로드 사이언스로 여러 접근법을 포함한 생식세포계열 분석을 기존 대비 약 10분의 1 시간에 수행했다. 연구팀은 클로드 사이언스의 결과를 독립적으로 검증했으며, 이를 통해 빠르면서도 견고한 분석을 생성할 수 있음을 확인했다.
한편 앤트로픽은 클로드 사이언스를 클로드 프로(Claude Pro), 맥스(Max), 팀(Team), 엔터프라이즈(Enterprise) 요금제 사용자를 대상으로 macOS와 Linux에서 베타로 제공한다. 이 중 팀과 엔터프라이즈의 경우 관리자가 기능을 활성화해야 한다.
앤트로픽은 학술기관과 비영리 연구기관의 현역 과학 연구실을 대상으로 할인된 좌석을 제공하는 팀 요금제도 운영한다고 밝혔다.