Search

OpenAI, 생명과학용 추론 모델 GPT-Rosalind 공개

OpenAI가 생물학·신약개발·중개의학 연구 워크플로를 겨냥한 GPT-Rosalind 연구 프리뷰를 공개함. 문헌·데이터베이스·실험 결과·도구 사용이 섞인 장기 과제를 지원하도록 설계됐고, Codex용 생명과학 리서치 플러그인도 함께 공개됨.

요약

GPT-Rosalind는 ChatGPT, Codex, API에서 자격 심사를 통과한 고객에게 연구 프리뷰로 제공되며, 초기에는 미국 내 Enterprise 고객 중심의 trusted access 구조로 운영됨.
Codex용 Life Sciences research plugin은 인간 유전학, 기능유전체학, 단백질 구조, 생화학, 임상 근거, 공개 연구 탐색 등에서 쓰는 50개 이상 공개 데이터베이스·도구 접근을 묶은 오케스트레이션 계층임.
평가는 화학 반응 메커니즘, 단백질 구조·돌연변이 효과·상호작용, DNA 계통 해석, 실험 출력 해석, 후속 실험 설계, 도구 선택·사용 능력을 포함함.
OpenAI에 따르면 GPT-Rosalind는 BixBench에서 공개 점수가 있는 모델 중 선두 성능을 냈고, LABBench2에서는 문헌 검색·DB 접근·서열 조작·프로토콜 설계 등 11개 과제 중 6개에서 GPT-5.4를 앞섬.
Dyno Therapeutics와의 미공개 RNA sequence-to-function 예측·생성 평가에서는 Codex 앱에서 best-of-ten 제출 기준 예측 과제가 AI-bio 전문가 57개 과거 점수의 95퍼센타일 이상, 서열 생성 과제가 약 84퍼센타일로 보고됨.
Amgen, Moderna, Allen Institute, Thermo Fisher Scientific 등이 초기 고객·협력 사례로 제시됐고, Los Alamos National Laboratory와는 AI 기반 단백질·촉매 설계 탐색을 진행 중임.
생명과학 특화 LLM이 단일 Q&A보다 문헌-데이터-도구-실험계획을 잇는 연구 루프에 맞춰 배포되기 시작했다는 점에서, AI-bio 조직의 내부 워크플로 통합 경쟁이 빨라질 가능성 있음.

메모

성능 수치는 OpenAI와 파트너 평가에서 보고된 값으로, 독립 재현성은 별도 확인 필요.

원문