OpenAI, 생명과학용 추론 모델 GPT-Rosalind 공개

OpenAI가 생물학·신약개발·중개의학 연구 워크플로를 겨냥한 GPT-Rosalind 연구 프리뷰를 공개함. 문헌·데이터베이스·실험 결과·도구 사용이 섞인 장기 과제를 지원하도록 설계됐고, Codex용 생명과학 리서치 플러그인도 함께 공개됨.

요약

•

GPT-Rosalind는 ChatGPT, Codex, API에서 자격 심사를 통과한 고객에게 연구 프리뷰로 제공되며, 초기에는 미국 내 Enterprise 고객 중심의 trusted access 구조로 운영됨.

•

Codex용 Life Sciences research plugin은 인간 유전학, 기능유전체학, 단백질 구조, 생화학, 임상 근거, 공개 연구 탐색 등에서 쓰는 50개 이상 공개 데이터베이스·도구 접근을 묶은 오케스트레이션 계층임.

•

평가는 화학 반응 메커니즘, 단백질 구조·돌연변이 효과·상호작용, DNA 계통 해석, 실험 출력 해석, 후속 실험 설계, 도구 선택·사용 능력을 포함함.

•

OpenAI에 따르면 GPT-Rosalind는 BixBench에서 공개 점수가 있는 모델 중 선두 성능을 냈고, LABBench2에서는 문헌 검색·DB 접근·서열 조작·프로토콜 설계 등 11개 과제 중 6개에서 GPT-5.4를 앞섬.

•

Dyno Therapeutics와의 미공개 RNA sequence-to-function 예측·생성 평가에서는 Codex 앱에서 best-of-ten 제출 기준 예측 과제가 AI-bio 전문가 57개 과거 점수의 95퍼센타일 이상, 서열 생성 과제가 약 84퍼센타일로 보고됨.

•

Amgen, Moderna, Allen Institute, Thermo Fisher Scientific 등이 초기 고객·협력 사례로 제시됐고, Los Alamos National Laboratory와는 AI 기반 단백질·촉매 설계 탐색을 진행 중임.

•

생명과학 특화 LLM이 단일 Q&A보다 문헌-데이터-도구-실험계획을 잇는 연구 루프에 맞춰 배포되기 시작했다는 점에서, AI-bio 조직의 내부 워크플로 통합 경쟁이 빨라질 가능성 있음.

메모

성능 수치는 OpenAI와 파트너 평가에서 보고된 값으로, 독립 재현성은 별도 확인 필요.

원문

https://openai.com/index/introducing-gpt-rosalind