npj Drug Discovery에 공개된 MAMMAL은 단백질·항체 서열, 소분자, 유전자 발현을 함께 다루는 약물발견용 멀티모달 foundation model임. 20억 개 샘플로 사전학습하고 분류·회귀·생성 과제를 지원하며, 11개 벤치마크 중 9개에서 SOTA를 보고함. 특히 항체-항원 결합 벤치마크에서 미세조정된 MAMMAL 점수가 7개 항원 중 5개에서 AlphaFold3 confidence score보다 결합 가능성 proxy로 더 강한 성능을 보였다고 제시함.
요약
•
모델명은 MAMMAL(Molecular Aligned Multi-Modal Architecture and Language)이며, 서로 다른 생물의학 modality를 공통 표현으로 정렬해 약물발견 파이프라인의 여러 단계를 다루도록 설계됨.
•
사전학습 데이터는 단백질·항체 서열, 소분자, 유전자 발현 프로파일을 포함한 20억 개 샘플 규모로 제시됨.
•
지원 과제는 cross-modal input 기반의 분류, 회귀, 생성 작업이며, target identification·분자 특성 예측·항체 관련 평가처럼 서로 다른 단계의 benchmark를 함께 다룸.
•
논문은 11개 benchmark 중 9개에서 state-of-the-art, 2개에서 competitive result를 보고했으나, benchmark 구성과 fine-tuning 조건에 따라 실제 적용성은 과제별 검증 필요.
•
항체-항원 결합 평가에서는 fine-tuned MAMMAL prediction score가 AlphaFold3 confidence score를 binding likelihood proxy로 쓴 기준보다 7개 antigen target 중 5개에서 유의하게 높았다고 보고함.
•
프레임워크와 pretrained model을 공개해 멀티모달 약물발견 모델을 외부 연구자가 직접 검증할 수 있는 출발점을 제공함.
•
단일 modality 모델을 이어 붙이는 방식보다 약물·표적·세포 반응을 함께 다루는 방향을 보여주며, 항체/소분자/전사체 기반 discovery workflow의 통합 평가가 더 중요해짐.