ODesign 논문 리뷰

들어가며

AF3 이후의 질문

Figure 1: unified generative token과 masking curriculum

Two-stage design: structure를 만들고 type을 붙인다

Figure 2: protein-centric benchmark

Figure 3: RNA/DNA aptamer로 확장하기

Figure 4: small-molecule design까지 넓히기

Project page의 pM binder claim

ODesign이 보여주는 범위

평가: broad formulation이 강한 all-atom interaction generator

참고

ODesign 논문 리뷰

들어가며

Protein binder design은 빠르게 넓어지고 있습니다. 처음에는 backbone을 만들고 sequence를 붙이는 protein-centric pipeline이 중심이었지만, 실제 biomolecular interaction은 protein-protein만으로 끝나지 않습니다. Ligand, RNA, DNA, ion, metal, covalent modification 같은 맥락이 함께 들어옵니다. Enzyme active site나 small-molecule pocket으로 가면 atom-level geometry가 중요해지고, aptamer나 nucleic-acid-binding ligand까지 보면 protein design이라는 이름만으로는 범위가 좁아집니다.

ODesign은 이 확장을 정면으로 겨냥한 논문입니다. 제목은 “A World Model for Biomolecular Interaction Design”이고, 2025년 arXiv preprint v2로 공개되었습니다. 논문은 ODesign을 protein, DNA, RNA, ligand, ion을 하나의 all-atom generative framework 안에서 다루는 “world model”이라고 부릅니다.

이 표현은 강합니다. 실제로 이 글에서는 조금 낮춰서 보겠습니다. ODesign은 autonomous molecular world simulator라기보다, AF3-like structure prediction architecture가 배운 interaction prior를 generative design 쪽으로 돌린 cross-modality all-atom generator에 가깝습니다. 강점은 task formulation의 폭입니다. Protein binder, ligand-binding protein, motif scaffolding, atomic motif scaffolding, RNA/DNA aptamer, small-molecule ligand design을 같은 framework 안에 넣으려 합니다.

AF3 이후의 질문

AlphaFold3 이후 biomolecular structure prediction은 protein 단독 문제를 넘어섰습니다. Protein, nucleic acid, ligand, ion, modification을 하나의 all-atom structure prediction problem으로 다루는 방향이 열렸습니다. 그렇다면 자연스러운 다음 질문이 생깁니다. Structure predictor가 biomolecular interaction prior를 배웠다면, 그 prior를 prediction이 아니라 design에 쓸 수 있을까.

ODesign의 출발점은 이 질문입니다. Structure prediction model은 주어진 sequence와 molecular components로 3D structure를 맞추는 모델입니다. ODesign은 이를 반대로 사용하려 합니다. Target/context를 주고, 그 target과 상호작용할 design partner의 structure를 생성한 뒤, sequence나 atom type을 부여합니다.

이 흐름은 BoltzDesign1이나 ProteinHunter 같은 predictor-inversion 계열과 닿아 있습니다. 다만 ODesign은 단순히 predictor 내부 signal을 optimization하는 방식이라기보다, AF3-like Pairformer와 conditional diffusion을 중심으로 별도 generative model을 학습합니다. 그리고 protein-only가 아니라 nucleic acid와 ligand까지 같은 token/masking 체계로 묶으려는 점이 다릅니다.

Figure 1: unified generative token과 masking curriculum

Figure 1은 ODesign의 전체 프레임을 보여줍니다. 입력 modality는 protein, DNA, RNA, ligand, ion입니다. 사용자는 target과 design modality를 지정하고, 모델은 diffusion-based generative process로 binding partner를 생성합니다. Rigid-target mode와 flexible-target mode도 나뉩니다. Rigid mode에서는 target coordinates를 고정하고, flexible mode에서는 target 내부 distance constraint를 유지하면서 target-binder co-generation을 허용합니다.

핵심은 unified generative token입니다. ODesign은 서로 다른 chemical modality의 minimal generative unit을 하나의 mask token 계열로 추상화하고, modality-specific suffix를 붙입니다. Protein은 `-P`, nucleic acid는 `-N`, ligand는 `-L`처럼 다룹니다. 이 token은 all-atom diffusion module로 decoded되어 modality에 맞는 3D coordinates를 생성합니다.

Training masking은 네 수준입니다. All masking은 free generation에 해당합니다. Entity masking은 target이 주어진 상황에서 새로운 entity를 생성하는 binder design에 해당합니다. Token masking은 motif scaffolding처럼 local segment를 채우는 문제입니다. Atom masking은 catalytic residue나 tip atom처럼 atomic motif를 유지한 채 주변 scaffold를 만드는 문제에 가깝습니다.

이 구조가 ODesign의 장점입니다. Protein binder, ligand-binding protein, RNA aptamer, DNA aptamer, small-molecule design을 완전히 별도 model로 만들지 않고, “어떤 modality의 어떤 수준을 mask하고 생성할 것인가”라는 형태로 통합합니다.

Two-stage design: structure를 만들고 type을 붙인다

ODesign은 co-design이 아니라 two-stage design paradigm을 택합니다. 먼저 conditional diffusion module이 target/context에 맞는 all-atom coordinates 또는 scaffold를 만들고, 그다음 OInvFold module이 sequence 또는 atom type을 부여합니다. Protein/DNA/RNA는 sequence를, ligand는 atom type을 생성하는 식입니다.

논문은 co-design이 이론적으로는 structure와 sequence의 공진화를 더 잘 모델링할 수 있지만, practical protein design에서는 backbone-first + sequence design 전략이 더 잘 작동한다고 봅니다. 그래서 ODesign도 이 전략을 cross-modality로 확장합니다.

Architecture는 다섯 모듈로 설명됩니다. Embedding module은 token/atom feature와 modality mask, hotspot/masked indicator를 만듭니다. Conditional module은 target 3D coordinates와 representative-token distance matrix를 조건으로 넣습니다. Pairformer module은 AF3-like block으로 intra/inter-molecular interaction representation을 업데이트합니다. Conditional diffusion module은 all-atom coordinates를 생성합니다. OInvFold module은 generated scaffold 위에 protein/DNA/RNA sequence 또는 ligand atom type을 부여합니다.

여기서 target conditioning도 중요합니다. ODesign은 target coordinate를 초기 feature로 넣는 방식과, representative atom distance matrix를 distogram으로 바꿔 Pairformer에 넣는 방식을 함께 씁니다. Hotspot-specific design에서는 target-binder interface 8 Å 안의 residue를 `is_hotspot` feature로 표시합니다.

Figure 2: protein-centric benchmark

Figure 2는 ODesign이 protein design 쪽에서 어느 정도 작동하는지 보여줍니다. Protein-binding protein design에서는 CaoData 유래 11개 target을 사용합니다. 각 target에서 ODesign과 RFdiffusion은 100 backbones를 만들고, 각 backbone마다 ProteinMPNN으로 8개 sequence를 붙여 800 candidates를 만듭니다. 이후 AF3로 refolding하고, `iPAE < 10.85`, `ipTM > 0.5`, `pLDDT > 0.8`, `complex RMSD < 2.5 Å`를 만족하면 successful design으로 봅니다.

논문은 one H100 GPU/day 기준으로 ODesign이 평균 2672 filter-passing designs를 만들었다고 보고합니다. 비교 대상인 RFdiffusion은 평균 555, BindCraft는 22, BoltzDesign1은 61로 제시됩니다. 이 숫자의 핵심은 throughput입니다. ODesign이 더 많은 wet-lab binder를 냈다는 뜻이 아니라, 해당 AF3-based filter를 통과하는 candidate를 같은 계산 시간 안에서 더 많이 냈다는 의미입니다.

Ligand-binding protein design에서는 RFdiffusion-AA의 IAI, OQO, FAD, SAM 네 target을 사용합니다. ODesign과 RFdiffusion-AA는 100 backbones × LigandMPNN 8 sequences를 만들고, Chai-1으로 refold합니다. Success criterion은 `complex pLDDT > 0.7`과 `iPAE < 10`입니다. 논문은 ODesign이 RFdiffusion-AA보다 12.1-fold, BoltzDesign1보다 57.8-fold 높은 throughput을 보였다고 주장합니다.

Motif scaffolding과 atomic motif scaffolding도 Figure 2에 포함됩니다. MotifBench 30 cases에서는 average success rate 18.4%, successful cases 27/30, MotifScore 개선을 보고합니다. Atomic motif scaffolding은 RFdiffusion2의 AME 41 systems를 사용하며, LigandMPNN + Chai-1 refolding + catalytic heavy-atom RMSD < 1.5 Å / no-clash 기준으로 평가합니다. 여기서도 ODesign은 filter-passing design throughput을 중심으로 성능을 말합니다.

Figure 3: RNA/DNA aptamer로 확장하기

ODesign의 흥미로운 부분은 protein을 넘어 nucleic acid design으로 간다는 점입니다. RNA free generation에서는 RNAFrameFlow와 비교하고, generated backbone에 sequence를 붙인 뒤 AF3로 refold합니다. RMSD < 5 Å 또는 TM-score > 0.45를 success로 봅니다.

Protein-binding RNA aptamer design에서는 2023년 1월 13일 이후 PDB protein-RNA complex 10개를 골라 protein structure를 조건으로 넣습니다. 각 target에서 400 RNA aptamer를 생성하고 AF3로 refold한 뒤, protein-aligned RNA RMSD < 5 Å를 기준으로 평가합니다. 논문은 zero-shot protein-binding RNA aptamer success rate 77.95%를 보고합니다.

DNA aptamer design도 같은 흐름입니다. ODesign은 DNA aptamer design을 AI model이 rational DNA design을 다루는 초기 사례 중 하나로 프레이밍합니다. 다만 논문도 DNA 쪽 designability가 length가 길어질수록 RNA보다 빠르게 떨어진다고 보고합니다. 이유는 training data에서 single-stranded DNA representation이 상대적으로 적기 때문으로 해석합니다.

이 결과는 cross-modality formulation의 가능성을 보여줍니다. 동시에 evidence는 refolding-based structural proxy입니다. Protein-binding RNA/DNA aptamer가 실제 target affinity, specificity, cellular context에서 작동한다는 뜻은 아닙니다. 특히 nucleic acid aptamer 쪽은 standardized benchmark 자체가 약하기 때문에, 결과를 practical aptamer discovery로 바로 연결하면 과합니다.

Figure 4: small-molecule design까지 넓히기

Figure 4는 ligand-centric benchmark를 다룹니다. Protein-binding ligand design에서는 DRD2, ADRB1, 그리고 ligand-binding protein task의 네 complexes를 사용합니다. TargetDiff, D3FG, Pocket2Mol, SurfGen, ResGen과 비교하며, validity는 RDKit recognition과 docking 가능성으로 정의합니다. Success는 `QED > 0.25`와 `Vina Dock score < -8.18`를 함께 만족하는지로 봅니다.

논문은 ODesign이 TargetDiff 대비 valid molecule 3.9-fold, successful molecule 9.0-fold 개선을 보였고, SurfGen 대비 14.0-fold / 48.4-fold 개선을 보였다고 주장합니다. DNA-binding/RNA-binding small molecule design에서는 2023년 이후 PDB DNA/RNA-ligand complex 각각 3개를 골라 AF3 refolding metrics로 평가합니다.

이 부분은 ODesign의 야심을 잘 보여주지만, 해석은 더 조심스럽습니다. Vina/QED는 useful triage metric일 수 있지만, binding affinity, selectivity, ADMET, cellular activity를 대신하지 않습니다. Nucleic-acid-binding ligand benchmark는 특히 표준화가 약하고 sample도 작습니다. 따라서 Figure 4는 “small-molecule design까지 한 framework로 표현할 수 있다”는 proof-of-formulation에 가깝고, drug discovery 성능 evidence로 보기에는 아직 이릅니다.

Project page의 pM binder claim

ODesign project page에는 protein mini-binder design 8 targets 중 4 targets에서 optimal binders가 pM scale에 도달했다는 claim이 있습니다. 이 문장은 눈에 띕니다. 하지만 현재 확인한 PDF/extracted arXiv source 안에서는 target별 tested-design denominator, assay type, KD table, specificity/developability detail, structural validation이 충분히 보이지 않습니다.

그래서 이 글에서는 이 claim을 중심 evidence로 쓰지 않습니다. 공개 페이지의 claim으로는 기록할 수 있지만, 논문 본문 Figure 2–4의 benchmark evidence와 같은 강도로 놓기는 어렵습니다. 특히 binder design 글에서는 “pM binder”라는 표현 하나가 전체 인상을 크게 바꾸기 때문에, denominator와 assay layer가 보일 때까지는 조심해서 다루는 편이 좋습니다.

ODesign이 보여주는 범위

ODesign은 protein-only model이 아닙니다. AF3-like multimodal structure prior를 generative design으로 가져오고, unified generative token과 masking curriculum으로 여러 modality를 묶으려는 paper입니다. 이 점은 분명히 흥미롭습니다. RFdiffusion 계열이 protein backbone/interface generation을 강하게 밀고, RFdiffusion-AA/RFAA가 ligand-aware all-atom context로 확장했다면, ODesign은 protein, nucleic acid, ligand interaction design을 한 language 안에 넣으려는 시도입니다.

하지만 성능 evidence의 대부분은 computational filter-pass throughput입니다. AF3, Chai-1, ESMFold, AutoDock Vina, ProteinMPNN, LigandMPNN 같은 external evaluator와 post-processing pipeline이 결과에 깊게 들어갑니다. 따라서 Figure 2–4의 success는 wet-lab hit rate가 아니라 protocol-specific computational success입니다.

“World model”이라는 표현도 같은 이유로 낮춰서 이해하는 편이 자연스럽습니다. ODesign은 biomolecular interaction을 한 representation 안에 넣는 방향을 보여주지만, 아직 실험적으로 calibration된 universal molecular simulator라고 말하기는 어렵습니다. 현재 evidence만 놓고 보면, cross-modality all-atom design benchmark에서 broad controllability와 throughput을 보여주는 generative framework입니다.

평가: broad formulation이 강한 all-atom interaction generator

ODesign의 장점은 명확합니다. Protein binder 하나를 잘 만든다는 주장보다, biomolecular interaction design 문제를 넓게 다시 쓰는 데 강점이 있습니다. Protein, DNA/RNA, ligand를 unified generative token으로 묶고, All/Entity/Token/Atom masking으로 free generation, binder design, motif scaffolding, atomic motif scaffolding을 한 training formulation에 넣습니다. 이건 AF3 이후 design model이 어디로 갈 수 있는지 보여주는 좋은 사례입니다.

반대로 약한 부분도 분명합니다. Benchmark가 넓은 만큼 각 task의 experimental depth는 얕습니다. Protein binder 쪽은 AF3 filter-pass throughput, ligand-binding protein은 Chai-1 filter-pass, RNA/DNA aptamer는 AF3 refolding RMSD/TM-score, small molecule은 Vina/QED와 AF3 interface metrics가 중심입니다. 이 metric들은 model controllability와 plausible geometry를 보여주지만, 실제 binding/function/developability를 직접 보여주지는 않습니다.

그래서 ODesign은 AlphaProteo나 RFdiffusionAA처럼 wet-lab campaign을 자세히 읽는 글과는 다른 종류의 리뷰가 됩니다. 이 논문의 의미는 “실험적으로 검증된 binder platform”보다 “AF3-like all-atom predictor prior를 cross-modality generator로 전환하려는 broad architecture”에 있습니다. 이 기준으로 보면 ODesign은 다소 과감한 이름을 붙인 논문이지만, all-atom biomolecular design의 방향을 보여주는 중요한 시도입니다.

참고

•

ODesign Team, “A World Model for Biomolecular Interaction Design”, arXiv:2510.22304v2, 2025.

•

Project page: https://odesign1.github.io

•

Claimed server: https://odesign.lglab.ac.cn

•

주요 비교 축: protein binder design, ligand-binding protein design, motif scaffolding, atomic motif scaffolding, RNA/DNA aptamer design, protein/DNA/RNA-binding ligand design.