RFAA 논문 리뷰

Baker GPCR miniprotein binder 논문이 GPCR pharmacology로 binder design을 밀어 넣은 사례라면, RFAA는 다른 축에서 protein design의 범위를 넓힙니다. 여기서의 질문은 protein-protein interaction이 아니라, small molecule, cofactor, metal, covalent modification 같은 non-protein components를 어떻게 model 안에 넣을 것인가입니다.

Science 2024 논문 “Generalized biomolecular modeling and design with RoseTTAFold All-Atom”은 두 claim을 함께 담고 있습니다. 하나는 RoseTTAFold All-Atom, 즉 RFAA가 protein, nucleic acid, small molecule, metal, covalent modification을 하나의 biomolecular assembly로 예측한다는 prediction claim입니다. 다른 하나는 이를 diffusion model로 fine-tune한 RFdiffusionAA가 ligand 주변에 de novo protein pocket을 생성하고, 일부 case를 wet-lab으로 검증했다는 design claim입니다.

이 둘은 연결되어 있지만 같은 claim으로 합치면 안 됩니다. RFAA의 ligand RMSD benchmark와 RFdiffusionAA의 digoxigenin/heme/bilin binder design 결과를 섞으면 해석이 흐려집니다. 이 논문은 all-atom prediction과 ligand-conditioned generation이 만나는 지점으로 이해하면 충분합니다. 그래서 분량도 조금 더 필요합니다. RFAA는 단순히 “ligand도 넣을 수 있는 RoseTTAFold”가 아니라, 이후 RFdiffusion2/3와 all-atom design 계열을 이해할 때 기준점이 되는 representation paper입니다. 동시에 RFdiffusionAA는 그 representation을 실제 ligand pocket design으로 끌고 간 early wet-lab anchor입니다.

Protein-only model에서 biomolecular assembly로

AlphaFold2와 기존 RoseTTAFold 계열은 protein structure prediction을 크게 끌어올렸지만, 실제 biological system은 protein만으로 구성되지 않습니다. Small molecule ligand, cofactor, metal ion, covalent modification, DNA/RNA가 함께 있는 complex가 많습니다.

기존에는 protein structure prediction, ligand docking, side-chain refinement, metal coordination modeling 같은 절차를 따로 붙이는 경우가 많았습니다. 하지만 flexible backbone, multiple non-protein components, covalent modification이 동시에 들어가면 이런 sequential pipeline은 쉽게 흔들립니다.

RFAA의 문제의식은 여기서 출발합니다. Protein/nucleic acid polymer representation과 arbitrary small-molecule atom graph를 하나의 network 안에서 다루려는 시도입니다.

RFAA의 representation 절충

RFAA는 RoseTTAFold2/RFNA의 1D/2D/3D track 구조를 유지합니다. Protein과 nucleic acid는 residue/base token으로 두고, small molecule과 covalent modification은 atom-bond graph로 표현합니다.

1D track에는 element type token을 넣고, 2D track에는 single/double/triple/aromatic bond 정보를 넣습니다. 3D track에는 chirality gradient 정보를 제공해 reflection ambiguity를 줄입니다. Protein 전체를 full atom graph로 바꾸는 대신, polymer는 coarse residue frame으로 유지하고 필요한 non-polymer component만 atom token으로 다루는 절충입니다.

Supplement에서 이 절충의 구현이 더 분명해집니다. Bond type은 no bond, single, double, triple, aromatic뿐 아니라 polymer residue-residue/base-base, residue-atom, other category까지 따로 둡니다. Small molecule의 chiral center는 atom type과 bond graph만으로 정해지지 않기 때문에, tetrahedral chirality에 대해 pseudo-dihedral sign과 ideal chiral geometry를 3D track에 gradient signal로 넣습니다. 즉 RFAA는 “모든 것을 atom으로 풀어버리는 모델”이라기보다, polymer의 frame-based inductive bias를 유지하면서 필요한 곳에 atom graph와 chirality constraint를 붙인 모델입니다.

이 절충은 실용적입니다. 모든 protein atom을 graph로 처리하면 계산량과 representation complexity가 커집니다. RFAA는 polymer와 non-polymer를 다르게 표현하면서도, 같은 assembly 안에서 interaction을 학습하게 만듭니다.

Atomization augmentation

Training에서는 PDB의 protein-small molecule, protein-metal, covalent modification 구조와 CSD small molecule crystal structures를 사용합니다. 여기에 atomization augmentation이 들어갑니다. 일부 protein residue를 atom token으로 바꿔 protein 내부 atom interaction과 small-molecule interaction 사이의 공통성을 학습하게 하는 방식입니다.

이 atomization augmentation은 리뷰에서 짚을 가치가 있습니다. RFAA는 non-canonical residue나 covalent modification처럼 polymer와 small molecule의 범위가 흐려지는 case를 다루기 위해 residue 일부를 atom token으로 바꾸는 훈련을 포함합니다. 그래서 glycan이나 covalent adduct를 “나중에 docking하는 물체”로만 보지 않고, protein chain과 연결된 atomic component로 다룰 수 있습니다.

이 아이디어는 RFAA의 핵심 중 하나입니다. Non-protein atom만 graph로 넣으면 model이 protein 내부 chemistry와 ligand chemistry를 따로 배울 수 있습니다. Atomization은 residue-level representation과 atom-level representation 사이를 이어주는 역할을 합니다.

Training data의 범위도 결과 해석에 중요합니다. Public protein-small molecule complex data는 protein-only structure data보다 작고, novel protein sequence cluster와 dissimilar ligand setting에서 success가 떨어집니다. 이 패턴은 RFAA가 all-atom context를 넓혔지만 data regime의 영향을 여전히 받는다는 점을 보여줍니다.

Prediction task를 세 갈래로 나누기

RFAA의 prediction result는 크게 세 갈래로 나눠 읽을 수 있습니다. 첫째는 protein-small molecule docking입니다. Protein backbone과 sidechain, ligand pose를 함께 예측하는 setting입니다. 둘째는 multi-component biomolecular assembly prediction입니다. Protein, nucleic acid, metal, small molecule, covalent modification이 함께 있는 구조를 하나의 model input으로 다룹니다. 셋째는 covalent modification과 glycan처럼 protein chain에 붙은 chemical component를 예측하는 task입니다.

이 구분이 필요한 이유는 각 task의 실패 모드가 다르기 때문입니다. Ligand docking에서는 binding pocket flexibility와 ligand pose가 문제입니다. Covalent modification에서는 chemical attachment geometry와 local sidechain environment가 중요합니다. Multi-component assembly에서는 token representation과 interaction graph가 모두 흔들릴 수 있습니다. 하나의 success rate로 RFAA의 능력을 요약하면 이 차이가 사라집니다.

Ligand docking benchmark라는 관점에서 이해하기

Protein-small molecule CAMEO blind docking에서 RFAA는 high-confidence case, 즉 PAE Interaction < 10인 case의 77%가 ligand RMSD < 2 Å였다고 보고합니다. 전체 비교에서는 RFAA 32% success, CAMEO Vina server 8% success로 제시됩니다.

다만 comparison context를 잘 봐야 합니다. Privileged bound protein structure를 입력받는 docking tools와 비교하면 task가 달라집니다. PoseBusters-style recent PDB set에서 RFAA는 protein backbone/sidechain과 ligand pose를 함께 예측하면서 42% success를 보였고, bound protein structure를 받는 DiffDock은 38%, bound protein plus pocket residues를 받는 Vina는 52%였습니다.

이 결과는 RFAA가 flexible context에서 의미 있는 성능을 보인다는 evidence입니다. 동시에 fixed-bound-structure docking에서는 classical 또는 pose-specialized method가 여전히 유리할 수 있음을 보여줍니다. “RFAA가 docking을 모두 대체한다”가 아니라, harder task에서 competitive한 all-atom predictor라는 관점에서 보는 편이 좋습니다.

여기서 PAE Interaction 같은 confidence score도 함께 봐야 합니다. High-confidence subset에서 accuracy가 올라간다는 것은 practical filtering에는 도움이 됩니다. 하지만 confidence threshold를 통과했다는 말은 ligand binding이 실험적으로 확인됐다는 뜻이 아닙니다. Prediction benchmark에서 confidence는 candidate prioritization signal이지 wet-lab evidence가 아닙니다.

Supplement의 decoy ligand experiment도 이 해석을 지지합니다. PoseBusters set에서 true ligand와 decoy ligand 6개를 같은 protein target에 넣어 cross-docking했을 때, decoy dock의 PAE Interaction이 true dock보다 높은 경우가 75.1%였습니다. 이 결과는 RFAA의 error head가 ligand identity mismatch를 어느 정도 감지한다는 뜻입니다. 하지만 이것도 “틀린 ligand를 모두 걸러낸다”가 아니라, confidence가 prioritization에 유용한 방향성을 가진다는 정도라는 관점에서 이해하면 충분합니다.

Generalization의 범위

Recent PDB protein-ligand complexes 5,421개 평가에서는 training set과 sequence cluster가 겹치는 경우 41% success, novel cluster에서는 23% success로 떨어집니다. Ligand cluster 기준으로도 seen ligand는 20%, dissimilar ligand는 16% success입니다.

이 숫자는 RFAA가 non-protein atom context를 다룰 수 있게 되었음을 보여줍니다. Novel protein-ligand combination에서는 아직 어려운 case가 남아 있지만, protein-only architecture를 all-atom biomolecular setting으로 확장했다는 contribution은 분명합니다.

Covalent modification prediction에서는 post-May 2020 PDB 931 entries에서 modification RMSD < 2.5 Å 기준 46% success를 보고합니다. High-confidence prediction은 60%였고, 그중 63%가 accurate였습니다. 이 section은 RFAA가 ligand docking뿐 아니라 covalent modification까지 다룰 수 있음을 보여줍니다.

다만 46%라는 숫자는 “절반 가까이 맞췄다”와 “절반 이상은 아직 틀린다”를 동시에 말합니다. RFAA는 non-protein chemistry를 neural structure prediction 안으로 끌어온 중요한 step이지만, drug-discovery docking engine처럼 바로 쓰기에는 아직 불안정한 구간이 남아 있습니다.

Glycosylated protein 분석도 같은 맥락입니다. Supplement Fig. S8에서는 최근 glycoprotein prediction을 따로 분석하며, homolog presence보다 glycan length와 predicted error가 더 직접적인 signal로 보인다고 설명합니다. 짧은 glycan이 더 잘 맞는 경향은 있지만 긴 glycan도 일부 성공 사례가 있고, IL-27 quaternary signaling complex 예시에서는 cryo-EM density와 glycan-sidechain hydrogen bond가 잘 맞는 case를 제시합니다. 이 section은 RFAA가 covalent modification과 glycan을 다룰 수 있음을 보여주지만, 모든 glycan topology를 안정적으로 예측한다는 claim은 아닙니다.

RFdiffusionAA: prediction에서 generation으로

RFdiffusionAA는 RFAA structure-prediction weights에서 시작해 ligand/context-conditioned denoising diffusion model로 fine-tune됩니다. Design 시에는 고정된 ligand conformation 또는 ligand plus motif를 두고, random residue frame distribution에서 denoising해 ligand를 둘러싸는 protein backbone을 만듭니다.

이후에는 LigandMPNN 또는 ProteinMPNN으로 sequence를 설계하고, AF2 self-consistency, Rosetta GALigandDock/FastRelax, ChemNet 같은 filtering을 거칩니다. 따라서 design success는 RFdiffusionAA 단독 성능이라기보다 ligand-conditioned generator, context-aware sequence design, prediction/filtering, assay가 결합된 pipeline result입니다.

FAD, SAM, IAI, OQO benchmark에서는 target당 400 trajectories를 생성하고, backbone당 LigandMPNN 8 sequences와 AF2 single-sequence prediction으로 self-consistency를 평가합니다. RFdiffusionAA는 protein-only RFdiffusion plus heuristic potential보다 Rosetta ΔG에서 유리한 design을 더 많이 만들었다고 보고됩니다.

이 comparison은 RFdiffusionAA가 ligand context를 직접 representation 안에 넣는 장점을 보여줍니다. Protein-only RFdiffusion에 attractive/repulsive potential을 얹는 방식은 ligand를 외부 force처럼 다루는 쪽에 가깝습니다. RFdiffusionAA는 처음부터 ligand 주변의 atom-level context를 조건으로 denoising합니다. Small-molecule pocket design에서는 이 차이가 중요합니다.

Supplement Fig. S10–S12는 이 in silico 결과를 조금 더 자세히 보여줍니다. RFdiffusionAA가 만든 모델은 AF2 single-sequence prediction과 잘 맞는 경우가 많고, FAD/SAM처럼 training set에 자주 나오는 ligand에서는 생성 backbone diversity가 상대적으로 낮아지는 경향이 있습니다. 반대로 IAI와 OQO처럼 training set과 더 먼 ligand에서도 design metric이 크게 무너지지는 않았다고 보고됩니다. 다만 novelty 분석에서 “training example을 그대로 외운 것은 아니다”와 “완전히 새로운 chemical recognition rule을 배웠다”는 서로 다른 말입니다. Supplement가 보여주는 것은 전자에 더 가깝습니다.

In silico designability의 범위

AF2 backbone RMSD < 2 Å self-consistency는 모든 small-molecule design case에서 최소 45% 이상이라고 보고됩니다. 이 숫자는 foldability/designability proxy로는 의미가 있습니다.

Self-consistency는 AF2가 sequence와 backbone을 다시 같은 fold로 예측한다는 뜻입니다. Binding validation과는 구분해야 하지만, RFdiffusionAA가 ligand pocket-like backbone을 만들고 sequence까지 붙일 수 있는지를 보는 designability signal로는 의미가 있습니다. 이후 wet-lab evidence는 digoxigenin, heme, bilin case에서 따로 확인됩니다.

이 논문이 설득력을 얻는 지점은 in silico benchmark에서 멈추지 않고 digoxigenin, heme, bilin으로 넘어간다는 점입니다. 다만 세 case의 design setup과 assay depth가 서로 다르기 때문에, 하나의 hit rate로 합치면 안 됩니다.

세 case는 난이도도 다릅니다. Digoxigenin은 비교적 ligand-only pocket design에 가깝습니다. Heme은 coordination motif와 open pocket constraint가 들어간 motif-assisted design입니다. Bilin은 chromophore covalent attachment와 optical property readout이 얽혀 있습니다.

Supplement를 보면 이 차이는 더 선명합니다. Bilin은 CARD motif를 포함한 designs를 만들고 CpcEF lyase와 PEB biosynthesis machinery가 있는 E. coli에서 색과 fluorescence로 screen합니다. Heme은 heme-ferryl/anisole transition-state-like model, cysteine coordination motif, open substrate pocket을 유도하는 conformer selection을 포함합니다. Digoxigenin은 ligand conformation만으로 시작하지만, ChemNet redocking과 biotin-digoxigenin linker burial filter까지 들어갑니다. 같은 RFdiffusionAA result라도, 입력 정보와 downstream filter가 case마다 다릅니다. “RFdiffusionAA가 arbitrary ligand binder를 만든다”는 한 문장으로 묶기에는 각 case의 prior와 assay가 다릅니다.

Digoxigenin binder: ligand-only pocket design

Digoxigenin design은 ligand-only input에 가까운 case입니다. Digoxigenin-only ligand input으로 25,000 diffused backbones를 만들고, geometry, SASA, contact filtering, LigandMPNN/Rosetta FastRelax iterative sequence design, AF2 pLDDT/backbone RMSD, ChemNet re-docking, Rosetta ddG와 hydrogen bond 기준을 거쳐 4,416 designs를 yeast display library로 screening합니다.

Yeast display/FACS에서 3 hits가 enrichment를 보였고, purified protein과 fluorescence polarization으로 dig1/dig2를 characterize합니다. Main text는 tightest binder가 digoxigenin에 10 nM Kd를 보이고 95°C까지 안정하다고 보고합니다.

Supplement에는 label-free digoxigenin ITC로 dig1 Kd 343 ± 109 nM, stoichiometry 1.02도 제시됩니다. 10 nM과 343 nM의 차이는 assay format, ligand label, condition 차이에서 올 가능성이 있지만, source만으로 완전히 reconcile하기는 어렵습니다. Publication-facing review에서는 두 값을 같이 함께 적어두는 것이 좋습니다.

Denominator도 같이 봐야 합니다. 25,000 backbones에서 출발해 4,416 designs를 yeast display로 보냈고, enrichment hit는 3개입니다. 이 숫자는 실패가 아니라 현실적인 funnel을 보여줍니다. Ligand-only pocket design은 생성보다 filtering과 assay에서 많은 후보가 사라지는 문제입니다.

Digoxigenin funnel의 filter를 조금 더 풀어 쓰면, 처음에는 radius of gyration, secondary structure content, ligand SASA, protein-ligand contact 수로 backbone을 걸렀고, 이후 LigandMPNN 8 sequences per backbone, AF2 pLDDT > 80, backbone RMSD < 1.5 Å, ChemNet confidence > 80을 거쳐 두 번째 LigandMPNN round로 들어갑니다. 마지막 실험 후보는 AF2 pLDDT > 80, design model과 AF2 사이 backbone RMSD < 2 Å, Rosetta ddG < -30, ligand와 최소 하나의 hydrogen bond, 그리고 biotin-digoxigenin linker atom이 깊이 묻히지 않는 조건을 통과한 4,416 designs입니다. 이 정도로 filter가 많기 때문에, 최종 3 hits는 generator-only hit rate로 이해하면 안 됩니다.

Heme binder: motif-assisted functional-site design

Heme design은 ligand-only pocket design이라기보다 heme plus cysteine coordination motif plus placeholder substrate/open pocket constraint를 둔 functional-site design에 가깝습니다. 약 10,000 backbones에서 pocket burial, substrate exposedness, clash, loop content, termini distance, radius of gyration 등을 filtering합니다.

ProteinMPNN/AF2/Rosetta/LigandMPNN cycles를 거쳐 168 designs를 실험했고, 135개가 E. coli에서 잘 발현되었습니다. 96개는 CYS-bound heme과 일치하는 UV/Vis spectra를 보였습니다. 45개를 purification했고, 38개가 SEC에서 monomeric이며 heme binding을 유지했습니다.

Putative heme-coordinating cysteine을 alanine으로 바꾸면 Soret feature가 변합니다. 이는 designed coordination의 역할을 지지합니다. HEM_3.C9는 1.8 Å X-ray co-crystal structure(PDB 8VC8)로 구조 검증도 있습니다. 이 case는 RFdiffusionAA wet-lab evidence 중 구조적으로 가장 단단한 축입니다.

구조 세부사항도 좋습니다. HEM_3.C9 crystal structure에서는 heme electron density가 보이고, Cys-140이 Fe-S 2.4 Å 거리로 ligation합니다. Arg-139는 heme propionate와 hydrogen bond를 만들고, Cys-140/Pro-141은 helix N-terminus에 위치해 native unspecific peroxygenase motif와 비슷한 local geometry를 이룹니다. Cys-140 sulfur는 Leu-143 backbone amide NH와도 hydrogen bond를 형성하며, heme site에서 protein surface로 이어지는 water-filled channel도 관찰됩니다. 이 정도 디테일은 단순한 heme-binding signal보다 더 깊은 structural evidence입니다.

Heme case에서 특히 좋은 점은 assay가 한 종류에 머물지 않는다는 것입니다. UV/Vis spectra, SEC monomericity, thermal stability, coordinating cysteine mutation, X-ray structure가 서로 다른 층위에서 같은 story를 지지합니다. 다만 이 case도 arbitrary heme enzyme design이라기보다 heme coordination과 pocket geometry를 만든 결과로 이해하면 충분합니다. Catalysis나 substrate turnover가 검증된 것은 아닙니다.

Heme design의 setup은 Supplement에서 거의 enzyme active-site design처럼 보입니다. 저자들은 para-phenylanisole의 methoxy C-H abstraction transition-state-like heme model을 만들고, 5,000 conformers 중에서 substrate가 heme propionate 쪽을 향하지 않고 heme plane과 너무 평행하지 않은 conformers를 고릅니다. 이후 UPO와 P450 구조에서 가져온 heme-coordinating cysteine motif를 사용하고, S-Fe bond 주변 90° 회전 orientation도 샘플링합니다. 실험으로 넘어간 168 designs는 AF2 pLDDT, Cα RMSD, cysteine sidechain RMSD, ligand contact metric, Rosetta ddG, contact molecular surface, SASA, H-bond 기준을 통과한 후보입니다. 그래서 heme case는 “ligand 하나만 던져 넣은 binder design”이라기보다, chemically motivated motif scaffolding에 가깝습니다.

Bilin binder: chromophore environment design

Bilin design은 CpcEF lyase가 인식하는 CARD motif를 포함해 PEB chromophore covalent attachment를 유도하는 setting입니다. 2,776 designs에서 AF2 RMSD < 2, motif RMSD < 1, AF2 PAE < 5, Rosetta ddG < -7.5, Contact Molecular Surface > 300 등의 기준으로 328 backbones를 뽑고 100 groups로 cluster해 후보를 선택합니다.

94 RFdiffusionAA designs panel에서 whole-cell color/fluorescence 기준 9 bilin binders를 찾았고, 9.6% hit rate로 보고됩니다. C11, H4, F9 purified designs는 CpcA-PEB control 대비 absorption maxima가 shifted되었고, relative fluorescence quantum yield도 17%, 38%, 57%로 측정됩니다.

이 결과는 binding 자체뿐 아니라 chromophore environment가 optical property를 바꿀 수 있음을 보여줍니다. 다만 photosynthesis 개선, reporter utility, cellular function 같은 system-level utility가 직접 검증된 것은 아닙니다.

Bilin case는 “binding”이라는 단어로만 요약하기 어렵습니다. Chromophore가 붙고, local environment가 spectrum과 quantum yield를 바꿉니다. 그래서 이 case는 ligand binder라기보다 designed chromophore microenvironment의 초기 실험으로 보는 것이 더 자연스럽습니다.

Bilin Supplement도 중요합니다. 2,776 designs에서 AF2 RMSD < 2 Å, motif RMSD < 1 Å, PAE < 5, Rosetta ddG < -7.5, Contact Molecular Surface > 300 기준으로 328 unique backbones를 고르고, 이를 100 clusters로 줄여 후보를 골랐습니다. 실험에서는 PEB synthesis machinery와 CpcEF lyase를 가진 E. coli에서 pink color를 첫 screen으로 사용했고, UV-Vis absorption과 fluorescence로 양성을 확인했습니다. C11은 PEB가 protein 없이 있을 때와 달리 573 nm absorption을 강하게 만들고, purification 후에도 PEB를 유지합니다. Supplement Fig. S19는 bilin 주변 coulombic charge와 absorption maximum 사이의 상관도 제시합니다. 이 결과는 designed pocket의 electrostatic environment가 chromophore spectrum에 영향을 준다는 점을 보여줍니다.

Pipeline attribution

RFAA/RFdiffusionAA 리뷰에서 특히 조심할 부분은 attribution입니다. Wet-lab success를 RFdiffusionAA 하나의 성능으로 쓰면 과장입니다. Backbones는 RFdiffusionAA가 만들지만, sequence는 LigandMPNN/ProteinMPNN이 맡고, AF2 self-consistency와 Rosetta/ChemNet filtering이 후보를 크게 줄입니다. Heme과 bilin처럼 motif나 enzymatic attachment context가 들어가는 case에서는 task-specific prior도 큽니다.

따라서 이 논문을 pipeline-level result라는 관점에서 보는 편이 좋습니다. RFdiffusionAA는 중요한 generator이지만, final hit는 representation, motif conditioning, sequence design, filtering, assay design이 모두 맞물린 결과입니다. 이 관점은 RFdiffusion, AlphaProteo, Baker GPCR paper를 읽을 때와도 이어집니다.

Supplement의 novelty analysis도 이 관점에 잘 맞습니다. Experimentally characterized designs에 대해 training set에서 가장 가까운 protein chain과 유사 ligand(Tanimoto > 0.5)를 비교했을 때, closest similar-ligand entry의 TM-score가 모두 0.62 아래였고 binding mode도 다르게 보인다고 보고됩니다. 이는 단순 memorization 우려를 낮춰주는 자료입니다. 하지만 novelty가 곧 generality는 아닙니다. Novel fold/pocket을 만들 수 있다는 것과, 임의의 ligand에 대해 높은 hit rate를 안정적으로 낸다는 것은 별개의 claim입니다.

Figure와 result 흐름

Figure 1은 RFAA architecture와 atom-bond graph / polymer representation 결합을 보여줍니다. 여기서는 protein 전체를 atom graph로 바꾸지 않고 non-polymer atom context를 붙이는 절충을 봐야 합니다.

Figure 2와 3은 prediction benchmark입니다. CAMEO ligand docking, recent PDB generalization, covalent modification/glycan prediction을 통해 RFAA의 prediction 범위를 보여줍니다.

Figure 4는 RFdiffusionAA generation과 in silico comparison입니다. 이 figure는 model이 ligand 주변에 pocket-like backbone을 만들 수 있음을 보여주지만, wet-lab validation은 아닙니다. Figure 5가 digoxigenin, heme, bilin experimental characterization으로 넘어가는 지점입니다.

Figure 5를 읽을 때는 세 panel을 같은 성공률 표로 합치지 않는 것이 좋습니다. Digoxigenin은 fluorescence polarization/ITC/SEC-MALS가 중심이고, heme은 UV/Vis와 X-ray structure가 강하며, bilin은 color/fluorescence와 spectral shift가 중심입니다. 각각의 assay가 지지하는 claim이 다릅니다.

Supplement figure 흐름까지 넣으면 독자가 훨씬 덜 놓칩니다. Fig. S2–S8은 prediction side의 추가 검증입니다. Metal ion, CAMEO ligand docking, RF2와의 ligand-aware folding 비교, PoseBusters physical plausibility, decoy ligand cross-docking, glycoprotein prediction이 여기에 들어갑니다. Fig. S10–S12는 RFdiffusionAA in silico design의 diversity/novelty/foldability를 보여줍니다. Fig. S13–S17은 heme designs의 UV/Vis, cysteine mutant, thermal stability, CD, crystal structure입니다. Fig. S18–S20은 bilin의 topology, spectrum, control experiment입니다. Fig. S31–S34는 digoxigenin yeast display, FP/competition FP, ITC, SEC-MALS입니다. Main Figure 5만 읽으면 세 case의 assay depth 차이가 충분히 드러나지 않습니다.

AlphaFold3, RFdiffusion2와의 위치

RFAA는 AlphaFold3류 biomolecular complex prediction과 비교될 수 있지만, 이 논문은 2024 Science 시점의 RoseTTAFold all-atom lineage입니다. 공개 source, representation, benchmark, downstream design fine-tune 연결성에서 별도 위치를 갖습니다.

RFdiffusion2와도 구분해두면 충분합니다. RFdiffusion2는 RFAA-style atomized representation을 일부 계승하지만, unindexed atomic motif/theozyme scaffolding을 위한 flow-matching generator입니다. RFAA는 주로 all-atom biomolecular prediction model이고, RFdiffusionAA는 ligand-conditioned pocket generation fine-tune입니다.

Protein generator review 흐름에서는 RFAA/RFdiffusionAA를 “all-atom context가 실제 wet-lab design으로 넘어간 anchor”로 둘 수 있습니다. Protpardelle/Proteina 계열이 monomer all-atom generation proxy를 보여준다면, RFAA/RFdiffusionAA는 ligand/cofactor/chromophore pocket을 실험으로 가져갑니다.

AlphaFold3와 비교할 때도 조심해서 보면 충분합니다. AlphaFold3는 biomolecular complex prediction의 넓은 benchmark와 productized inference story에 가깝고, RFAA는 RoseTTAFold lineage의 representation 확장과 RFdiffusionAA design fine-tune 연결성이 강합니다. 두 모델을 단순 accuracy leaderboard로 놓기보다, prediction-only system과 design-connected representation paper의 차이를 보는 편이 좋습니다.

Supplement까지 읽었을 때 남는 실무적 그림

Supplementary material까지 보면 RFAA/RFdiffusionAA의 그림은 더 흥미롭지만, 동시에 더 복잡해집니다. RFAA prediction side에서는 ligand docking, metal ion, glycan, covalent modification, decoy ligand confidence까지 확인합니다. RFdiffusionAA design side에서는 FAD/SAM/IAI/OQO in silico benchmark, diversity/novelty 분석, digoxigenin/heme/bilin wet-lab validation이 이어집니다. 이 범위는 넓습니다. 하지만 각 section의 evidence type은 다릅니다. Prediction benchmark, confidence calibration, in silico designability, wet-lab binding, structural validation, optical property shift를 한 줄 success로 묶으면 논문이 실제로 보여준 장점도 흐려지고 한계도 흐려집니다.

이 리뷰에서 이 논문을 읽는 가장 안전한 방법은 “RFAA는 all-atom biomolecular context를 neural network 안으로 끌고 들어온 prediction model이고, RFdiffusionAA는 그 representation을 pocket generation으로 연결한 proof-of-concept design system”으로 두는 것입니다. Supplement는 이 해석을 더 강하게 만듭니다. 특히 heme과 bilin case는 단순 binder보다 functional-site-like context와 chromophore microenvironment에 가깝고, digoxigenin case는 ligand-only design이 얼마나 긴 filtering funnel을 거치는지 잘 보여줍니다.

평가: all-atom design이 실험으로 넘어가는 순간

제가 보기엔 RFAA/RFdiffusionAA의 가치는 all-atom representation이 단순 prediction benchmark를 넘어 design pipeline으로 연결된 데 있습니다. Digoxigenin, heme, bilin은 서로 다른 chemistry를 요구하고, 그중 heme은 high-resolution structure validation까지 제공합니다.

동시에 claim을 분리해두면 충분합니다. RFAA가 biomolecular complex prediction에서 flexible context를 다룬다는 claim과, RFdiffusionAA가 arbitrary ligand binder를 일반적으로 잘 만든다는 claim은 다릅니다. Wet-lab success는 LigandMPNN/ProteinMPNN, AF2/Rosetta/ChemNet filtering, target-specific motifs, assay selection이 붙은 pipeline result입니다.

RFAA 논문은 all-atom biomolecular prediction과 ligand-conditioned protein pocket generation을 연결한 중요한 paper입니다. Ligand docking benchmark, in silico designability, wet-lab binder validation, functional utility는 서로 다른 evidence layer지만, 이 층위들이 한 논문 안에서 이어진다는 점이 바로 RFAA/RFdiffusionAA의 흥미로운 지점입니다.

참고

- Krishna et al., “Generalized biomolecular modeling and design with RoseTTAFold All-Atom”, Science, 2024. https://doi.org/10.1126/science.adl2528