RFdiffusion2 논문 리뷰
들어가며
RFdiffusion 이후 protein design 논문을 읽다 보면 자연스럽게 한 가지 질문으로 넘어가게 됩니다. Backbone을 그럴듯하게 만들 수 있다면, 이제 기능도 설계할 수 있을까요? Binder design에서는 이 질문에 어느 정도 낙관적으로 답할 수 있습니다. Target surface에 맞는 interface를 만들고, ProteinMPNN으로 sequence를 붙인 뒤, AlphaFold 계열 모델로 다시 접히는지 확인하고, 마지막으로 binding assay를 돌리는 pipeline이 이미 강력해졌기 때문입니다.
하지만 enzyme design은 조금 다릅니다. Enzyme은 target에 붙는 것만으로는 부족합니다. Transition state를 안정화해야 하고, nucleophile, acid/base, metal, oxyanion hole 같은 catalytic group이 원자 수준에서 맞아야 합니다. 구조가 예쁘게 접힌다는 것과 실제 substrate가 turnover된다는 것은 전혀 다른 주장입니다.
RFdiffusion2 논문, “Atom-level enzyme active site scaffolding using RFdiffusion2”는 바로 이 간극을 겨냥합니다. 단순히 RFdiffusion의 다음 버전이 나왔다는 정도로 읽기에는 초점이 더 구체적입니다. RFdiffusion2는 enzyme active site의 theozyme, 즉 반응에 필요한 catalytic atom geometry를 residue index와 rotamer를 미리 정하지 않은 채 넣고, 그 주변을 지지할 scaffold를 생성하려고 합니다.
Enzyme design의 어려움
RFdiffusion의 강점은 backbone과 motif scaffolding이었습니다. 특정 structural motif를 유지하면서 새로운 protein scaffold를 만들거나, target protein 표면에 맞는 binder backbone을 생성하는 데 강했습니다. 이후 일반적인 pipeline은 RFdiffusion으로 backbone을 만들고, ProteinMPNN으로 sequence를 설계하고, AlphaFold2 같은 structure predictor로 다시 접히는지를 확인한 뒤 실험으로 넘어가는 식이었습니다.
Enzyme active site에서는 문제가 더 까다로워집니다. Enzyme design에서 theozyme은 원하는 반응을 촉진하기 위해 catalytic residue와 substrate 또는 transition-state analog가 어떤 geometry를 가져야 하는지 표현한 원자 수준의 설계도에 가깝습니다. 그런데 이 설계도를 실제 protein scaffold 안에 넣으려면, “이 catalytic atom은 몇 번째 residue의 어떤 rotamer로 들어간다”는 식의 결정을 내려야 합니다.
여기서 rotamer는 sidechain이 취할 수 있는 대표적인 3D conformation을 뜻합니다. 과거 방식에서는 catalytic atom geometry를 먼저 가능한 inverse rotamer와 residue index 조합으로 바꾼 뒤, 그 indexed motif를 scaffold해야 했습니다. Catalytic residue가 여러 개이고 ligand나 metal까지 얽히면 가능한 조합이 폭발합니다. RFdiffusion2가 겨냥한 병목은 바로 이 지점입니다.
Unindexed atomic motif를 직접 넣기
RFdiffusion2의 핵심 아이디어는 enzyme active site를 backbone motif가 아니라 atomic motif로 다루는 것입니다. Catalytic sidechain의 functional-group atom, ligand 또는 transition-state atom, 일부 backbone atom을 조건으로 주면, 모델이 이 atom들이 어떤 residue로 구현될지와 그 residue가 sequence상 어디에 놓일지를 함께 결정합니다.
이 점이 기존 RFdiffusion과의 가장 큰 차이입니다. 기존 RFdiffusion으로 atom-level theozyme을 쓰려면 atomic motif를 먼저 inverse rotamer sampling을 통해 indexed backbone motif로 바꿔야 했습니다. RFdiffusion2는 AME benchmark의 unindexed atomic motif를 native form에 가깝게 받고, ORI token을 motif atom center of mass에 놓아 sampling합니다. 즉 input formulation 자체가 enzyme theozyme 문제에 더 맞게 바뀐 것입니다.
Architecture 측면에서는 RFAA 계열의 all-atom-capable representation을 활용하고, flow matching으로 generator를 학습합니다. 논문은 RFdiffusion/RFdiffusionAA처럼 pretrained structure-prediction weights에 크게 기대는 대신 randomly initialized RFAA architecture를 안정적으로 학습했다고 보고합니다. Supplement 기준으로 24 A100에서 17일 학습했다는 점도 적혀 있습니다.
또 하나 중요한 장치는 ligand RASA, ORI pseudo-atom, partial ligand input입니다. RASA는 relative solvent accessible surface area의 약자로, ligand atom이 얼마나 묻히거나 노출되어야 하는지 조절하는 조건입니다. ORI token은 motif 대비 scaffold center-of-mass의 방향을 대략 지정합니다. Partial ligand input은 ligand나 transition state의 일부 atom만 알고 있을 때 나머지 conformer 자유도를 모델이 채우게 합니다. enzyme design에서는 이런 제어가 단순한 편의 기능이 아니라 design problem 자체의 일부입니다.
[Figure 1] Pipeline: generator가 아니라 design campaign으로 보기
Figure 1을 보면 RFdiffusion2를 어떤 pipeline으로 읽어야 하는지가 드러납니다. Theozyme 또는 catalytic atomic motif를 넣고, RFdiffusion2가 scaffold를 만들고, LigandMPNN이 sequence를 붙이고, AF2/Chai-1/PLACER/Rosetta 계열 filtering을 거친 뒤, 실제 expression과 activity assay로 넘어갑니다.
여기서 RFdiffusion2의 성공은 generator 단독의 성공으로만 분리하기 어렵습니다. 생성 모델이 search space를 열어주지만, 실제 후보는 sequence design과 여러 단계의 structural/active-site filtering을 통과하는 편이 안전합니다. 그래서 이 논문은 “모델 하나가 enzyme을 만들었다”보다 “theozyme-to-scaffold 문제를 더 직접적으로 풀 수 있는 generator가 강한 filtering pipeline 안에서 실제 activity로 이어졌다”로 읽는 편이 안전합니다.
[Figure 2] Conditioning: active site 주변 제어
Figure 2에서는 RFdiffusion2가 받을 수 있는 조건들이 정리됩니다. 여기서 중심에 있는 것은 unindexed atomic motif입니다. catalytic residue 전체가 아니라 sidechain tip atom이나 ligand atom 일부만 주어져도, 모델은 그 atom들이 들어갈 residue와 scaffold를 함께 생성합니다.
RASA condition은 ligand가 묻혀야 하는지, 노출되어야 하는지, 부분적으로 노출되어야 하는지를 조절합니다. Supplement에서는 exposed, buried, partially exposed bin을 사용합니다. ORI token은 scaffold가 motif 주변 어느 방향으로 자라야 하는지를 제어하는 역할을 합니다. Partial ligand condition은 전체 ligand conformer를 고정하지 않고 일부 atom만 조건으로 주는 방식입니다. 이런 장치들은 enzyme active site처럼 local chemistry와 pocket geometry가 동시에 중요한 문제에서 유용합니다.
[Figure 3] AME benchmark 결과
논문은 먼저 Atomic Motif Enzyme, 줄여서 AME benchmark를 만듭니다. M-CSA와 PARITY를 cross-reference해서 reactant나 cofactor가 PDB 구조에 포함된 41개 active site를 골랐고, catalytic residue sidechain에서 random connected atom sets를 뽑아 theozyme-like motif로 사용했습니다.
Supplementary Methods C.2를 보면 평가 절차가 구체적입니다. 각 motif case에서 100 NFE inference로 scaffold를 만들고, scaffold마다 LigandMPNN temperature 0.1로 8개 sequence를 붙입니다. Motif amino acid identity는 원래 PDB의 residue identity로 고정합니다. 이후 Chai-1 v0.0.1을 single-sequence mode로 돌리며, MSA, structural template, constraint 없이 ligand–protein all-atom complex를 예측합니다.
각 sequence에 대해 Chai-1 diffusion samples 5개가 나오고, highest-confidence structure를 고릅니다. 그다음 atomic motif에 steric clash가 없는 prediction만 남기고, design과 prediction 사이의 all-atom motif RMSD를 계산합니다. 성공 기준은 motif RMSD < 1.5 Å와 predicted atomic motif clash 없음입니다.
RFdiffusion2는 41개 AME case 모두에서 적어도 하나의 in silico success를 만들었습니다. 기존 RFdiffusion baseline은 16/41 case에 그쳤습니다. 특히 residue island가 많아지는 복잡한 motif에서 차이가 커집니다. 이 숫자는 RFdiffusion2가 복잡한 catalytic atom arrangement를 structural proxy 기준으로 scaffold할 수 있음을 보여줍니다. 다만 AME 41/41은 실제 enzyme activity가 아니라 LigandMPNN + Chai-1 structural recapitulation 기준의 in silico number입니다.
[Figure 4] Wet-lab validation 결과
Retroaldolase
첫 번째 wet-lab campaign은 retroaldolase입니다. 논문은 evolved retroaldolase RA95.5-8F(PDB 5AN7)에서 Y1051, K1083, N1110, Y1180 주변 9개 active-site atoms와 suicide inhibitor LLK를 motif로 사용합니다. Protein length 120/150/180과 ligand RASA 조건 조합으로 20,000 structures × 6 conditions를 생성하고, 각 design에 LigandMPNN 8 sequences를 붙여 총 960,000 sequences를 만듭니다.
Filtering은 상당히 강합니다. AF2 motif RMSD < 1.2 Å로 9,826 designs를 남기고, LysSASA < 5, reactantSASA < 120, global backbone RMSD < 2 Å 조건으로 2,724 sequences까지 줄입니다. 이후 PLACER로 apo, holo, 네 가지 carbinolamine stereoisomer ensemble을 만들고, theozyme residue sidechain RMSD/RMSF와 hydrogen-bond fraction 같은 metric을 사용해 최종 90 designs를 고릅니다.
Main text는 96 IVTT-expressed designs 중 four variants가 detectable activity를 보였다고 쓰지만, supplement Fig. S11은 90 tested designs 중 3 active라고 적습니다. 이 denominator discrepancy는 그대로 caveat로 두는 편이 안전합니다. Purified best design의 kcat/KM은 약 6.34 ± 0.92 M⁻¹s⁻¹입니다. Activity가 있다는 점은 중요하지만, native enzyme 수준과는 거리가 있습니다.
Cysteine hydrolase
두 번째는 cysteine hydrolase campaign입니다. 4MU-butyrate tetrahedral intermediate를 RDKit으로 만들고, Cys25/His159/Asn175/Gln19 및 Ser24/Trp26 backbone atoms까지 포함해 motif를 구성합니다. 95–185 aa length에서 scaffold를 만들고, LigandMPNN 8 sequences + AF2로 약 1,200 designable scaffolds를 얻습니다.
이후 stage-1에서는 100 sequences/backbone, 3 cycles LigandMPNN + Rosetta FastRelax, AF2 RMSD filters로 1,321 designs를 남깁니다. Stage-2에서는 PLACER ensemble으로 Cys–His distance, oxyanion-hole distance, uncertainty filter를 걸고, 최종 48 designs/29 scaffolds를 실험합니다. 가장 active한 Eta1은 purified batch에서 acylation step kcat/KM = 248 ± 34 M⁻¹s⁻¹로 보고됩니다.
Active-site knockout 실험도 볼 지점입니다. catalytic residue를 alanine으로 바꾸면 activity가 크게 줄어듭니다. 이런 control은 실제 active site가 기능하고 있다는 점을 지지합니다. 다만 이 paper에서 고해상도 X-ray나 cryo-EM 구조 검증은 보고되지 않습니다. 따라서 activity evidence는 real이지만, designed pose가 원자 수준으로 그대로 구현됐는지는 별도의 문제로 남습니다.
Zinc metallohydrolase
세 번째는 zinc metallohydrolase입니다. 이 부분은 accompanying Nature paper에 더 자세히 들어가고, RFdiffusion2 paper는 요약과 방법을 제공합니다. 4MU-butyrate에서는 96 designs 중 3 functional enzymes, 4MU-phenylacetate first campaign에서는 96 designs 중 5 hits, general base를 포함한 second campaign에서는 96 designs 중 11 functional enzymes를 보고합니다. Best 4MU-PA enzyme의 kcat/KM은 53,000 ± 5,000 M⁻¹s⁻¹로 적혀 있어, 이 논문에서 주요 functional result 중 하나입니다.
다만 이 결과도 RFdiffusion2 paper 안에서는 요약 수준입니다. Zinc campaign을 더 강하게 쓰려면 accompanying metallohydrolase paper의 assay와 구조/기작 검증을 별도로 확인하는 편이 좋습니다.
Activity evidence의 범위
Assay cascade 관점에서 RFdiffusion2를 보면 evidence layer가 깔끔하게 나뉩니다. AME benchmark는 structural plausibility/filtering layer입니다. Retroaldolase, cysteine hydrolase, zinc metallohydrolase screens는 functional screen layer이고, selected hits의 kcat/KM은 kinetic characterization layer입니다.
이 논문은 foldability-only generator 논문보다 훨씬 강한 evidence를 제공합니다. 실제 catalytic activity와 kinetic value가 있기 때문입니다. 하지만 high-resolution pose validation, broad substrate specificity, developability/manufacturability layer는 이 paper의 중심 evidence가 아닙니다. 따라서 “enzyme design solved”보다는 “unindexed theozyme scaffolding이 실제 activity로 이어질 수 있음을 보였다”가 더 정확한 표현입니다.
한계점
첫째, AME benchmark는 구조적 proxy입니다. 41/41 solved라는 숫자는 강하지만, Chai-1 prediction에서 active-site geometry가 맞는지를 본 결과이지 activity를 의미하지 않습니다.
둘째, wet-lab activity는 분명히 의미 있지만 native enzyme 수준으로 일반화하기는 어렵습니다. 논문 discussion도 RFdiffusion2-designed enzymes가 native enzyme만큼 active하다고 주장하지 않습니다.
셋째, retroaldolase denominator에는 main text와 supplement 사이에 약간의 불일치가 있습니다. publication-facing review에서는 96/four와 90/three를 무리하게 하나로 합치기보다 caveat로 남기는 편이 좋습니다.
넷째, designed pose에 대한 고해상도 구조 검증은 제한적입니다. Activity assay는 기능 증거로 중요하지만, active site가 설계 의도와 같은 원자 수준 구조를 취했는지는 이 결과만으로는 말해주지 않습니다.
평가
RFdiffusion2는 RFdiffusion 이후 protein design의 방향을 선명하게 잡아주는 논문입니다. 이제 문제는 단순히 backbone을 만드는 것이 아니라, 기능을 좌우하는 local atom geometry를 어떻게 생성 조건으로 넣을 것인가입니다. Enzyme design은 이 질문을 가장 엄격하게 던지는 분야이고, RFdiffusion2는 그 질문에 대해 설득력 있는 답을 제시합니다.
제가 보기에는 이 논문의 진짜 의미는 enzyme design이 완결됐다는 데 있지 않습니다. 오히려 enzyme design에서 가장 어려운 local chemistry 문제를 generative model이 직접 다루기 시작했다는 데 있습니다. 하지만 active-site geometry가 activity가 되기까지는 여전히 sequence realization, filtering, expression, kinetic assay라는 긴 다리가 필요한 지점입니다.
그래서 RFdiffusion2는 낙관적으로 읽되, 과장하지 않는 편이 좋습니다. 이 논문은 unindexed theozyme을 직접 scaffold하고 여러 enzyme campaign에서 measurable catalytic activity까지 연결했습니다. 다만 그 성공은 강한 filtering cascade와 kinetic assay까지 포함한 pipeline-level result이며, pose validation이나 native-level catalysis를 의미하지는 않습니다.
참고
•
Ahern et al. 2025, Nature Methods, “Atom-level enzyme active site scaffolding using RFdiffusion2”, DOI: 10.1038/s41592-025-02975-x
•
Code: https://github.com/RosettaCommons/RFdiffusion2/
•
Wiki 참고: RFdiffusion2, RFdiffusion Lineage, Enzyme Design, All-Atom Generation, Candidate Filtering, Wet-lab Validation, Assay Cascade