Search

MFDesign 논문 리뷰

MFDesign 논문 리뷰

들어가며

AlphaFold3 이후 protein design에서 자연스럽게 생긴 질문이 있습니다. 이미 folding model 안에 diffusion module이 있다면, 이 machinery를 prediction이 아니라 design에 쓸 수 있을까? RFdiffusion처럼 generator를 따로 만드는 길도 있지만, AF3-like folding model을 직접 개조해 sequence와 structure를 함께 생성하는 길도 있습니다.
ICLR 2025 GEM workshop 논문 “Repurposing AlphaFold 3-like Protein Folding Models for Antibody Sequence and Structure Co-design”의 MFDesign은 바로 이 방향을 택합니다. Boltz-1 같은 AF3-like folding model의 structure diffusion module에 sequence diffusion head를 붙여, antibody CDR sequence와 backbone structure를 동시에 redesign합니다.
다만 이 논문은 wet-lab antibody discovery 논문이 아닙니다. Setting은 fixed antibody-antigen co-crystal context입니다. Framework, antigen, binding pose는 주어지고, CDR만 가린 뒤 다시 맞춥니다. Evidence도 SAbDab in silico benchmark입니다. BLI/SPR/KD, specificity, function, pose validation, developability assay는 없습니다. 그래서 MFDesign은 “새 항체를 실험적으로 만들었다”보다 “AF3-like folding model을 antibody CDR co-design model로 repurpose하는 방법”으로 읽는 편이 안전합니다.

Folding model을 design model로 바꾸기

MFDesign의 출발점은 AF3-like folding model의 구조입니다. 이런 model은 대체로 sequence, MSA, template/raw input을 처리하는 conditioning trunk와, noisy atom coordinates를 denoise해 structure를 예측하는 diffusion module을 가집니다. MFDesign은 diffusion module 내부에서 만들어지는 token-level representation `{ai}`에 주목합니다. 이 representation은 structure denoising에 쓰이지만, residue identity prediction에도 쓸 수 있습니다.
그래서 저자들은 Boltz-1/AF3-like diffusion module에 `TokenDenoiser`라는 sequence denoising head를 붙입니다. CDR residues는 input에서 `<X>` token으로 표시되고, model은 CDR backbone coordinates와 CDR amino-acid identity를 함께 denoise합니다.
Structure side는 AF3/Boltz-1의 EDM-style coordinate diffusion을 따릅니다. Sequence side는 discrete D3PM-absorbing diffusion을 기본으로 사용합니다. CDR residue token이 점차 `<X>`로 corruption되고, model은 원래 amino acid identity를 복원하도록 학습됩니다. 논문은 continuous one-hot Gaussian sequence diffusion variant도 구현하며, discrete version을 MFDesign-D, continuous version을 MFDesign-C로 부릅니다.
이 아이디어의 장점은 sequence design을 별도의 inverse-folding post-processor로 떼어내지 않는다는 점입니다. CDR backbone과 sequence가 같은 diffusion process 안에서 함께 움직입니다. Antibody CDR design에서는 loop geometry와 residue identity가 서로 얽혀 있기 때문에, 이 co-diffusion framing은 직관적으로 매력적입니다.

Fixed co-crystal CDR redesign

MFDesign의 task setting은 fixed co-crystal CDR redesign입니다. Experimentally resolved antibody-antigen complex에서 CDR만 redesign합니다. Framework sequence/structure, antigen sequence/structure, antibody-antigen binding pose는 주어집니다.
Sampling 중에는 CDR가 아닌 fixed part를 ground-truth structure의 forward-noised counterpart로 계속 대체하는 replacement sampling을 사용합니다. Image inpainting에서 온 방식이고, motif-conditioned protein generation에서도 쓰이는 방식입니다. 즉 model은 전체 antibody-antigen complex를 새로 찾는 것이 아니라, 고정된 context 안에서 CDR region을 채워 넣습니다.
이 점은 MFDesign의 해석에서 중요한 지점입니다. Target만 주고 antibody를 생성하는 zero-prior discovery가 아닙니다. 이미 known pose와 framework/antigen context가 있는 상태에서 CDR sequence와 backbone을 복원/재설계하는 inpainting problem입니다.
또 하나의 경계는 sidechain입니다. MFDesign은 CDR backbone atom coordinates를 생성하고, final all-atom structure는 PyRosetta side-chain packing과 relaxation으로 만듭니다. 따라서 “end-to-end full all-atom CDR chemistry를 직접 생성한다”고 쓰면 과합니다. 이 논문은 CDR backbone + sequence co-design에 더 가깝습니다.

Dataset과 leakage control

Source data는 SAbDab입니다. 저자들은 Boltz-1 pretraining cutoff가 AlphaFold3와 같은 2021-09-30 이전 PDB structure라고 보고, release date를 고려해 train/validation/test split을 만듭니다. Protein antigen을 가진 heavy+light antibody 또는 single-heavy-chain nanobody complex를 사용하고, resolution cutoff는 4.5 Å입니다.
CDR definition에는 Chothia numbering과 AbNumber/ANARCI 기반 validation을 사용합니다. 같은 PDB 안의 유사 VH CDR sequence는 Levenshtein distance threshold 9로 deduplicate하고, CDR-H3 sequence 기준 MMSeqs2 50% identity clustering을 적용합니다. 2021-09-30 이전 구조가 포함된 cluster는 training에 넣고, 이후 cluster를 validation/test로 나눕니다. 최종 split은 5,843 training, 187 validation, 204 test samples입니다. Test set은 161 regular antibodies와 43 nanobodies입니다.
저자들은 RAbD benchmark가 Boltz-1 pretraining cutoff 이전 PDB structures를 포함하므로 main evaluation에서 쓰지 않습니다. MSA leakage도 따로 다룹니다. Query CDR를 `<X>`로 두더라도 MSA hit 안에 ground-truth CDR와 유사한 sequence가 들어갈 수 있기 때문에, CDR similarity threshold를 넘는 MSA sequences를 filtering합니다.
이 leakage control은 MFDesign을 읽을 때 중요합니다. Native recovery benchmark에서는 train/test leakage가 조금만 있어도 AAR/RMSD가 과대평가될 수 있습니다. 저자들이 release date, clustering, MSA filtering을 신경 쓴 점은 이 논문의 methodological strength입니다.

Six-CDR redesign benchmark

Main benchmark는 typical antibody에서 all six CDRs를 동시에 redesign하는 설정입니다. Baselines는 DiffAb와 dyMEAN입니다. AbDiffuser와 AbX는 code/training-script availability 문제로 제외됩니다. Metrics는 AAR, RMSD, CDR-H3 middle-loop AAR/RMSD, Rosetta InterfaceAnalyzer 기반 IMP입니다. Generative methods는 sample당 20 candidates를 생성하고 average를 보고합니다.
Table 1/2에서 MFDesign은 DiffAb/dyMEAN보다 높은 native recovery를 보입니다. CDR-H3 기준으로 DiffAb는 AAR 22.26%, RMSD 4.29 Å, dyMEAN은 AAR 34.69%, RMSD 6.15 Å입니다. MFDesign-C는 AAR 63.13%, RMSD 3.54 Å, MFDesign-D는 AAR 65.04%, RMSD 3.71 Å입니다.
H3 middle-loop에서도 차이가 큽니다. DiffAb는 Loop-AAR 15.86%, Loop-RMSD 5.03 Å, IMP 56.77%, dyMEAN은 Loop-AAR 20.80%, Loop-RMSD 7.84 Å, IMP 10.56%입니다. MFDesign-C는 Loop-AAR 61.71%, Loop-RMSD 4.13 Å, IMP 66.24%, MFDesign-D는 Loop-AAR 63.38%, Loop-RMSD 4.28 Å, IMP 59.66%입니다.
이 결과는 MFDesign이 native CDR sequence/structure recovery에서 강하다는 것을 보여줍니다. 다만 AAR/RMSD는 wet-lab success가 아닙니다. Native-like recovery는 structural plausibility proxy로 유용합니다. 하지만 de novo design에서는 native와 다른 valid solution도 가능하고, high AAR가 곧 binding/function/developability를 뜻하지도 않습니다.

Nanobody redesign과 structure retention

Nanobody test set은 43 complexes입니다. dyMEAN은 official code가 nanobody processing을 지원하지 않아 비교에서 제외됩니다. DiffAb nanobody H3는 AAR 15.39%, RMSD 4.71 Å, Loop-AAR 10.51%, Loop-RMSD 5.50 Å, IMP 30.93%입니다. MFDesign-C는 H3 AAR 61.40%, RMSD 3.71 Å, Loop-AAR 61.01%, Loop-RMSD 4.26 Å, IMP 42.67%입니다. MFDesign-D는 H3 AAR 63.51%, RMSD 3.84 Å, Loop-AAR 60.80%, Loop-RMSD 4.41 Å, IMP 38.26%입니다.
Nanobody는 longer H3와 낮은 data availability 때문에 더 어렵다고 설명됩니다. 그런 setting에서도 MFDesign이 H3/Loop-AAR 60% 이상을 유지한다는 점은 눈에 띕니다. 다만 여기서도 evidence는 fixed-complex in silico redesign입니다.
Appendix의 structure prediction retention 결과도 조심해서 읽을 만합니다. CDR unknown setting에서는 fine-tuned model이 RMSD 2.21 Å에서 1.73 Å, Loop-RMSD 5.57 Å에서 4.90 Å로 좋아지고, TM-score도 91.84%에서 93.88%로 올라갑니다. 반면 CDR given setting에서는 original Boltz-1이 RMSD 1.39 Å, Loop-RMSD 3.53 Å, TM-score 95.45%인데, fine-tuned model은 RMSD 1.65 Å, Loop-RMSD 4.55 Å, TM-score 94.25%로 약간 나빠집니다.
이 결과는 fine-tuning의 tradeoff를 보여줍니다. CDR unknown co-design에는 도움이 되지만, pretraining-derived structure prediction feature space와 added sequence objective가 일부 충돌할 수 있습니다.

Proteo-R1, HelixDesign-Antibody와의 위치

MFDesign은 Proteo-R1, HelixDesign-Antibody와 같이 읽을 때 위치가 선명합니다. 세 논문 모두 antibody CDR design과 연결되지만, wet-lab performance layer는 아닙니다.
Proteo-R1은 multimodal LLM이 reasoning-guided sparse CDR residue anchors를 제안하고, AF3-style generator가 이를 쓰는 architecture입니다. Evidence는 SAbDab/RAbD in silico metrics이고, 핵심 claim은 reasoning-guided anchor interface에 있습니다.
HelixDesign-Antibody는 HelixFold3-centered infrastructure/evaluator paper입니다. Modified ESM-IF1로 candidate CDR sequence를 만들고, HelixFold3, FoldX, epitope overlap, HPC sampling으로 rank합니다. Evidence는 proxy-metric scaling과 known-system in silico redesign입니다.
MFDesign은 AF3/Boltz-like folding model 자체를 sequence-structure co-diffusion model로 바꾸는 접근입니다. Proteo-R1이 “어떤 residue anchor를 잡을 것인가”를 묻는다면, MFDesign은 “folding model의 diffusion machinery를 CDR co-design에 직접 쓸 수 있는가”를 묻습니다.
따라서 MFDesign을 mBER나 Germinal 같은 wet-lab antibody/VHH evidence와 같은 표에서 hit rate로 비교하면 안 됩니다. 이 논문의 위치는 in silico CDR redesign / native recovery / AF3-like generator repurposing입니다.

Figure와 table로 읽기

Figure 1은 MFDesign의 overview입니다. AF3-like folding model의 diffusion module에 sequence denoising을 추가해 CDR sequence와 structure를 함께 diffusion하는 구조를 보여줍니다. 이 figure는 논문의 중심 아이디어를 가장 잘 보여줍니다.
Table 1은 typical antibody six-CDR simultaneous redesign에서 per-CDR AAR/RMSD를 비교합니다. Table 2는 H3 middle-loop AAR/RMSD와 IMP를 보여줍니다. 여기서 MFDesign의 장점은 native recovery입니다.
Table 3은 nanobody simultaneous CDR redesign입니다. Nanobody H3에서도 MFDesign이 DiffAb보다 높은 AAR/RMSD profile을 보입니다.
Algorithm S1은 CoDiffusionModule입니다. Structure denoising과 sequence denoising이 같은 token-level representation `{ai}`를 공유한다는 점이 중요한 지점입니다. Algorithm S3은 replacement sampling입니다. Fixed co-crystal CDR redesign setting을 이해하는 데 필요한 algorithm입니다.
Table S2는 structure prediction retention입니다. Fine-tuning이 CDR unknown co-design에는 도움이 되지만, CDR given prediction에서는 original Boltz-1보다 약간 나빠질 수 있다는 tradeoff를 보여줍니다.

평가: predictor를 generator로 바꾸는 방법

내가 보기엔 MFDesign의 가치는 wet-lab result가 아니라 model-conversion idea에 있습니다. AF3/Boltz-like folding model의 diffusion module에 sequence denoising을 추가해 antibody CDR sequence와 backbone structure를 함께 생성한다는 접근은 깔끔합니다. 특히 sequence design을 post-hoc inverse folding으로 분리하지 않고, diffusion state 안으로 넣었다는 점이 좋습니다.
동시에 evidence boundary는 분명합니다. MFDesign은 SAbDab fixed-complex CDR redesign benchmark에서 native recovery가 좋은 논문입니다. BLI/SPR/KD, specificity, function, developability, pose validation은 없습니다. Sidechain chemistry도 PyRosetta post-processing에 의존합니다. 그래서 “binder를 만들었다”가 아니라 “known complex 안에서 CDR sequence/backbone을 native-like하게 복원/재설계했다”로 읽는 편이 안전합니다.
안전한 결론은 이 정도입니다. MFDesign은 AF3-like folding model을 antibody CDR co-design generator로 repurpose하는 좋은 in silico method paper입니다. Proteo-R1, HelixDesign-Antibody와 함께 antibody CDR redesign의 proxy/infrastructure layer를 채우지만, wet-lab antibody discovery layer로 옮겨 놓으면 과장됩니다.

참고

Yang et al., “Repurposing AlphaFold 3-like Protein Folding Models for Antibody Sequence and Structure Co-design”, GEM workshop, ICLR 2025.
Code: https://github.com/yangnianzu0515/MFDesign
Model weights: https://huggingface.co/yangnianzu/MFDesign