RFdiffusion-Antibody 논문 리뷰

들어가며

Antibody design으로 넘어갈 때 생기는 제약

Generation, sequence design, filtering의 역할 분리

VHH campaign: 낮은 hit rate와 깊은 후속 검증

OrthoRep: design hit와 matured binder 사이

scFv와 full antibody로 넘어가기

Cryo-EM pose validation의 무게

Figure별로 읽기

mBER, Germinal과의 위치 차이

평가: 낮은 hit rate에도 milestone인 이유

참고

RFdiffusion-Antibody 논문 리뷰

들어가며

RFdiffusion은 target surface에 맞는 새로운 backbone을 만들 수 있다는 점에서 단백질 binder design의 기준점을 바꿨습니다. 하지만 antibody는 그냥 작은 binder가 아닙니다. Framework가 있고, 결합면은 CDR loop에 몰려 있으며, target을 향해 어떤 각도로 접근하는지도 중요한 지점입니다. 같은 target에 붙어도 intended epitope가 아니면 의미가 달라지고, epitope가 맞아도 designed pose가 틀릴 수 있습니다.

2025년 Nature에 발표된 “Atomically accurate de novo design of antibodies with RFdiffusion”은 이 어려운 문제를 RFdiffusion 안으로 가져온 논문입니다. 논문에서 제시하는 RFAntibody/RFdiffusion-Antibody는 RFdiffusion을 antibody complex와 loop-mediated interface에 맞게 fine-tuning하고, ProteinMPNN CDR sequence design, RoseTTAFold2/AlphaFold3-style filtering, yeast display/SPR screening, OrthoRep affinity maturation, cryo-EM pose validation을 이어 붙인 pipeline입니다.

이 논문은 숫자만 보면 단순한 성공담처럼 읽히지 않습니다. 초기 VHH campaign의 target-level success rate는 0–2% 수준으로 낮습니다. 9,000-design yeast library나 95-design low-throughput SPR screen이 필요했고, 여러 target에서 실패도 있었습니다. 그런데 동시에 influenza HA, TcdB VHH, TcdB scFv에서는 cryo-EM으로 designed pose가 상당히 잘 맞는 사례를 보여줍니다. 그래서 이 논문은 “antibody design이 해결됐다”보다, “epitope-specific antibody-like binder를 만들기 위해 generation, filtering, screening, maturation, structural validation이 얼마나 촘촘히 결합되어야 하는가”를 보여주는 milestone으로 읽는 편이 안전합니다.

Antibody design으로 넘어갈 때 생기는 제약

일반 miniprotein binder design에서는 target surface에 맞는 새로운 scaffold를 비교적 자유롭게 만들 수 있습니다. Antibody나 VHH는 다릅니다. VHH, scFv, full antibody는 이미 정해진 immunoglobulin framework 위에서 CDR loop가 결합면을 만듭니다. 특히 scFv는 heavy chain과 light chain의 여섯 CDR이 함께 paratope를 형성하므로, VHH보다 훨씬 많은 geometric failure mode를 가집니다.

RFAntibody가 겨냥하는 문제는 de novo epitope-specific antibody discovery입니다. 이미 결합하는 antibody를 조금 고치는 affinity maturation이나 CDR optimization과 다릅니다. 사용자가 target epitope를 지정하면, antibody framework는 유지하면서 CDR loop와 antibody-target rigid-body dock을 함께 만들어야 합니다.

이 점 때문에 RFAntibody는 RFdiffusion의 단순 application이 아닙니다. Base RFdiffusion은 helix나 beta sheet 중심의 일반 protein-protein interface에는 강하지만, antibody CDR loop가 만드는 좁고 유연한 interface에는 그대로 맞지 않습니다. 논문은 SAbDab antibody complex, TCR/MHC-peptide complex, loop-mediated PDB interface를 섞어 RFdiffusion을 fine-tuning합니다. Target epitope는 hotspot residue로 지정하고, antibody framework는 template conditioning으로 제공합니다.

Generation, sequence design, filtering의 역할 분리

RFAntibody pipeline에서 RFdiffusion은 backbone과 dock을 만듭니다. 더 정확히는 antibody framework를 조건으로 주고, CDR loop geometry와 target에 대한 rigid-body placement를 생성합니다. 그다음 ProteinMPNN은 framework 전체가 아니라 CDR residue sequence를 설계합니다. 여기서 ProteinMPNN은 antibody generator라기보다, RFdiffusion이 만든 geometry를 sequence로 구현하는 단계에 가깝습니다.

그다음 단계는 filtering입니다. 저자들은 당시 AlphaFold2가 antibody-antigen complex prediction에 충분히 안정적이지 않다고 보고, antibody complex filtering용 RoseTTAFold2를 fine-tuning했습니다. 이 RF2 filter는 true antibody-antigen pair와 decoy를 어느 정도 구분했지만, 실제 prospective filtering power는 제한적이었습니다.

논문 후반의 retrospective AlphaFold3 분석은 이 지점에서 의미가 생깁니다. AF3 ipTM은 VHH library에서 binding success 예측 AUC 0.86을 보였고, scFv에서는 experimentally confirmed designs 6개 중 5개가 ipTM > 0.85 threshold를 통과했습니다. 다만 이 결과는 retrospective입니다. AF3가 처음부터 pipeline에 들어간 prospective wet-lab result는 아닙니다. 따라서 AF3 ipTM은 “좋은 enrichment signal”로 읽을 수 있지만, binding이나 pose validation 자체는 아닙니다.

VHH campaign: 낮은 hit rate와 깊은 후속 검증

VHH design에서는 humanized VHH framework h-NbBcII10F-GLA가 사용되었습니다. Target은 C. difficile TcdB, influenza H1 haemagglutinin, RSV-F sites I/III, SARS-CoV-2 RBD, IL-7Rα 등입니다. Screening 방식은 두 가지였습니다. RSV, RBD, HA 같은 target에는 target당 9,000 designs 규모의 yeast surface display를 사용했고, TcdB, IL-7Rα, HA 일부에는 target당 95 designs 규모의 E. coli expression + single-concentration SPR를 사용했습니다.

논문은 VHH campaign의 initial experimental success rate를 0–2% 범위로 제시합니다. 이 숫자는 중요합니다. RFdiffusion-Antibody는 AlphaProteo처럼 높은 초기 hit rate를 앞세우는 논문이 아닙니다. Antibody/VHH modality에서는 CDR geometry, epitope approach angle, framework compatibility, expression, display/screening이 모두 병목으로 들어옵니다.

그렇다고 결과의 의미가 작다는 뜻은 아닙니다. 성공한 사례의 evidence depth가 좋습니다. Influenza HA stem을 겨냥한 VHH는 best KD 78 nM까지 갔고, 3.0 Å cryo-EM structure에서 VHH backbone RMSD 1.45 Å, CDR3 RMSD 0.8 Å로 design과 가까운 pose를 보였습니다. TcdB Frizzled-binding epitope를 겨냥한 VHH_TcdB_H2는 KD 262 nM, FZD48 competition, TcdB toxicity neutralization EC50 460 nM, TcsL non-binding, cryo-EM pose validation까지 이어졌습니다.

SARS-CoV-2 RBD 사례는 반대로 중요한 guardrail입니다. VHH_RBD_D4는 intended epitope에는 결합했지만, cryo-EM에서 binding mode가 design과 달랐고 저자들은 이를 design failure로 분류했습니다. Epitope correctness와 pose correctness가 같은 말이 아니라는 점을 잘 보여주는 사례입니다.

OrthoRep: design hit와 matured binder 사이

RFAntibody 논문에서 OrthoRep affinity maturation은 중심적인 역할을 합니다. 초기 computational design들은 대체로 affinity가 약했고, 저자들은 TcdB, influenza HA, SARS-CoV-2 RBD VHH에 대해 yeast OrthoRep continuous hypermutation을 적용했습니다. 논문은 OrthoRep가 affinity를 대략 두 자릿수 정도 개선했고, single-digit nM 또는 subnanomolar binder까지 도달할 수 있었다고 보고합니다.

이 결과는 강하지만, 읽는 층위를 분리하는 편이 안전합니다. OrthoRep 이후의 nM binder는 pure zero-shot design success가 아닙니다. 대신 designed starting point가 experimental maturation을 통해 affinity를 끌어올릴 수 있고, 적어도 TcdB에서는 intended epitope와 pose를 유지한 채 개선될 수 있음을 보여줍니다.

이 차이는 실용적으로 중요합니다. Drug discovery에서 maturation은 자연스러운 과정이지만, 논문을 비교할 때는 initial design hit, screened hit, matured binder를 같은 denominator로 섞으면 비교가 흐려집니다.

scFv와 full antibody로 넘어가기

VHH에서 scFv로 넘어가면 문제가 더 어려워집니다. VHH는 single domain이고 CDR 세 개 중심이지만, scFv는 heavy/light chain pairing과 여섯 CDR 조합을 맞춰야 합니다. 논문에서도 fixed-pairing library는 hit을 내지 못했고, structure-aware combinatorial heavy/light chain library가 필요했습니다. 성공한 combinatorial libraries의 theoretical complexity는 약 10 million 수준이었습니다.

TcdB Frizzled epitope에서는 여섯 distinct scFv가 나왔고, scFv6는 KD 72 nM, scFv5는 KD 460 nM을 보였습니다. 두 design은 full-length IgG1으로 conversion해도 비슷한 affinity를 유지했습니다. scFv6 IgG1은 KD 68 nM, scFv5 IgG1은 KD 380 nM이었습니다.

PHOX2B peptide–HLA-C*07:02 사례도 흥미롭습니다. B1.2.1은 SPR 기준 약 400 nM, ITC 기준 약 1 µM binding을 보였고, PHOX2B R6A point-mutant pMHC에는 detectable binding이 없었습니다. Peptide residue specificity는 지지됩니다. 그러나 CAR cytotoxicity assay에서는 neuroblastoma cell lines에 대해 detectable killing이 없었습니다. Biochemical specificity가 cellular function으로 바로 이어지지는 않는다는 점을 보여줍니다.

Cryo-EM pose validation의 무게

이 논문에서 가장 무게가 실린 evidence는 raw hit rate가 아니라 cryo-EM pose validation입니다. Influenza HA VHH는 3.0 Å structure에서 designed pose와 잘 맞았습니다. TcdB VHH parent와 OrthoRep-matured VHH는 각각 4.6 Å, 5.7 Å map에서 intended Frizzled epitope engagement와 pose retention을 지지했습니다. TcdB scFv6는 3.6 Å reconstruction에서 전체 scFv fold RMSD 0.9 Å, CDR backbone RMSD도 대부분 0.2–0.7 Å 범위였습니다.

이 정도의 pose validation은 antibody design 논문에서 무게가 큽니다. Binding signal만으로는 intended epitope와 designed paratope geometry가 맞았는지 알 수 없습니다. 특히 RBD 실패 사례처럼 epitope는 맞아도 pose가 틀릴 수 있습니다. RFAntibody가 milestone으로 읽히는 이유는, 낮은 initial hit rate에도 불구하고 일부 성공 사례에서 designed CDR geometry와 target pose가 실제 구조로 확인되었기 때문입니다.

다만 구조 검증은 모든 target과 modality에서 같은 깊이로 제공된 것이 아닙니다. VHH와 TcdB scFv 구조 evidence는 강하지만, full IgG conversion은 TcdB binding affinity를 보여준 정도입니다. Broad developability, specificity panel, immunogenicity, manufacturability, in vivo efficacy는 이 논문의 evidence 범위 밖에 있습니다.

Figure별로 읽기

Figure 1은 RFAntibody pipeline의 지도입니다. Target structure와 hotspot, antibody framework를 넣고, RFdiffusion이 CDR loop와 dock을 만들고, ProteinMPNN이 CDR sequence를 설계하고, RF2/AF3-style filtering과 wet-lab screening으로 넘어갑니다. 이 figure에서 여기서 볼 것은 model 하나가 아니라 pipeline 전체입니다.

Figure 2는 VHH biochemical characterization입니다. RSV-F site III, influenza HA, SARS-CoV-2 RBD, TcdB에 대해 KD와 competition assay를 보여줍니다. 여기서는 성공 사례와 약한 affinity, epitope competition evidence를 같이 읽어야 합니다.

Figure 3은 VHH cryo-EM validation입니다. HA와 TcdB에서 designed pose가 얼마나 유지되는지, OrthoRep maturation 뒤에도 pose가 보존되는지를 보여줍니다. RFAntibody의 strongest evidence layer가 여기에 있습니다.

Figure 4는 scFv biochemical characterization입니다. TcdB scFv, PHOX2B pMHC binder, full IgG1 conversion, peptide mutant specificity, CAR assay 결과가 이어집니다. Binding과 specificity가 function으로 바로 이어지지 않는다는 PHOX2B 결과를 같이 봐야 합니다.

Figure 5는 TcdB-binding scFv5/scFv6의 cryo-EM 구조입니다. 특히 scFv6는 six designed CDRs가 포함된 구조로, VHH보다 복잡한 antibody format에서도 pose-level validation이 가능함을 보여줍니다.

mBER, Germinal과의 위치 차이

RFdiffusion-Antibody는 mBER나 Germinal과 같은 open antibody/VHH design 흐름에 있지만, evidence profile이 다릅니다.

mBER는 breadth입니다. 1,153,241 VHH designs와 145 target phage/NGS all-against-all matrix가 있고, denominator와 off-design behavior를 보기 좋습니다. 대신 purified KD, function, pose validation은 없습니다.

Germinal은 low-N biophysical depth입니다. 후보 수는 작지만 BLI/SPR, expression rescue, polyreactivity, alanine mutagenesis, one cryo-EM pose check까지 갑니다.

RFdiffusion-Antibody는 antibody-specific diffusion design의 milestone에 가깝습니다. Initial hit rate는 낮고 screening/maturation burden이 크지만, epitope-specific generation과 cryo-EM pose validation을 같은 논문 안에서 강하게 연결합니다. 따라서 이 논문은 “high-throughput success rate”보다 “antibody/VHH modality에서 designed pose까지 확인한 generation-screening-maturation pipeline”으로 읽는 편이 자연스럽습니다.

평가: 낮은 hit rate에도 milestone인 이유

내가 보기엔 RFdiffusion-Antibody의 가치는 성공률이 높아서가 아닙니다. 오히려 숫자는 냉정합니다. VHH initial success rate는 0–2%이고, scFv에서는 structure-aware combinatorial assembly가 필요했으며, OrthoRep 같은 maturation이 중요한 역할을 합니다.

그런데도 이 논문은 중요한 지점입니다. Antibody/VHH design에서 epitope-specific generation, CDR sequence realization, wet-lab screening, affinity maturation, cryo-EM pose validation을 하나의 pipeline으로 연결했기 때문입니다. 특히 HA VHH, TcdB VHH, TcdB scFv의 structural validation은 “binding signal이 있었다”를 넘어 “설계한 paratope geometry가 실제 구조에서 어느 정도 구현되었다”는 층위의 evidence를 제공합니다.

안전한 결론은 이 정도입니다. RFdiffusion-Antibody는 de novo antibody design을 완성한 논문이라기보다, antibody-specific diffusion design이 실제 epitope-targeted binder와 pose validation까지 갈 수 있음을 보여준 milestone입니다. 동시에 이 논문은 antibody design에서 generation만으로는 부족하고, filtering, screening, maturation, structural validation이 모두 결과의 일부라는 점을 분명하게 보여줍니다.

참고

•

Bennett et al., “Atomically accurate de novo design of antibodies with RFdiffusion”, Nature, 2025. DOI: 10.1038/s41586-025-09721-5

•

Code: https://github.com/RosettaCommons/RFantibody