IgDesign 논문 리뷰
들어가며
ProteinMPNN 이후 inverse folding은 단백질 설계에서 익숙한 단계가 되었습니다. Backbone이나 complex structure가 주어졌을 때 그 구조를 지지할 sequence를 찾는 문제입니다. 일반 protein binder pipeline에서는 backbone generation과 sequence design을 나눠 생각할 수 있고, ProteinMPNN은 이 sequence-realization 단계의 기본 도구처럼 쓰입니다.
Antibody에서는 이야기가 조금 달라집니다. CDR loop는 framework와 heavy/light chain context 안에서 작동하고, antigen과 만나는 paratope geometry도 이미 antibody-specific한 제약을 받습니다. HCDR3만 바꾸는 것과 HCDR1/2/3를 함께 바꾸는 것은 난이도가 다르고, 같은 SPR binder라도 reference antibody complex를 알고 redesign한 결과인지 target만 보고 새로운 epitope binder를 만든 결과인지에 따라 해석이 달라집니다.
Absci의 bioRxiv preprint “IgDesign: In vitro validated antibody design against multiple therapeutic antigens using inverse folding”은 이 경계선을 보기 좋은 논문입니다. IgDesign는 native antibody-antigen complex backbone과 antigen/framework sequence context를 입력으로 받아 HCDR3 또는 HCDR123 sequence를 설계합니다. 그리고 8개 therapeutic antigen에서 총 1,437개 Fab variants를 SPR로 검증해 278 binders를 보고합니다.
숫자는 강합니다. 다만 어떤 denominator의 숫자인지 먼저 잡아야 합니다. Aggregated Table 3 기준으로 HCDR3 design은 165/495 binders, HCDR123 design은 110/489 binders를 만들었고, SAbDab HCDR3 baseline은 3/453 binders에 그쳤습니다. 다만 이 결과는 de novo antibody discovery가 아닙니다. 이미 있는 antibody-antigen complex backbone과 reference framework 위에서 CDR sequence를 다시 쓰는 antibody inverse-folding / CDR redesign 결과로 읽어야 합니다.
Native complex가 주어진 CDR redesign
IgDesign의 task setting은 명확합니다. Target antigen과 reference antibody complex structure가 주어져 있습니다. 모델은 이 구조적 맥락 안에서 heavy-chain CDR sequence를 새로 설계합니다. HCDR3 task는 HCDR3만 바꾸고, HCDR123 task는 HCDR1, HCDR2, HCDR3를 함께 바꿉니다. Wet-lab format은 Fab입니다.
이 설정은 RFdiffusion-Antibody나 Origin-1처럼 antibody-antigen pose를 생성하는 문제와 다릅니다. IgDesign은 epitope를 새로 찾거나 antibody-target docking pose를 새로 만드는 모델이 아닙니다. Native complex backbone이 주어진 상태에서, 그 geometry를 유지할 수 있는 CDR sequence를 찾는 inverse-folding 문제입니다.
그렇다고 쉬운 문제는 아닙니다. Antibody CDR sequence는 framework, antigen surface, heavy/light chain orientation, CDR loop compatibility를 함께 만족하는 편이 안전합니다. HCDR123는 HCDR3보다 훨씬 어렵습니다. 실제 결과에서도 HCDR123 binding rate는 HCDR3-only보다 대체로 낮습니다.
IgMPNN과 ESM2 prior의 결합
IgDesign은 두 층으로 구성됩니다. 첫 번째는 IgMPNN입니다. IgMPNN은 ProteinMPNN-style antibody inverse-folding model로, antibody-antigen complex backbone coordinates를 입력으로 받고 antigen residues와 antibody framework residues의 sequence embeddings를 context로 사용합니다. 설계할 CDR residues의 embeddings는 zero로 두고, 모델이 CDR sequence를 autoregressive하게 decode합니다.
두 번째는 LM-Design framing입니다. IgMPNN forward pass에서 얻은 node embeddings와 logits에 ESM2-3B language-model prior를 결합합니다. Maximum-likelihood sequence를 ESM2에 넣어 embeddings를 얻고, Bottleneck Adapter가 ESM2 embeddings와 IgMPNN structural node embeddings 사이에서 cross-attention을 수행합니다. 마지막에는 ESM2 projection logits와 IgMPNN logits를 더해 CDR sequence distribution을 만듭니다.
즉 IgDesign은 antibody-antigen structure context와 protein language model prior를 결합한 CDR sequence designer입니다. 여기서 ESM2는 “antibody를 이해하는 LLM”이라기보다, sequence plausibility prior를 structure-conditioned inverse folding에 더하는 역할에 가깝습니다.
Experimental design과 denominator
IgDesign은 8개 therapeutic antigen/reference antibody complex를 사용합니다. CD40/Ravagalimab, IL36R/Spesolimab, C5/Eculizumab, TSLP/Tezepelumab, IL17A/Afasevikumab, FXI/Osocimab, ACVR2B/Bimagrumab, TNFRSF9/Utomilumab입니다.
각 antigen에 대해 IgDesign은 1 million sequences를 생성하고, cross-entropy loss가 낮은 100 HCDR3 designs와 100 HCDR123 designs를 wet-lab으로 보냅니다. Baseline은 SAbDab training set의 HCDR3 100개를 reference antibody의 native HCDR1/HCDR2와 조합한 것입니다. 이 baseline은 모델 input feature를 쓰지 않기 때문에, IgDesign이 단순히 natural HCDR3 distribution을 뽑는 것보다 target/framework/complex context를 더 잘 쓰는지 보는 비교군입니다.
Wet-lab은 high-throughput SPR입니다. Oligo-pool libraries를 E. coli plasmid에 cloning하고, individual colonies를 expression한 뒤 Carterra LSA로 antigen binding을 측정합니다. Variant는 sequencing으로 확인되고, all SPR replicates에서 binding이 보이면 binder로 label됩니다.
이 denominator가 중요합니다. 1 million generated sequences가 곧 experimental denominator는 아닙니다. Wet-lab으로 넘어간 것은 target당 대략 100 HCDR3와 100 HCDR123 designs입니다. 따라서 binding rate는 raw generation hit rate가 아니라, loss-based selection 후 SPR-tested Fab variant 기준입니다.
Table 3: SPR binding rate
Main result는 Table 3입니다. IgDesign HCDR3는 8개 antigen 모두에서 SAbDab HCDR3 baseline보다 높은 binding rate를 보였고, 7/8에서는 multiple-test correction 후 유의했습니다. HCDR123는 7/8에서 baseline보다 높았고, 4/8에서 유의했습니다.
Target별 차이는 큽니다. TSLP에서는 HCDR3 96.3% (52/54), HCDR123 92.5% (62/67)라는 매우 높은 binding rate가 나옵니다. FXI도 HCDR3 61.5% (24/39)로 높습니다. 반면 IL17A는 HCDR3 7.9% (5/63), HCDR123 0.0% (0/65)입니다. 같은 model과 workflow라도 antigen/reference complex에 따라 난이도가 크게 달라집니다.
Aggregated result는 HCDR3 165/495 binders (33.3%), HCDR123 110/489 binders (22.5%), SAbDab baseline 3/453 binders (0.66%)입니다. 전체 screened groups를 합치면 1,437 antibodies screened, 278 binders identified입니다.
이 숫자는 antibody inverse folding 논문으로서는 강한 evidence입니다. In silico AAR나 likelihood metric에서 끝나지 않고, 실제 SPR binding으로 넘어갔기 때문입니다. 다만 baseline과 task를 분리해서 읽어야 합니다. HCDR123는 HCDR3-only보다 어려운 task이고, baseline은 HCDR3-only baseline입니다. 따라서 HCDR123 결과는 “all-heavy-chain CDR redesign도 일정 수준 binder를 만든다”는 evidence로 읽는 편이 자연스럽습니다.
Affinity: reference antibody와의 거리
IgDesign는 단순 binder count만 보고하지 않습니다. Designed binders의 affinity도 reference antibody와 비교합니다. 8개 antigen 중 5개 — CD40, IL36R, FXI, ACVR2B, TNFRSF9 — 에서는 IgDesign binders 중 reference antibody와 equal or higher affinity를 보인 사례가 있습니다. 여러 design이 reference affinity의 one order of magnitude 안에 들어옵니다.
반대로 C5, TSLP, IL17A에서는 binders가 reference antibody보다 적어도 두 자릿수 이상 약했습니다. 특히 TSLP는 binding rate가 매우 높지만 affinity는 reference antibody 수준까지 가지 않습니다. 이 차이는 binding rate와 affinity quality가 같은 숫자가 아니라는 점을 보여줍니다.
따라서 IgDesign의 affinity result는 lead optimization signal로 읽는 편이 안전합니다. Native/reference context를 알고 있을 때 CDR sequence를 바꿔 binding Fab를 만들 수 있고, 일부 target에서는 reference-level affinity에 접근합니다. 하지만 이것이 곧 new therapeutic antibody discovery나 functional equivalence를 뜻하지는 않습니다.
scRMSD filtering의 한계
IgDesign 논문에서 흥미로운 부록은 scRMSD 분석입니다. 저자들은 generated SPR dataset을 사용해 ABodyBuilder2, ABodyBuilder3, ABodyBuilder3-LM, ESMFold의 self-consistency RMSD가 binding이나 affinity를 예측할 수 있는지 봅니다. Designed antibody sequence로 Fv structure를 예측한 뒤 reference antibody structure와 align하고, CDR/Fv Cα RMSD를 계산하는 방식입니다.
결과는 조심스럽습니다. Binders가 non-binders보다 낮은 scRMSD를 보이는 경우는 있지만, inverse-folding designs 안에서는 distribution이 좁아지고 metric의 discriminative power가 약해집니다. Affinity와 scRMSD correlation도 target, model, region에 따라 방향이 바뀝니다. Mean Ensemble Fv scRMSD만 비교적 consistent positive correlation을 보였지만, median correlation은 0.13, mean은 0.23 수준입니다.
이 결과는 negative control로 가치가 있습니다. Structure self-consistency는 plausibility filter가 될 수 있지만, antibody binding/affinity ground truth는 아닙니다. IgDesign의 released SPR dataset은 오히려 더 나은 antibody filtering metric을 만들 benchmark로 의미가 있습니다.
Figure별로 읽기
Figure 1은 IgDesign workflow를 보여줍니다. Native antibody-antigen complex, IgMPNN, ESM2 prior, candidate selection, SPR validation으로 이어집니다. 이 figure에서 먼저 잡을 것은 task setting입니다. IgDesign은 structure-conditioned CDR sequence redesign입니다.
Figure 2는 8개 antigen의 binding rate 비교입니다. HCDR3, HCDR123, SAbDab baseline이 나란히 놓입니다. 여기서 가장 눈에 띄는 것은 baseline 대비 큰 차이와 target별 heterogeneity입니다.
Figure 3–6은 in silico AAR 비교입니다. IgMPNN/IgDesign이 ProteinMPNN 계열보다 높다는 결과를 보여줍니다. 하지만 이 논문에서 AAR는 중심 evidence라기보다, SPR 결과로 넘어가기 전의 model-quality check에 가깝습니다.
Figure 7–14는 antigen별 binding affinity입니다. Binding rate가 높은 target에서도 reference antibody와 affinity gap이 남을 수 있고, 일부 target에서는 reference-level 또는 그 이상의 binder가 나옵니다.
Tables 5–28은 scRMSD와 affinity correlation 분석입니다. 이 부록은 “구조 self-consistency가 binding filter로 충분한가”라는 질문에 조심스럽게 답합니다. 답은 대체로 “단독으로는 부족하다”에 가깝습니다.
RFdiffusion-Antibody, Germinal, mBER와의 위치
IgDesign은 RFdiffusion-Antibody, Germinal, mBER와 같은 antibody/VHH design landscape 안에 있지만, task가 다릅니다.
RFdiffusion-Antibody는 epitope-specific antibody/VHH pose와 CDR geometry를 생성하려는 diffusion pipeline입니다. 초기 hit rate는 낮지만 cryo-EM pose validation이 강합니다. Germinal은 AF-M/IgLM 기반 low-N antibody design으로 purified BLI/SPR와 일부 pose/epitope evidence를 제공합니다. mBER는 million-scale VHH design과 phage/NGS enrichment matrix로 breadth와 denominator를 제공합니다.
IgDesign은 이들과 달리 native-complex CDR redesign anchor입니다. 이미 주어진 antibody-antigen complex geometry 안에서 CDR sequence를 다시 쓰고, 그 결과를 대규모 SPR로 검증합니다. 그래서 de novo epitope discovery보다는 antibody inverse folding, CDR redesign, lead optimization 쪽에 놓는 편이 안전합니다.
이 위치가 약하다는 뜻은 아닙니다. 오히려 IgDesign의 장점은 task 경계가 분명하고, wet-lab denominator가 크다는 데 있습니다. 1,437 Fab variants, 278 SPR binders, 8개 therapeutic antigens라는 숫자는 antibody CDR sequence design evidence로는 상당히 무겁습니다.
평가: inverse folding이 wet-lab으로 넘어간 사례
내가 보기엔 IgDesign의 가치는 “antibody inverse folding이 실제 binding Fab를 만들 수 있는가”라는 질문에 wet-lab으로 답했다는 데 있습니다. HCDR3 165/495, HCDR123 110/489, baseline 3/453이라는 contrast는 단순 AAR benchmark보다 훨씬 설득력이 있습니다.
동시에 이 논문은 경계가 분명합니다. Native antibody-antigen complex backbone과 reference framework가 주어져 있고, 설계는 heavy-chain CDR sequence redesign에 집중합니다. Full IgG developability, broad specificity, epitope binning, functional activity, high-resolution pose validation은 이 논문의 evidence 범위 밖에 있습니다.
안전한 결론은 이 정도입니다. IgDesign은 de novo antibody discovery 논문이 아니라, native-complex antibody inverse folding / CDR redesign이 SPR binder를 대규모로 만들 수 있음을 보여준 논문입니다. 이 차이를 지키면, IgDesign은 RFdiffusion-Antibody나 mBER와 경쟁하는 paper라기보다 antibody design pipeline에서 sequence-redesign layer를 채우는 anchor로 읽힙니다.
참고
•
Shanehsazzadeh et al., “IgDesign: In vitro validated antibody design against multiple therapeutic antigens using inverse folding”, bioRxiv preprint, 2024. https://doi.org/10.1101/2023.12.08.570889
•
Code and SPR datasets: https://github.com/AbSciBio/igdesign