Search

JAM 논문 리뷰

JAM 논문 리뷰

들어가며

JAM-2가 low-N recombinant antibody screen을 전면에 세운 후속 performance dossier라면, 그 앞에는 Nabla Bio의 JAM이 있습니다. bioRxiv preprint “De novo design of epitope-specific antibodies against soluble and multipass membrane proteins with high specificity, developability, and function”은 JAM이 어떤 evidence ladder를 밟아 antibody design claim을 만들었는지 보여줍니다.
JAM은 closed system입니다. Model architecture, training data, scoring details는 commercial reason으로 공개하지 않습니다. 대신 target/epitope-conditioned generation, yeast display/FACS/NGS hit identification, recombinant BLI/on-cell assay, pseudovirus neutralization, developability proxy를 폭넓게 제시합니다.
따라서 JAM은 reproducible algorithm paper라기보다 company-led antibody design performance anchor라는 관점에서 이해하면 충분합니다. 중요한 질문은 “어떤 모델 구조인가”보다 “어떤 assay layer까지 실제로 갔는가”입니다.

Epitope-specific antibody design으로 잡기

JAM의 formulation은 target sequence/structure와 epitope 정보를 조건으로 넣고, masked antibody sequence/structure를 generatively fill in하는 방식입니다. Hard constraints는 반드시 보존되는 sequence 같은 조건이고, flexible constraints는 target structure처럼 generation을 guide하지만 rigid하게 고정하지 않는 조건입니다.
System-level 설명도 product-like합니다. Protein complex generative model, experimental viability와 correlate되는 scoring model, generation/scoring hyperparameter와 hard threshold set이 함께 들어갑니다. 이 구성요소들은 50회 이상 design-build-test cycles를 거치며 조정되었다고 설명됩니다.
이 점은 JAM의 장점이면서 동시에 해석할 때 주의할 지점입니다. 실험 feedback이 들어간 closed system은 practical performance를 높일 수 있습니다. 하지만 단일 공개 algorithm의 clean comparison으로 이해하기는 어렵습니다.

Binder identification과 characterization의 분리

JAM의 wet-lab workflow는 두 단계입니다. 첫 단계는 Binder Identification입니다. 10³–10⁶ designs를 yeast display library로 만들고, 필요하면 MACS를 거친 뒤 FACS 두 round와 NGS로 binding designs를 식별합니다. Report는 특정 target concentration에서 identified binders / total designs made를 bind rate로 정의합니다.
두 번째 단계는 Binder Characterization입니다. Promising candidates를 VHH-Fc 또는 full-length mAb 같은 therapeutically relevant format으로 recombinantly produce하고, soluble targets는 BLI affinity, MPMP targets는 engineered/endogenous cell line on-cell binding, 그리고 production yield, monomericity, polyspecificity, target-specific function을 평가합니다.
이 두 layer를 섞으면 hit rate가 무엇을 뜻하는지 흐려집니다. Yeast-display bind rate, purified BLI KD, cell-surface EC50, pseudovirus IC50, BVP ELISA, SEC, humanness는 서로 다른 evidence입니다.

SARS-CoV-2 RBD VHH design

첫 번째 case는 SARS-CoV-2 RBD ACE2 binding site입니다. JAM은 10,990 VHH designs를 생성하고 yeast-display Binder Identification을 수행합니다. 1000 nM 기준 65 binders, 즉 0.6% bind rate를 얻고, 100 nM 기준으로는 23 binders, 0.2% bind rate를 얻습니다.
비교용 50,000-member naive VHH library는 secondary-only background 이상 binding을 보이지 않았다고 보고됩니다. Designed library는 ovalbumin과 secondary-only control에 binding하지 않았다고 설명됩니다.
Subset을 VHH-Fc로 발현해 BLI를 측정하면 affinity는 20 nM–10 µM 범위입니다. Strongest binders는 double-digit nM KD를 보입니다. SARS-CoV-2 pseudovirus neutralization에서는 most potent design이 sub-nanomolar IC50를 보이고, tested designs의 25%가 IC50 < 10 nM였다고 보고됩니다.

Function evidence와 epitope specificity

RBD case가 중요한 이유는 binding에서 멈추지 않기 때문입니다. Pseudovirus neutralization은 target binding보다 높은 evidence layer입니다. ACE2 binding site를 겨냥한 design이 실제 viral entry proxy에서 function을 보였다는 뜻입니다.
Epitope specificity도 alanine scanning으로 평가합니다. Top two VHH designs에서 각각 three 또는 two alanine mutants가 5-fold 이상 affinity drop을 만들었고, affected residues는 ACE2 binding site에 있으며 predicted antibody backbone에서 10 Å 이내라고 보고됩니다.
다만 이 evidence도 구조적 pose validation과는 다릅니다. Alanine scanning은 epitope/contact consistency를 지지하지만, high-resolution antibody-antigen complex structure를 대체하지는 않습니다.

RBD VHH developability

RBD VHH-Fc binders에 대해서는 early developability도 봅니다. Median production yield는 one-step Protein A purification 후 100 mg/L 이상입니다. 10% designs는 concurrently expressed/purified Trastuzumab yield를 넘었다고 설명됩니다.
SEC에서는 모든 designs가 85% 이상 monomeric이고, 대부분은 95% 이상 monomeric입니다. BVP ELISA에서는 75% designs가 Trastuzumab보다 낮은 polyreactivity를 보이며, 모든 designs가 Ustekinumab보다 낮은 polyreactivity를 보였다고 합니다.
Humanness는 nearest human V-gene germline percent identity 기준으로 chimeric/humanized clinical antibodies와 비슷한 범위라고 보고됩니다. 다만 humanness는 immunogenicity가 아닙니다. SEC/BVP/yield도 early in vitro developability proxy입니다.

Test-time compute와 introspection

JAM은 자기 output을 다시 input으로 넣는 iterative introspection을 test-time compute scaling 전략으로 제시합니다. RBD ACE2 site VHH design에서 1, 2, 3 rounds를 비교하고, 각각 10,296 / 23,796 / 19,371 designs를 생성합니다.
Three rounds는 single round 대비 100 nM binders를 8-fold 증가시켰고, 1 nM yeast-display binding은 round 2/3 designs에서만 관찰됩니다. Structural diversity도 round별로 3 / 7 / 14 clusters로 증가했다고 보고합니다.
이 결과는 test-time scaling이 antibody design에서도 의미가 있을 수 있음을 보여줍니다. 하지만 이 section에서는 recombinant affinity를 측정하지 않았습니다. “KD improvement expected”는 yeast-display data 기반 추정에 가깝습니다.

Paired antibody와 full-length mAb

JAM은 VHH에만 머물지 않습니다. SARS-CoV-2 RBD ACE2 site에 대해 VH 3,000 designs와 VL 3,000 designs를 생성하고, combinatorial cloning으로 9 million scFv library를 만듭니다.
Single MACS round와 binder identification으로 155 unique binding scFvs를 얻습니다. 단순 계산 bind rate는 약 0.0017%지만, report는 random VH/VL pairing 때문에 lower bound라고 설명합니다.
22 representative binders를 full-length IgG로 recombinantly characterized했을 때 BLI affinity는 30–1,030 nM 범위입니다. Best designs는 double-digit nM KD를 보이고, pseudovirus neutralization에서는 sub-nanomolar IC50를 보입니다. mAbs는 Trastuzumab-comparable expression titer, monomericity, polyspecificity를 보였다고 설명됩니다.

Target X와 soluble-target panel

Target X는 PDB에 구조가 없는 undisclosed globular protein입니다. JAM은 5,649 VHH designs에서 30 binders, 약 0.5% bind rate를 얻습니다. Off-target RBD/ovalbumin/secondary controls binding은 없었다고 보고됩니다.
Characterized binders는 KD 12 nM–1.9 µM 범위이고, top two는 12 nM과 24 nM KD를 보입니다. Alanine scanning에서는 top designs의 affected residues가 predicted VHH backbone 근처에 모여 epitope consistency를 지지합니다.
추가 soluble targets인 HER2, IL-13, PD-1, TrkA, RBD control도 pooled design library로 평가합니다. Designs per target은 대략 10,000개 수준이고, 1000 nM screen에서 HER2 19, IL-13 13, RBD 9, PD-1 5, TrkA 3 binders가 확인됩니다. Hit rate는 0.03–0.19% 범위입니다.

Empirical neighborhood exploration

JAM에는 empirical neighborhood exploration도 포함됩니다. JAM-generated designs 주변 sequence neighborhood를 epPCR로 확장해 affinity를 개선하는 실험입니다.
RBD에서는 6,000 VHH designs를 980 million variants로 확장하고, sorting 후 64 clones를 picked합니다. 45 unique variants가 three original JAM designs에서 유래했고, top variants는 single-digit nM KD와 parent 대비 10-fold 이상 affinity improvement를 보입니다. Pseudovirus neutralization도 parent 대비 크게 개선된 variants가 나옵니다.
Target X에서도 6,000 JAM VHH designs를 400 million-member library로 확장하고, best family에서 sub-nanomolar KD variant를 얻습니다. 이 section은 중요하지만, direct zero-optimization de novo design result와는 분리해서 읽어야 합니다. epPCR/wet-lab sequence search가 붙은 결과이기 때문입니다.

Multipass membrane protein: CLDN4와 CXCR7

JAM이 특히 눈에 띄는 지점은 multipass membrane protein target입니다. CLDN4 extracellular loops에 10,000 designs, CXCR7 extracellular pore에 20,000 designs를 생성합니다.
Screening을 위해 JAM은 soluble proxy MPMP, 즉 solMPMP를 설계합니다. Native MPMP의 transmembrane region을 soluble scaffold로 대체하면서 critical extracellular structures를 보존하려는 reagent입니다. solCLDN4는 known anti-CLDN4 antibody binding을 보이고, solCXCR7은 native ligand SDF1α와 KD 8.1 nM binding을 보였다고 설명됩니다.
CLDN4 campaign에서는 solCLDN4 yeast-display screen으로 three binders를 얻고, native CLDN4 overexpression cell line에서 EC50 10, 22, 56 nM를 보입니다. Best binder는 OVCAR3 ovarian cancer cells에서도 EC50 51 nM recognition을 보입니다. Related family members CLDN3, CLDN6, CLDN9 대비 100-fold 이상 selectivity도 보고됩니다.

CXCR7의 성과와 developability caveat

CXCR7 campaign에서는 strong binder 하나가 native CXCR7을 인식합니다. PathHunter CXCR7 cells에서 monovalent VHH / E. coli cell-free expression format EC50 36 nM, VHH-Fc / ExpiCHO format EC50 21.8 nM를 보이고, Tango U2OS CXCR7 orthogonal system에서도 dose-responsive binding이 확인됩니다.
이 결과는 MPMP antibody design evidence로 의미가 있습니다. 하지만 동시에 caveat도 큽니다. CXCR7 VHH는 DLS/SEC에서 aggregation tendency를 보였고, report는 GPCR pore에 들어가는 HCDR3 hydrophobicity 때문일 수 있다고 추정합니다.
따라서 CXCR7은 성공 사례이면서 trade-off 사례입니다. Target engagement는 보이지만 developability가 같이 따라오지 않을 수 있습니다. 이 지점이 JAM을 단순한 성공담이 아니라 실제 antibody discovery에 가까운 자료로 만들어줍니다.

Novelty와 structural pose의 범위

JAM-generated experimentally validated VHH binders는 NR, OAS Unpaired, INDI database against BLASTp에서 nearest matches와 20% 이상 sequence dissimilarity를 보였다고 보고합니다.
Structural novelty는 SAbDab antibody-antigen complexes와 target-aligned antibody Cα RMSD로 비교합니다. RBD binders는 2.5–5 Å로 existing antibody-RBD complexes와 유사한 binding modes를 보였지만, Target X는 15–25 Å, Claudin-4는 약 27 Å, CXCR7은 9 Å로 더 큰 structural novelty를 보입니다.
이 결과는 nearest-neighbor retrieval이 아니라는 claim을 지지합니다. 다만 structural novelty 분석은 generated complex model을 기준으로 합니다. High RMSD는 기존 구조와 다른 pose라는 evidence지만, 그 pose가 실험적으로 고해상도 검증됐다는 뜻은 아닙니다.

JAM-2와의 위치

JAM과 JAM-2는 같은 Nabla Bio lineage지만, evidence framing이 다릅니다. JAM은 broader first validation anchor입니다. RBD VHH/mAb, Target X, soluble target panel, empirical neighborhood exploration, CLDN4/CXCR7 MPMP workflow, pseudovirus neutralization까지 넓게 갑니다.
JAM-2는 후속으로 더 standardized된 low-N recombinant screen을 강조합니다. 45 designs/format, 16 unseen targets, systematic 20 epitope/target breadth, direct native on-cell CXCR4/CXCR7 screen, large developability panel이 중심입니다.
그래서 JAM은 “JAM system이 어디까지 갈 수 있는가”를 처음 넓게 보여주는 자료이고, JAM-2는 “closed antibody engine이 더 낮은 실험 budget에서 얼마나 재현성 있게 hit를 내는가”를 보여주는 자료로 나눠 읽는 편이 좋습니다.

평가: broad validation anchor

JAM의 가치는 antibody design evidence ladder를 넓게 밟았다는 데 있습니다. Yeast-display hit identification에서 recombinant KD, pseudovirus neutralization, epitope alanine scanning, developability proxy, MPMP on-cell binding/selectivity까지 이어집니다.
동시에 method-level transparency는 낮습니다. Closed architecture와 scoring, 50회 이상 DBT cycle tuning, assay-specific denominator 때문에 RFdiffusion-Antibody 같은 공개 method와 같은 축에서 비교하기 어렵습니다. JAM은 algorithm paper라기보다 closed/company-led validation package에 가깝습니다.
결론적으로 JAM은 de novo epitope-specific antibody design이 soluble target을 넘어 MPMP target까지 갈 수 있음을 보여주는 중요한 performance anchor입니다. Headline bind rate는 assay layer, optimization layer, developability caveat, method disclosure 범위와 함께 읽을 때 가장 설득력 있게 자리 잡습니다.

참고

- Nabla Bio, “De novo design of epitope-specific antibodies against soluble and multipass membrane proteins with high specificity, developability, and function”, bioRxiv, 2025. https://doi.org/10.1101/2025.01.21.633066