Search

Germinal 논문 리뷰

Germinal 논문 리뷰

들어가며

AI binder design 논문을 읽을 때는 hit rate가 먼저 보입니다. 몇 개를 만들었고, 그중 몇 개가 붙었는가. Antibody/VHH design에서는 이 숫자만으로는 부족합니다. 어떤 framework 위에서 CDR를 설계했는지, epitope를 얼마나 좁혀 잡았는지, 후보가 실제로 발현되고 정제되는지, binding이 intended epitope에 의존하는지, polyreactivity나 구조 검증은 어디까지 봤는지가 같이 따라옵니다.
Germinal은 이 지점에서 읽기 좋은 bioRxiv preprint입니다. Stanford University와 Arc Institute 연구진이 발표한 “Efficient generation of epitope-targeted de novo antibodies with Germinal”은 AlphaFold-Multimer backpropagation과 antibody language model prior를 결합해, 지정한 antibody framework와 target epitope 위에서 CDR sequence를 설계합니다. 논문은 PD-L1, IL3, IL20, BHRF1 네 target에서 nanobody/scFv/Fab 후보를 만들고, 수십 개 수준의 low-N experimental handoff로 BLI/SPR binders를 얻었다고 보고합니다.
이 글에서는 Germinal을 “open antibody design이 어디까지 왔는가”라는 관점에서 보겠습니다. mBER가 million-scale phage/NGS matrix로 open VHH design의 breadth를 보여줬다면, Germinal은 반대쪽입니다. 후보 수는 상대적으로 작지만, purified BLI/SPR affinity, polyreactivity assay, alanine mutagenesis, one cryo-EM pose validation까지 보여줍니다. 그래서 Germinal은 scale의 논문이라기보다 validation depth의 논문에 가깝습니다.

Antibody framework와 CDR design

Germinal이 다루는 문제는 general miniprotein binder design이 아닙니다. Antibody는 conserved framework와 hypervariable CDR loop라는 문법을 가집니다. Target에 붙는 interface를 아무 위치에나 만들 수 없고, paratope는 대체로 CDR loop 안에 형성되어야 합니다. Framework-target contact가 과도해지면 antibody-like design이라는 목표에서 벗어날 수 있습니다.
이 때문에 Germinal의 input은 target structure, target epitope residue, antibody framework sequence/structure, 설계할 CDR position과 length를 포함합니다. 저자들은 안정성과 developability가 알려진 framework를 고르고, 그 위에서 CDR sequence를 새로 최적화합니다. 목표는 “약한 starting binder를 주고 affinity maturation을 하는 것”이 아니라, 지정한 framework와 epitope만으로 CDR를 새로 만들어보는 쪽입니다.
이 설정은 Origin-1과도 다릅니다. Origin-1은 full-length mAb, zero-prior epitope, lead optimization을 함께 밀고 갔습니다. Germinal은 주로 nanobody와 scFv/Fab format에서, open-source research pipeline으로 de novo CDR design이 low-N experimental validation까지 갈 수 있는지를 보여줍니다.

AF-M gradient와 IgLM prior

Germinal의 method는 prediction-network inversion 계열에 가깝습니다. AlphaFold-Multimer를 통해 target-antibody complex confidence가 높아지는 방향으로 sequence logits를 최적화하고, 동시에 IgLM gradient로 sequence가 antibody-like distribution에서 벗어나지 않도록 잡습니다. Logits optimization은 softmax, temperature annealing, semi-greedy 단계로 진행됩니다.
여기에 antibody-specific loss가 붙습니다. Paratope loss는 CDR-hotspot contact를 장려하고 framework-target contact를 억제합니다. Alpha-helix loss와 beta-strand loss는 CDR interface가 antibody loop답지 않은 secondary structure로 흘러가는 것을 줄이기 위한 장치입니다. 단순히 AF-M confidence를 올리는 것만으로는 antibody-like CDR geometry가 보장되지 않기 때문입니다.
초기 design 이후에는 AbMPNN으로 non-interface CDR residues를 다시 설계합니다. 논문은 design structure당 40 variants를 만들고 top 4를 고르는 방식으로 후보 pool을 확장합니다. 마지막 filtering에는 design에 직접 쓰지 않은 AF3와 PyRosetta-derived metrics가 들어갑니다. 예를 들어 nanobody 기준으로 IgLM log-likelihood, AF3 pAE/pTM/ipTM, interface shape complementarity, hydrogen bond, CDR interface percentage, interface dG 같은 기준이 사용됩니다.
이 구성에서 Germinal은 generator-only 방법이 아닙니다. AF-M/IgLM optimization, AbMPNN redesign, AF3/PyRosetta filtering, split-luciferase 또는 SPR triage, BLI confirmation이 이어지는 pipeline입니다. 결과도 model one-shot hit rate가 아니라 post-filter experimental handoff로 읽는 편이 안전합니다.

Filtering cascade와 wet-lab denominator

Germinal에서 눈에 띄는 숫자는 “target당 tens of candidates”입니다. 다만 이 숫자가 나오기 전에는 computational search와 filtering이 있습니다. 논문은 typical sampling에 200–500 H100-GPU hours가 필요하고, 200–400 designs passing pipeline filters를 얻는다고 설명합니다. 즉 wet-lab denominator는 raw optimization trajectory 전체가 아니라, AF-M/IgLM optimization과 AF3/PyRosetta filtering을 지나 ordered/tested 상태가 된 designs입니다.
Nanobody campaign에서는 PD-L1 101개, IL3 46개, IL20 43개, BHRF1 52개를 실험으로 넘깁니다. 먼저 NanoBiT split-luciferase assay로 expression-normalized binding potential을 보고, 통과 후보를 BLI로 확인합니다. BLI 단계에서는 PD-L1 7/25, IL3 2/11, IL20 4/11, BHRF1 5/20에서 detectable binding이 나옵니다.
이 숫자를 그대로 hit rate로 쓰면 denominator가 바뀝니다. BLI 7/25는 raw design hit rate가 아니라, split-luciferase triage 후 BLI로 넘어간 후보에 대한 비율입니다. Initial ordered designs 기준으로 보면 PD-L1 7/101, IL3 2/46, IL20 4/43, BHRF1 5/52에 가깝습니다. 저자들의 Supplementary Discussion은 Germinal nanobody success rate를 4–12% 범위로 해석합니다.
ScFv/Fab에서는 PD-L1 48개와 IL3 48개를 Fab format으로 screening합니다. Preliminary SPR에서 PD-L1 4개와 IL3 1개 potential binder가 나오고, 이후 BLI에서 PD-L1 3/4와 IL3 1/1이 measurable binding을 보입니다. 여기서도 SPR triage와 BLI confirmation denominator를 분리하는 편이 안전합니다.

Low-N biophysical validation의 깊이

Germinal의 장점은 phage/NGS enrichment에 머물지 않고 purified affinity layer까지 간다는 점입니다. 대표 nanobody KD는 PD-L1 E11 170 nM, IL3 D2Ser 280 nM, IL20 H5 190 nM, BHRF1 A5 1.2 μM입니다. BHRF1 C4는 Legobody framework로 rescue한 C4Lego에서 42 nM까지 개선됩니다.
이 결과는 open antibody design 안에서 mBER와 대비됩니다. mBER는 1,153,241 VHH designs와 145 experimentally screened targets라는 scale이 강하지만, readout은 phage/NGS enrichment입니다. Germinal은 target 수와 후보 수가 작지만, BLI/SPR KD, expression rescue, polyreactivity assay, alanine mutagenesis, representative cryo-EM을 제공합니다. 둘은 같은 open antibody design 축에 있지만, evidence의 방향이 다릅니다.
다만 low-N success가 no-screening을 뜻하지는 않습니다. Germinal도 split-luciferase, SPR, BLI, expression rescue, filtering을 거칩니다. 이 논문의 contribution은 “screening 없이 항체를 만든다”가 아니라, antibody-specific design/filtering을 잘 묶으면 experimental burden을 tens-scale로 낮출 수 있다는 쪽에 가깝습니다.

Expression rescue와 polyreactivity

Germinal은 initial design을 final lead처럼 다루지 않습니다. 몇몇 후보에서는 expression이나 monomericity 문제를 sequence/framework engineering으로 보완합니다. IL3 scFv F4는 parent/sister AbMPNN variants에서 expression과 affinity가 개선됩니다. BHRF1 C4는 Legobody framework로 옮긴 C4Lego에서 expression이 좋아지고 42 nM binding을 보입니다. IL3 D2는 solvent-exposed CDR3 cysteine을 serine으로 바꾼 D2Ser에서 monomeric expression과 BLI curve가 개선됩니다.
이 대목은 antibody design에서 실무적으로 중요합니다. Computational design이 epitope와 paratope를 그럴듯하게 맞춰도, 실제 molecule은 발현되고 정제되고 단량체로 존재하는 편이 안전합니다. Framework choice와 CDR sequence는 binding뿐 아니라 expression, stability, polyreactivity에도 영향을 줍니다.
저자들은 flow cytometry-based polyspecificity particle assay로 non-specific binding도 봅니다. 대부분의 Germinal designs는 positive control 대비 4% 미만 signal로 negative controls와 비슷한 profile을 보입니다. 하지만 D2Ser는 original D2보다 polyreactivity가 올라갑니다. Binding rescue와 developability profile이 같은 방향으로 움직이지 않을 수 있다는 점을 보여주는 사례입니다.

Epitope evidence와 pose validation

Germinal에서 중요한 validation layer 중 하나는 epitope dependence입니다. 저자들은 predicted hotspot alanine substitutions를 target/binder format 전반에서 테스트합니다. PD-L1은 I37/Y39/E41, IL3는 L26/T103/F104, IL20은 R59/R63/R99, BHRF1은 V85/I89/R92를 중심으로 봅니다. 하나 이상의 hotspot mutation이 wild-type 대비 binding affinity를 최소 2배 낮췄고, 26 designs 중 17개에서는 적어도 한 alanine substitution이 detectable binding을 완전히 없앴다고 보고합니다.
이 evidence는 “target에 붙는다”보다 한 단계 더 들어갑니다. Germinal이 설계한 binder가 intended hotspot에 의존한다는 해석을 지지하기 때문입니다. Binding hit이 있어도 intended epitope와 다른 surface에 붙을 수 있고, computational pose와 실제 pose가 다를 수 있습니다.
구조 검증은 anti-PD-L1 scFv H5:PD-L1 complex 하나에 대해 cryo-EM으로 제시됩니다. Resolution은 3.9 Å이고, predicted model과 experimental structure의 global Cα RMSD는 1.25 Å입니다. CDR loop density와 hotspot contacts도 설계와 잘 맞는 것으로 보고됩니다.
이 결과는 Germinal의 pose claim을 뒷받침하지만, 모든 binder에 대한 high-resolution structure는 아닙니다. 따라서 안전한 해석은 “대표 PD-L1 scFv case에서 pose validation을 제시했고, 다른 target/format에서는 alanine mutagenesis로 epitope dependence를 보강했다” 정도입니다.

Epitope 선택과 score threshold

Germinal은 epitope-targeted design을 보여주지만, arbitrary epitope success를 보여주는 것은 아닙니다. Supplementary epitope screen에서는 같은 target 안에서도 epitope에 따라 accepted designs 수가 크게 달라집니다. IL3 natural receptor site HT1에서는 1,469 attempts에서 26 accepted designs가 나오지만, 다른 patches에서는 0개 또는 6개 수준입니다. IL20 natural receptor site HT2는 2,686 attempts에서 accepted designs가 0개였고, uncharacterized HT1에서는 accepted designs가 나옵니다.
이 부분은 Germinal을 읽을 때 놓치기 쉽습니다. Target이 같아도 antibody-compatible epitope인지, CDR loop가 접근하기 좋은 geometry인지, framework가 무리 없이 pose를 만들 수 있는지가 outcome을 바꿉니다. Epitope targeting은 입력으로 residue를 지정하는 문제가 아니라, antibody/VHH geometry와 assay feasibility까지 얽힌 문제입니다.
Prediction-score threshold도 binding truth는 아닙니다. Table S9는 ipTM/min_ipSAE-like confidence가 validated binders를 enrich할 수 있음을 보여주지만, 많은 non-binders도 threshold를 통과합니다. AF3/PyRosetta/IgLM score는 useful filter지만, purified binding이나 epitope correctness를 대체하지는 않습니다.

Open method로서의 위치

Germinal은 open-source pipeline code를 보고한다는 점에서 Chai-2, JAM-2, Protenix-v2, Latent-X2 같은 closed 또는 partly closed company-led antibody systems와 성격이 다릅니다. 논문은 GitHub repository를 제공하고, VHH/scFv examples와 Hydra config 중심의 research pipeline을 제시합니다.
다만 practical openness는 plug-and-play와 다릅니다. Germinal은 AF-M/ColabDesign, PyRosetta, AF3/Chai/Protenix backend, IgLM 또는 AbLang, AbMPNN 등 무거운 dependency를 가집니다. 논문도 IgLM과 AF3 licensing이 full openness를 제한할 수 있고, AbLang/Protenix 같은 substitute가 필요할 수 있다고 적습니다.
그래서 Germinal은 “바로 써볼 수 있는 가벼운 antibody design app”이라기보다, open-source configurable antibody-generation research pipeline에 가깝습니다. Reproducibility surface를 따로 보면 mBER는 runnable VHH CLI 쪽에 가깝고, Germinal은 더 많은 knob를 제공하지만 dependency와 compute burden이 큽니다.

평가: open antibody design의 depth anchor

내가 보기엔 Germinal의 의미는 headline hit rate보다 evidence stack에 있습니다. AF-M backpropagation, antibody language prior, CDR/paratope-specific losses, AbMPNN redesign, AF3/PyRosetta filtering을 묶어 antibody framework 안에서 작동하는 design loop를 만들고, 이를 low-N purified validation까지 연결했습니다.
이 논문은 mBER와 같이 읽을 때 위치가 더 분명해집니다. mBER는 breadth입니다. 백만 개가 넘는 VHH designs와 phage/NGS matrix로 어떤 target/epitope에서 binding enrichment가 생기는지 보여줍니다. Germinal은 depth입니다. 수십 개 후보에서 BLI/SPR KD, polyreactivity, alanine mutagenesis, representative cryo-EM까지 갑니다.
반대로 Germinal을 therapeutic antibody platform으로 읽으면 범위를 넘습니다. Target 수는 제한적이고, epitope dependence가 크며, compute cost가 높고, 구조 검증은 대표 사례 중심입니다. Functional assay나 broad specificity panel도 핵심 evidence는 아닙니다. 안전한 결론은 이 정도입니다. Germinal은 open antibody design이 in silico proxy를 넘어 low-N biophysical validation과 epitope evidence로 내려오는 한 지점을 보여줍니다.

참고

Mille-Fragoso et al., “Efficient generation of epitope-targeted de novo antibodies with Germinal”, bioRxiv preprint, 2026. https://doi.org/10.1101/2025.09.19.677421
Germinal code repository: http://www.github.com/SantiagoMille/germinal