mBER 논문 리뷰

들어가며

VHH format prior와 AF-Multimer design

All-against-all phage/NGS screen

Library 1과 Library 2 결과

On-design과 off-design matrix

ipTM filtering과 hit-rate enrichment

Epitope dependence

Figure별로 읽기

Germinal과 나란히 읽기

Open-source method로서의 위치

평가: open VHH design의 breadth anchor

참고

mBER 논문 리뷰

들어가며

Antibody/VHH design 논문에서 먼저 눈에 들어오는 숫자는 hit rate입니다. 몇 개를 만들었고, 그중 몇 개가 target에 붙었는가. 하지만 이 숫자는 denominator와 assay를 빼고 보면 거의 의미가 없습니다. Phage/NGS enrichment인지, purified BLI/SPR KD인지, function인지, pose validation인지에 따라 같은 “hit”이라는 단어가 전혀 다른 evidence를 가리킵니다.

mBER는 이 denominator 문제를 읽기 좋은 논문입니다. Manifold Bio가 발표한 bioRxiv preprint “mBER: Controllable de novo antibody design with million-scale experimental screening”은 open-source VHH-format binder design system을 제시합니다. 새 folding model이나 antibody generator를 학습하기보다, ESM2 sequence prior와 NanoBodyBuilder2-derived VHH structural template을 AlphaFold-Multimer/ColabDesign backpropagation loop에 넣어 VHH답게 후보를 설계합니다.

이 논문에서 먼저 보이는 것은 scale입니다. 436개 human cell-surface target에 대해 1,153,241개 VHH binders를 설계했고, 145개 target에 대해 all-against-all phage/NGS screen을 수행했습니다. 결과적으로 78개 target에서 some on-design binding, 65개 target에서 statistically elevated on-design enrichment를 보고합니다. 다만 이 결과는 purified KD나 function이 아닙니다. mBER는 open VHH design의 breadth와 denominator-rich evidence를 보여주는 논문이지, 바로 therapeutic VHH lead를 만들었다는 논문은 아닙니다.

VHH format prior와 AF-Multimer design

mBER의 기본 문제의식은 general minibinder design을 antibody/VHH design에 그대로 가져오기 어렵다는 데 있습니다. VHH는 작은 단일 domain binder지만, 완전히 자유로운 miniprotein scaffold는 아닙니다. Framework는 유지되어야 하고, CDR region이 target recognition surface를 만들며, CDR3 geometry와 framework exposure가 paratope를 좌우합니다.

mBER는 이 구조적 문법을 새 모델 훈련으로 해결하지 않습니다. 대신 기존 모델 stack에 VHH format prior를 주입합니다. Library에서는 human IGHV3-23 germline 기반 VHH framework를 사용하고, framework residue는 대체로 고정하면서 CDR region을 mask합니다. Target은 extracellular domain 중심으로 truncation하고, surface-exposed residue 중 random hotspot을 잡은 뒤 hotspot 주변 25 Å 영역으로 target을 줄입니다. 한 target당 최소 10개 hotspot을 샘플링합니다.

Sequence prior는 ESM2에서 옵니다. Partially masked VHH sequence를 ESM2에 넣어 CDR positions의 logits/probabilities를 얻고, 이를 ColabDesign optimization의 initialization과 bias term으로 씁니다. Structural prior는 NanoBodyBuilder2에서 옵니다. ESM2 probability에서 샘플링한 VHH sequence를 NanoBodyBuilder2로 fold해 VHH reference structure를 만들고, target truncation structure와 합쳐 AlphaFold-Multimer template으로 제공합니다.

이 조합이 mBER의 성격을 정합니다. Diffusion으로 CDR loop와 docking pose를 새로 샘플링하는 RFdiffusion-Antibody와 달리, mBER는 AF-Multimer backpropagation design입니다. VHH sequence prior와 template을 넣어 AlphaFold-Multimer가 VHH-like, target-docked solution을 찾도록 sequence를 최적화합니다.

All-against-all phage/NGS screen

mBER의 validation은 phage-based all-against-all binding assay입니다. Designed VHH library를 phage display하고, immobilized target protein이 들어간 96-well format에서 panning한 뒤 NGS로 bound binder identity를 회수합니다. 이 setup의 장점은 intended target뿐 아니라 off-design target binding도 같은 matrix에서 볼 수 있다는 점입니다.

논문은 두 개의 large library를 만들었습니다. Library 1은 370 target에 대해 565,982 binders를 설계하고 61 proteins에 대해 screen했습니다. Library 2는 389 target에 대해 587,259 binders를 설계하고 116 proteins에 대해 screen했습니다. 전체로 보면 1,153,241 unique VHH binders, 145 experimentally screened targets입니다.

Hit calling은 단순 count cutoff가 아닙니다. 각 well의 NGS count를 spike-in control count로 normalize하고, target replicate wells가 전체 well distribution에서 충분히 상위 signal을 보일 때 hit로 부릅니다. On-design significance는 target별 Fisher’s exact test로 평가합니다. 즉 “target k를 겨냥한 designs가 target k에서 다른 designs보다 더 자주 hit이 되는가”를 보는 구조입니다.

이 방식은 mBER의 강점입니다. 단순히 selected examples를 보여주는 것이 아니라, large matrix에서 on-design/off-design behavior와 target-level enrichment를 같이 봅니다. 다만 assay endpoint는 여전히 phage/NGS enrichment입니다. Purified KD, expression, monomericity, developability, structure pose는 별도 evidence입니다.

Library 1과 Library 2 결과

Library 1에서는 61 screened proteins 중 56 target에서 hit이 있었고, 22 target에서 statistically elevated on-design hit rate가 나왔습니다. Library 2에서는 116 screened proteins 중 115 target에서 at least one hit이 있었고, 49 target에서 statistically elevated on-design hit rate가 나왔습니다.

전체적으로는 145 experimentally tested targets 중 78개 target에서 some on-design binding이 있었고, 65개 target, 즉 45%에서 Fisher’s exact test 기준 significant on-design enrichment가 있었습니다. 이 숫자는 mBER가 open VHH design에서 breadth를 보여주는 근거입니다.

다만 여기서 “78/145”와 “65/145”는 target-level outcome입니다. Per-designed-binder hit rate와는 다릅니다. 논문이 제시하는 unfiltered per-target hit rate는 대략 0.02–8% 범위이고, median은 약 0.4%입니다. Library-wide on-design rate는 Library 1에서 0.5%, Library 2에서 0.7% 정도입니다.

따라서 mBER의 headline은 “여러 target에서 on-design enrichment를 관찰했다”에 가깝습니다. “개별 VHH 후보가 높은 확률로 바로 hit이 된다”는 뜻은 아닙니다.

On-design과 off-design matrix

All-against-all screen에서는 off-design hit도 많이 나옵니다. 논문은 1,153,241 designs에서 36,008 off-design hits를 관찰했고, experimental target set에 target이 포함된 331,578 designs에서는 11,040 off-design hits와 2,207 on-design hits를 관찰했습니다.

이 숫자는 denominator를 놓고 읽어야 합니다. Off-design은 145개 possible target에 대해 생길 수 있지만, on-design은 intended target 하나에 대한 hit입니다. 그래서 저자들은 off-design count를 target count로 normalize해 roughly 76 normalized off-design hits vs 2,207 on-design hits로 비교합니다. 이 normalization을 거치면 on-design enrichment가 훨씬 선명해집니다.

동시에 이 결과를 proteome-wide specificity로 읽으면 범위를 넘습니다. All-against-all matrix는 screen에 포함된 target panel 안에서의 off-design behavior를 보여줍니다. Broad specificity, polyreactivity, developability, in vivo safety와는 다른 층위입니다.

ipTM filtering과 hit-rate enrichment

mBER에서 실용적으로 볼 부분은 ipTM filtering입니다. Unfiltered per-binder hit rate는 낮지만, ipTM이 높을수록 on-design hit rate가 enrich됩니다. Library 1에서는 ipTM 0.85–0.9 bin에서 hit rate가 3.9%까지 올라갔고, off-design hit rate는 ipTM bin에 따라 크게 올라가지 않았습니다.

Library 2는 ipTM > 0.66으로 restricted된 high-confidence library로 구성되었습니다. 이 library에서도 ipTM > 0.8 filter가 일부 target에서 effective success rate를 더 끌어올립니다. 다만 library-wide on-design rate는 0.5%에서 0.7%로 modest하게만 증가합니다.

여기서 denominator가 중요합니다. “최대 38% hit rate”라는 숫자는 전체 raw generation hit rate가 아닙니다. Favorable epitope에서 strict ipTM filtering을 걸었을 때의 post-filter number입니다. Unfiltered median과 best-epitope/post-filter hit rate는 서로 다른 질문에 답합니다.

이 점에서 mBER는 filtering paper로도 읽을 수 있습니다. ipTM은 wet-lab hit를 enrich하는 useful proxy로 보입니다. 하지만 ipTM은 binding truth나 pose validation이 아닙니다. 후보를 고르는 데 도움이 되는 score와 실제 purified binding/structure evidence는 분리해서 봐야 합니다.

Epitope dependence

mBER에서 독자가 주의해서 볼 지점은 target보다 epitope가 더 세밀한 난이도 단위라는 점입니다. 논문은 target별로 여러 random hotspot을 써서 다양한 epitope를 겨냥했지만, 성공은 target 안의 일부 hotspot에 몰리는 경우가 많았습니다.

TFRC는 aggregate success rate가 unfiltered 0.4% (10/2317)이지만, best hotspot에서는 7.5% (6/80)였습니다. Favorable epitope에서 strict ipTM filtering을 걸면 38% (8/21)까지 올라갑니다. FcRn은 high-confidence binders가 세 distinct epitopes에 걸쳐 나타난 사례로 제시됩니다.

반대로 PDL1은 여러 hotspot을 겨냥했음에도 성공한 binders가 거의 single epitope/geometry로 모였습니다. 이 사례는 hotspot prompting이 intended binding position을 항상 강하게 constrain하지는 않는다는 점을 보여줍니다.

따라서 mBER는 epitope targeting의 가능성과 한계를 동시에 보여줍니다. Target-level hit rate만 보면 이 차이가 가려집니다. 어떤 target에서 성공했는지뿐 아니라, 어떤 hotspot/epitope에서 성공했는지를 봐야 합니다.

Figure별로 읽기

Figure 1은 mBER design system의 구조를 보여줍니다. Target structure와 optional hotspot, partially masked VHH framework를 넣고, target truncation, ESM2 sequence logits, NanoBodyBuilder2 VHH template, AlphaFold-Multimer/ColabDesign losses를 거쳐 final refold/confidence score로 후보를 냅니다. 이 figure는 mBER가 “새 generator”라기보다 VHH prior를 넣은 AF-Multimer backpropagation pipeline임을 보여줍니다.

Figure 2는 million-scale validation을 보여줍니다. Phage display, immobilized targets, NGS all-against-all screen, 145 target statistical outcome, hit-rate matrix가 이어집니다. 여기서 mBER의 장점은 scale과 denominator에 있습니다.

Figure 3은 ipTM/pLDDT filtering analysis입니다. On-design hit rate가 ipTM cutoff에 따라 어떻게 enrich되는지, off-design behavior는 어떻게 다른지, target-wise effective hit rate가 어떻게 달라지는지 보여줍니다. 이 figure는 mBER를 candidate filtering 논문으로도 읽게 만듭니다.

Figure 4는 epitope-specific behavior입니다. TFRC, FcRn, PDL1 examples를 통해 target-level success가 epitope-level success와 같지 않다는 점을 보여줍니다. 특히 PDL1은 intended hotspot과 successful binding cluster가 어긋날 수 있다는 guardrail입니다.

Germinal과 나란히 읽기

mBER는 Germinal과 같이 읽을 때 위치가 선명해집니다. 둘 다 open 또는 open-source antibody/VHH design 흐름에 있지만, evidence layer가 다릅니다.

mBER는 breadth 쪽입니다. 백만 개가 넘는 VHH designs와 145 target all-against-all phage/NGS matrix가 있습니다. Off-design matrix까지 있어서 denominator와 enrichment를 보기 좋습니다. 하지만 KD, function, developability, pose validation은 없습니다.

Germinal은 depth 쪽입니다. Target 수와 candidate 수는 훨씬 작지만, BLI/SPR KD, expression rescue, polyreactivity, alanine mutagenesis, one cryo-EM pose validation까지 갑니다. 대신 scale과 target breadth는 mBER보다 작고, compute-heavy/epitope-dependent입니다.

그래서 두 논문은 “누가 더 낫다”보다 “어떤 evidence layer를 채웠는가”로 보는 편이 안전합니다. mBER는 open VHH design이 large-scale binding-enrichment matrix를 만들 수 있음을 보여주고, Germinal은 low-N design이 purified biophysical validation까지 갈 수 있음을 보여줍니다.

Open-source method로서의 위치

mBER의 또 다른 장점은 open-source surface입니다. 논문은 `manifoldbio/mber-open` code를 MIT license로 공개합니다. 새 model weights를 학습해 공개한 논문이라기보다, ESM2, NanoBodyBuilder2, AlphaFold-Multimer, ColabDesign-style components를 조합해 VHH design protocol을 만든 쪽입니다.

이 점은 Chai-2, Protenix-v2, Latent-X2, JAM-2 같은 closed or partly disclosed company-led systems와 다릅니다. mBER는 performance milestone이라기보다 runnable open VHH design framework에 가깝습니다. 물론 실제 재현에는 CUDA/JAX/Torch, AlphaFold/ESM/NanoBodyBuilder2 weights, GPU 환경이 필요한 지점입니다. Open-source라는 말이 low-burden이라는 뜻은 아닙니다.

그래도 mBER는 open antibody design branch의 중요한 anchor로 둘 수 있습니다. 특히 “new model training 없이 format prior와 existing model stack으로 어디까지 갈 수 있는가”를 보여주는 사례입니다.

평가: open VHH design의 breadth anchor

내가 보기엔 mBER의 가치는 high hit rate 자체가 아니라 scale과 denominator에 있습니다. 1,153,241 designs, 436 design targets, 145 screened targets, on-design/off-design matrix, target-level enrichment, ipTM filtering, epitope-level analysis가 한 논문 안에 들어 있습니다. 이 정도로 denominator가 풍부한 antibody-format design paper는 흔하지 않습니다.

동시에 mBER를 therapeutic VHH lead generation으로 과하게 읽으면 안 됩니다. Phage/NGS enrichment는 KD가 아니고, structural pose validation도 아니며, developability나 function도 아닙니다. 38%라는 숫자는 favorable epitope + strict ipTM filtering의 post-filter result입니다. 전체 raw design success를 대표하지 않습니다.

안전한 결론은 이 정도입니다. mBER는 open-source VHH design이 million-scale experimental matrix로 target/epitope-dependent binding enrichment를 만들 수 있음을 보여줍니다. 이 논문의 강점은 breadth, openness, denominator hygiene입니다. 다음 질문은 이 phage/NGS hit들이 purified KD, specificity, developability, pose validation으로 얼마나 이어질 수 있는가입니다.

참고

•

Swanson et al., “mBER: Controllable de novo antibody design with million-scale experimental screening”, bioRxiv preprint, 2025. https://doi.org/10.1101/2025.09.26.678877

•

Code: https://github.com/manifoldbio/mber-open