Search

Protpardelle / Protpardelle-1c 논문 리뷰

Protpardelle / Protpardelle-1c 논문 리뷰

들어가며

Protein design pipeline은 자주 backbone-first로 구성됩니다. 먼저 backbone을 만들고, 그 위에 sequence를 붙이고, 마지막에 sidechain이나 all-atom geometry를 정리합니다. 이 방식은 실용적입니다. RFdiffusion 이후 많은 design workflow가 이 형태를 따랐고, ProteinMPNN과 AF2/ESMFold filtering이 강력한 후단을 제공했습니다.
하지만 function과 binding은 backbone만으로 결정되지 않습니다. 실제 화학적 상호작용은 sidechain에서 생깁니다. Metal coordination, catalytic geometry, hydrogen bond, salt bridge, target interface packing은 모두 atomistic detail을 요구합니다. 그래서 자연스럽게 다음 질문이 나옵니다. Backbone만 먼저 만들지 말고, sequence와 sidechain atom까지 generation 과정 안에 넣을 수 없을까.
Protpardelle과 Protpardelle-1c는 이 질문을 따라가는 두 논문입니다. 2023년 Protpardelle은 sidechain-state superposition을 통해 all-atom generation의 chicken-and-egg 문제를 다루려 했습니다. 2025년 Protpardelle-1c는 이 흐름을 conditional protein generation으로 확장해 motif scaffolding, sidechain-aware conditioning, hotspot-conditioned multi-chain generation을 보여줍니다.
이 두 논문은 wet-lab success story가 아닙니다. 둘 다 주된 evidence는 ESMFold/AF2 self-consistency, MotifBench, scRMSD, pLDDT 같은 computational proxy입니다. 그럼에도 protein generator lineage에서는 중요합니다. Backbone-first design에서 all-atom/conditional design으로 넘어갈 때 어떤 representation 문제가 생기는지 아주 선명하게 보여주기 때문입니다.

Protpardelle: sequence가 정해지기 전 sidechain을 어떻게 만들까

All-atom generation의 가장 큰 난점은 amino acid identity와 atom set이 서로 묶여 있다는 점입니다. Serine과 histidine은 sidechain atom 수와 종류가 다릅니다. 그런데 generation 시작 시점에는 sequence도 모릅니다. Sequence가 정해져야 어떤 atom을 생성할지 알 수 있는데, structure를 생성하려면 그 atom들의 위치도 함께 정해야 하는 구조입니다.
Protpardelle은 이 문제를 sidechain-state superposition으로 다룹니다. 각 residue position에 대해 backbone atom과 20개 amino acid sidechain 상태를 모두 담는 representation을 유지합니다. Sampling 중에는 현재 denoised structure estimate를 기반으로 MiniMPNN이 sequence를 빠르게 예측하고, 그 sequence에 맞는 atom만 collapse해 실제 all-atom structure처럼 사용합니다.
이 superposition은 물리적으로 실제 protein state는 아닙니다. 그러나 generation 중 sequence uncertainty를 처리하기 위한 bookkeeping device로는 강력합니다. Backbone atom은 매 step denoise되고, sidechain atom은 해당 amino acid가 선택될 때 denoise됩니다. 마지막에는 full ProteinMPNN으로 sequence를 다시 예측해 final sequence quality를 보강합니다.
즉 Protpardelle은 완전한 joint sequence diffusion model이라기보다, structure-primary all-atom generator입니다. Sequence는 별도 diffusion path로 생성되지 않고, MiniMPNN/ProteinMPNN을 통해 trajectory 중 계속 추정됩니다. 이 점이 Protpardelle의 장점이자 한계입니다.

Sequence leakage와 atom mask 문제

Protpardelle이 흥미로운 이유는 자기 한계를 꽤 솔직하게 다룬다는 점입니다. All-atom model에서는 atom mask 자체가 sequence를 알려줄 수 있습니다. 어떤 sidechain atom이 존재하는지만 봐도 amino acid identity를 추론할 수 있기 때문입니다. 논문은 이를 sequence leakage라고 부릅니다.
Intended path는 sidechain position과 backbone conformation이 서로 영향을 주는 것입니다. Unintended path는 model이 atom mask에서 sequence를 읽고, sequence를 단서로 structure를 memorization하듯 denoise하는 것입니다. Sampling 초기에 sequence가 plausible하지 않으면 model이 unusual input을 denoise해야 해서 sample quality가 나빠질 수 있습니다.
이를 줄이기 위해 Protpardelle은 실제 sequence에 해당하는 atom만 noise하는 대신, broader atom position input 전체를 noise해 atom mask가 sequence를 쉽게 누설하지 않도록 설계합니다. 이 문제는 all-atom generation이 단순히 atom 수를 늘리는 일이 아니라는 점을 보여줍니다. Sequence uncertainty, atom existence, denoising path가 모두 얽혀 있습니다.

Backbone-only baseline과 all-atom model

Protpardelle은 all-atom model뿐 아니라 backbone-only model도 평가합니다. Backbone-only model은 U-ViT score network와 self-conditioning, network preconditioning 등을 통해 길이 300 residue까지 ProteinMPNN + ESMFold self-consistency 기준에서 comparable한 designability를 보였고, sampling speed도 빠르다고 주장합니다. NVIDIA A40에서 약 0.002 seconds/residue로 보고됩니다.
All-atom model은 더 어렵습니다. Length ≤150 residue에서는 scRMSD 기준 약 60% success rate를 보이고, 더 긴 length에서도 scTM 기준으로는 correct fold를 채택하는 sample이 80% 이상이라고 보고합니다. 하지만 backbone-only model보다 덜 robust하고, MiniMPNN을 sampling 중 돌려야 해서 약 10배 느립니다.
Sidechain chemical quality도 평가합니다. Bond length, bond angle, chi angle distribution은 natural protein의 주요 mode를 따르지만 variance가 더 큽니다. Rosetta `fa_dun` distribution도 대체로 natural protein과 비슷한 범위를 따르지만 outlier가 있습니다. Visual examples에서는 plausible packing, salt bridge, helix capping, hydrogen bond 같은 사례가 보입니다.
이 결과는 all-atom generation이 가능하다는 점을 지지하지만, physically rigorous all-atom design이나 functional validation은 아닙니다. ESMFold self-consistency와 structural distribution metric은 useful proxy일 뿐입니다.

Two-stage sampling과 sidechain refinement

Protpardelle은 일부 sidechain이 sampling 중 diverge되어 bond length가 크게 틀어지는 failure mode를 관찰했습니다. 원인은 infrequently selected sidechain이 denoising step을 충분히 받지 못하거나 너무 큰 step을 경험하기 때문일 수 있습니다.
이를 줄이기 위해 sequence resampling rate를 time에 따라 anneal하고, final sampling 후 backbone과 sequence를 고정한 second-stage sampling을 수행합니다. 이 second stage는 사실상 rotamer packing에 가까운 refinement입니다. MiniMPNN/ProteinMPNN을 다시 돌리지 않기 때문에 sampling time은 크게 늘지 않으면서 faulty sidechain을 줄일 수 있었다고 보고합니다.
이 부분은 Protpardelle을 해석할 때 중요합니다. Protpardelle은 sidechain을 generation 과정에 넣지만, final quality는 여전히 sequence prediction과 sidechain refinement step에 의존합니다. “End-to-end all-atom design”이라고 단순화하면 실제 pipeline 구조를 놓치게 됩니다.

Functional group conditioning: 가능성과 거리감

Protpardelle의 가장 매력적인 demonstration은 sidechain-conditional design입니다. 첫 번째 example은 TGF-β1 binding monobody motif scaffolding입니다. De novo monobody binder에서 binding loop와 sidechain을 conditioning input으로 뽑고, Protpardelle로 그 motif를 다른 fold 안에 scaffold합니다.
두 번째 example은 iron-binding functional group conditioning입니다. Natural diiron-binding protein에서 metal coordination에 관여하는 glutamate carboxylate와 histidine imidazole ring functional group atom만 추출하고, 이를 host할 scaffold와 나머지 sidechain atoms/rotamer를 생성합니다. Full residue나 backbone motif가 아니라 chemical functional group만 조건으로 넣는다는 점이 흥미롭습니다.
다만 이 section은 demonstration 수준입니다. 논문은 generated design이 plausible해 보인다고 말하지만, conditioning fidelity, sampling success rate, overall quality가 더 개선되어야 한다고 적습니다. 특히 정보가 적은 motif scaffolding task에서는 model이 condition을 무시하기 쉬워 reconstruction guidance에 기대는 경우가 있었습니다.
따라서 이 결과는 “metal-binding protein을 설계했다”가 아닙니다. 더 정확히는 all-atom generator가 functional group condition을 받는 방향을 탐색한 early demonstration입니다.

Protpardelle-1c: unconditional에서 conditional로

Protpardelle-1c는 Protpardelle을 conditional protein structure generation으로 확장합니다. Functional protein design에서는 아무 구조나 만드는 것보다, 보존해야 할 motif나 hotspot을 먼저 정하는 경우가 많습니다. Catalytic residue arrangement, binding loop, epitope-facing residue, target hotspot 같은 local geometry를 조건으로 넣고, 주변 scaffold나 binder complex를 만들어야 합니다.
Original Protpardelle의 conditional sampling은 reconstruction guidance에 많이 의존했습니다. Denoising step마다 motif reconstruction loss의 gradient를 score에 더하는 방식입니다. 이 방식은 pretrained unconditional model에도 붙일 수 있지만, guidance scale tuning이 brittle합니다. Scale이 너무 크면 chain이 깨지고, 너무 작으면 motif reconstruction이 약해질 수 있습니다.
Protpardelle-1c는 classifier-free guidance와 conditional training을 더 적극적으로 사용합니다. Training 중 condition input을 dropout해 unconditional/conditional behavior를 함께 학습하고, sampling 때 motif coordinate를 model input으로 직접 attend하게 합니다. Motif input도 backbone뿐 아니라 sidechain coordinate까지 포함할 수 있게 합니다.

MotifBench: sidechain-aware conditioning의 효과

Protpardelle-1c의 가장 강한 결과는 MotifBench입니다. Original Protpardelle backbone-only reconstruction guidance baseline은 best hyperparameter에서 score 4.97이었습니다. ProteinMPNN sequence redesign 때 motif residue까지 redesign하게 하면 score가 10.18로 올라갑니다. 이 차이는 motif sidechain compatibility 문제가 있었음을 시사합니다.
Protpardelle-1c `cc58`은 MotifBench score 28.16을 보고합니다. 논문은 이를 RFdiffusion의 21.27보다 높다고 제시합니다. `cc58`은 30개 MotifBench problem 중 22개를 풀고, total unique solution 164개를 얻었습니다. RFdiffusion은 16개 problem, total unique solution 192개로 제시됩니다.
여기서 재미있는 점은 총 unique solution 수가 RFdiffusion보다 많지는 않지만, previously difficult multi-segment task에서 solution을 찾아 score가 높아졌다는 것입니다. Sidechain-aware motif conditioning이 단순 backbone motif placement보다 특정 task에서 더 유리할 수 있음을 보여줍니다.
하지만 MotifBench success는 functional validation이 아닙니다. Evaluation은 ESMFold-predicted structures of ProteinMPNN sequences, motif RMSD, scaffold RMSD, Foldseek clustering 같은 proxy에 기반합니다. Motif geometry가 맞는다는 것과 실제 catalytic activity나 binding이 있다는 것은 다른 문제입니다.

All-atom cc91과 benchmark 해석

Protpardelle-1c는 RFdiffusion/La-Proteina motif scaffolding benchmark에서도 평가됩니다. All-atom model `cc91`은 26개 task 중 22개를 풀고 total unique solution 208개를 보고합니다. Original all-atom Protpardelle이 4/26 tasks, 4 unique solutions였던 것과 비교하면 큰 개선입니다. La-Proteina indexed는 total unique 227, unindexed는 357로 보고되므로, cc91은 대략 competitive한 위치에 있습니다.
Backbone-only `cc58`은 더 많은 unique solution을 보고하지만, success criteria가 다릅니다. All-atom motif scRMSD와 sample/predicted structure Cα scRMSD를 대체 기준으로 쓰기 때문에, all-atom model과 직접 비교하기 어렵습니다. 논문도 strict all-atom motif scRMSD < 1 Å 기준을 따로 제시하며, 기준을 엄격하게 하면 success가 크게 줄어든다는 점을 보여줍니다.
이 대목은 benchmark number를 읽을 때 중요합니다. Motif scaffolding benchmark는 threshold, refolding model, sequence count, all-atom vs backbone-only criterion에 따라 결과가 크게 달라집니다. Protpardelle-1c의 숫자는 강하지만, functional motif success나 wet-lab hit rate로 바꿔 읽으면 안 됩니다.

cc89: sidechain-aware CDR3 loop refinement

Protpardelle-1c는 all-atom partial diffusion model `cc89`도 제시합니다. Sequence mask가 항상 제공되는 setting에서 sidechain-aware partial diffusion을 수행합니다. CDR3 loop example에서는 framework 쪽으로 packing되는 residue는 fluctuation이 작고, solvent-exposed residue는 더 크게 움직이는 residue-specific loop fluctuation pattern을 보입니다.
이 결과는 antibody/VHH loop design과 연결해 볼 수 있습니다. Sidechain-aware model이 loop conformational space를 더 제한적으로, 그리고 residue environment에 맞게 sample할 수 있다는 가능성을 보여주기 때문입니다. 하지만 이 논문이 antibody binder를 실험적으로 검증한 것은 아닙니다. CDR3 example은 loop refinement/conformational sampling demonstration입니다.

cc83: hotspot-conditioned multi-chain generation

Protpardelle-1c는 binder design을 motif scaffolding의 특수한 경우처럼 다룹니다. Target structure를 motif로 보고, binder chain을 생성할 piece로 보는 framing입니다. Multi-chain handling을 위해 chain 사이 residue index gap을 두고, boolean hotspot mask input channel을 추가한 `cc83`을 학습합니다.
Training에서는 chain pair dataset을 사용하고, 한 chain을 target/motif로 random selection합니다. Binder chain과 가까운 residue 중 3–8개를 hotspot으로 잡고, 일부 paratope residue를 motif에 포함해 partial-paratope completion도 가능하게 합니다. SpCas9 example에서는 generated binder가 AF2 single-sequence model 기준으로 꽤 좋은 iPTM/iPAE/pLDDT와 binder scRMSD를 보입니다.
이 결과는 target/hotspot-conditioned complex generation capability를 보여줍니다. 그러나 binder design evidence로는 아직 약합니다. AF2 metric이 좋다는 것과 실제 binding affinity, specificity, developability가 있다는 것은 다른 문제입니다.

BindCraft와의 비교가 말해주는 것

Protpardelle-1c는 BindCraft targets에서도 평가됩니다. Threshold는 BindCraft를 따라 complex pLDDT > 0.80, iPTM > 0.5, iPAE < 0.35, apo binder RMSD < 3.5 Å입니다. Figure 9에서 AF2 metric-based success rate는 DerF21을 제외한 대부분 target에서 BindCraft가 Protpardelle-1c보다 높습니다.
이 비교는 Protpardelle-1c의 한계를 오히려 잘 보여줍니다. BindCraft는 AF2 pLDDT, iPAE, iPTM을 직접 최적화하고, hallucination 중 low-confidence나 clashing trajectory를 버립니다. Protpardelle-1c cc83은 이런 AF2 metric optimization이나 sampling-time filtering을 하지 않는 base generator에 가깝습니다.
따라서 Protpardelle-1c를 practical binder pipeline으로 소개하면 과합니다. 더 정확한 위치는 “target/hotspot-conditioned complex generation을 보여준 conditional generator”입니다. Binder hit discovery까지 가려면 sequence optimization, AF2/Rosetta-style filtering, assay handoff가 더 붙어야 합니다.

두 논문을 함께 보면 보이는 흐름

Protpardelle은 all-atom generation의 representation 문제를 열었습니다. Sequence가 unknown일 때 sidechain atom existence를 어떻게 다룰 것인가. 답은 sidechain-state superposition이었습니다. 이 방식은 완벽하지 않았지만, all-atom co-design을 sampling trajectory 안에 넣는 방법을 보여줬습니다.
Protpardelle-1c는 조건부 design 문제로 이동했습니다. Motif, sidechain, hotspot, multi-chain target context를 넣고, model이 그 조건을 만족하는 scaffold나 complex를 만들 수 있는지 봅니다. 특히 sidechain-aware motif conditioning이 MotifBench score를 크게 끌어올린 점은 의미가 있습니다.
하지만 두 논문 모두 실험 검증 논문은 아닙니다. Protpardelle은 all-atom structure plausibility와 functional group conditioning demonstration이 중심이고, Protpardelle-1c는 motif scaffolding benchmark와 AF2-style complex proxy가 중심입니다. 이 둘은 “all-atom/conditional generation이 practical design으로 가기 위해 필요한 representation과 conditioning을 어떻게 만들 것인가”를 보여주는 method lineage입니다.

평가: sidechain-aware generation으로 가는 징검다리

Protpardelle lineage의 장점은 명확합니다. Backbone-first design의 빈틈, 즉 sequence와 sidechain chemistry가 generation 뒤쪽으로 밀리는 문제를 정면으로 다룹니다. Protpardelle은 superposition으로 sequence uncertainty 아래의 sidechain generation을 시도했고, Protpardelle-1c는 sidechain-aware conditional generation을 motif scaffolding benchmark에서 강하게 보여줬습니다.
한계도 뚜렷합니다. Protpardelle all-atom model은 backbone-only보다 덜 robust하고, MiniMPNN/ProteinMPNN/second-stage refinement에 의존합니다. Protpardelle-1c의 benchmark success는 ESMFold/AF2/scRMSD/pLDDT proxy입니다. Binder-like generation example은 있지만 wet-lab binding, function, specificity, developability evidence는 없습니다.
그래서 이 lineage는 experimental milestone보다 representation milestone입니다. All-atom generation에서 sequence와 sidechain atom을 어떻게 다룰지, conditional generation에서 motif sidechain을 어떻게 보존할지, target/hotspot-conditioned complex generation이 practical binder pipeline과 왜 다른지 설명해주는 좋은 anchor입니다. RFdiffusion과 BindCraft가 실험적 impact를 보여주는 축이라면, Protpardelle은 sidechain-aware generation의 방법론적 빈칸을 채우는 축에 가깝습니다.

참고

Chu, A. E. et al. “An all-atom protein generative model”, bioRxiv, 2023.
Lu, T. et al. “Conditional protein structure generation with Protpardelle-1c”, bioRxiv, 2025.
Protpardelle DOI: https://doi.org/10.1101/2023.05.24.542194
Protpardelle-1c DOI: https://doi.org/10.1101/2025.08.18.670959
주요 비교 축: RFdiffusion, BindCraft, La-Proteina, ProteinMPNN, Pallatom.