Genie 논문 리뷰

들어가며

Noise는 point cloud에, denoising은 oriented frame으로

Sequence를 만들지 않는 backbone generator

Short backbone benchmark: ProtDiff와 FoldingDiff를 넘어서

Long backbone benchmark: RFdiffusion과 FrameDiff 옆에 놓기

Genie-SCOPe와 Genie-SwissProt

Structural plausibility proxy로서의 designability

RFdiffusion, FrameDiff, Chroma와의 차이

평가: 작은 모델이 보여준 asymmetric backbone diffusion

참고

Genie 논문 리뷰

들어가며

Protein backbone diffusion은 하나의 방법처럼 들리지만, 실제로는 여러 선택지의 조합입니다. 어떤 object에 noise를 넣을 것인가. Cα coordinate인지, backbone atom인지, residue frame인지. Denoising network는 단순 point cloud를 볼 것인가, residue orientation까지 볼 것인가. Sequence는 같이 만들 것인가, 아니면 나중에 ProteinMPNN으로 붙일 것인가.

Genie는 이 design space에서 꽤 흥미로운 위치를 차지합니다. 2023년 ICML에 발표된 “Generating Novel, Designable, and Diverse Protein Structures by Equivariantly Diffusing Oriented Residue Clouds”는 Cα coordinate diffusion의 단순함과 residue-frame 기반 geometric reasoning을 결합한 backbone generation 논문입니다.

FrameDiff가 SE(3) manifold 위에서 residue frame diffusion을 더 원칙적으로 정의하려 했다면, Genie는 forward process를 단순하게 유지합니다. Cα point cloud에 Gaussian noise를 넣습니다. 대신 reverse denoiser에서는 Cα coordinates로부터 residue-local frame을 만들고, AlphaFold2의 Invariant Point Attention에서 온 idea를 사용해 orientation-aware denoising을 수행합니다. 이 asymmetric representation이 Genie의 핵심입니다.

Noise는 point cloud에, denoising은 oriented frame으로

Genie가 잡은 문제는 단순합니다. Protein backbone을 Cartesian coordinate로 다루면 DDPM의 Gaussian noising을 쓰기 쉽습니다. 하지만 raw point cloud만 보면 global rotation/translation invariance와 chirality, residue orientation을 다루기 어렵습니다. 반대로 residue frame이나 torsion을 직접 noising하면 geometry에는 자연스럽지만 diffusion process가 복잡해집니다.

Genie의 선택은 forward와 reverse를 다르게 두는 것입니다. Forward diffusion은 Cα coordinates에 isotropic Gaussian noise를 넣습니다. Rotation matrix를 직접 noise에 태우지 않기 때문에 표준 DDPM framing을 유지하기 쉽습니다. Reverse denoising에서는 noisy Cα coordinate로부터 Frenet-Serret-like local frame을 구성하고, IPA-inspired SE(3)-equivariant denoiser가 denoising displacement를 예측합니다.

논문은 이를 “oriented residue cloud”라고 부릅니다. Point cloud이지만 각 residue에 local orientation이 붙어 있는 표현입니다. 이 표현은 Cα coordinate diffusion의 simplicity를 유지하면서도, denoiser가 inter-residue orientation과 chirality를 볼 수 있게 해줍니다. ProtDiff류 coordinate model에서 문제가 된 left-handed helix를 피하려는 의도도 여기에 있습니다.

Sequence를 만들지 않는 backbone generator

Genie는 amino-acid sequence를 직접 생성하지 않습니다. 생성 대상은 length N protein의 Cα coordinate sequence입니다. Sequence realization은 평가 단계에서 ProteinMPNN이 맡습니다. Generated backbone에 ProteinMPNN으로 sequence를 붙이고, OmegaFold 또는 ESMFold로 다시 접어 generated structure와 predicted structure가 맞는지 봅니다.

이 점은 Genie의 claim을 이해하는 데 중요합니다. Genie가 말하는 designability는 generated backbone이 sequence로 구현될 가능성이 있는지에 대한 self-consistency proxy입니다. 실제 expression, solubility, folding, function을 측정한 것은 아닙니다. 또 sidechain이나 all-atom geometry를 직접 생성하는 것도 아닙니다.

그래서 Genie는 binder design이나 all-atom design paper가 아니라, early backbone diffusion paper입니다. 이후 Genie2가 motif scaffolding으로, Genie3가 partial atomization과 binder design으로 확장되지만, 원래 Genie의 중심은 unconditional backbone generation입니다.

Short backbone benchmark: ProtDiff와 FoldingDiff를 넘어서

Genie는 먼저 짧은 protein setting에서 ProtDiff와 FoldingDiff를 비교합니다. Length 50–128 proteins를 생성하고, ProteinMPNN으로 sequence를 설계한 뒤, OmegaFold prediction이 generated backbone을 얼마나 잘 recapitulate하는지 봅니다. `scTM > 0.5`를 fold-level designability 기준으로 사용하고, predicted structure confidence를 위해 pLDDT > 70도 함께 봅니다.

결과는 꽤 강합니다. Genie는 generated domains의 81.5%가 `scTM > 0.5`를 만족한다고 보고합니다. ProtDiff는 retrained 기준 5.1%, reported 기준 11.8%이고, FoldingDiff는 resampled 기준 19.6%, reported 기준 22.7%입니다. Confidently designable criterion, 즉 `scTM > 0.5`와 pLDDT > 70을 함께 적용하면 Genie는 58.3%, ProtDiff는 3.2%, FoldingDiff는 17.7%입니다.

Novel confidently designable structures도 비교합니다. Training set 대비 novel하면서 confidently designable한 구조는 Genie가 98/455, 즉 21.5%입니다. ProtDiff는 1/25, FoldingDiff는 28/138입니다. 이 결과는 Genie가 초기 backbone diffusion 모델들 사이에서 designability와 novelty proxy를 꽤 끌어올렸다는 점을 보여줍니다.

Long backbone benchmark: RFdiffusion과 FrameDiff 옆에 놓기

Long setting에서는 평가 기준이 더 엄격해집니다. Length 50–256에서 Genie-SCOPe, Genie-SwissProt, RFdiffusion, FrameDiff를 비교합니다. 여기서는 ProteinMPNN + ESMFold self-consistency를 쓰고, `scRMSD < 2 Å`와 pLDDT > 70을 designability 기준으로 둡니다. scTM보다 scRMSD가 더 엄격하기 때문입니다.

Table 1에서 Genie-SwissProt는 designability 0.790, diversity 0.642, F1 0.708, novelty 0.041을 보고합니다. Genie-SCOPe는 designability 0.586, diversity 0.738, F1 0.654, novelty 0.039입니다. FrameDiff는 designability 0.483, diversity 0.590, F1 0.531, novelty 0.006이고, RFdiffusion은 designability 0.951, diversity 0.667, F1 0.784, novelty 0.170입니다.

이 표에서 Genie는 FrameDiff보다 designability와 F1이 높고, RFdiffusion보다는 낮습니다. 모델 크기는 Genie가 약 4.1M parameters로 작고, RFdiffusion은 약 59.8M parameters입니다. 하지만 L=200 sampling time은 Genie-SwissProt가 1.331분으로 RFdiffusion 0.740분보다 느립니다. 1,000 diffusion steps와 triangular multiplicative update layer의 O(N³) cost가 영향을 줍니다.

따라서 Genie의 위치는 명확합니다. RFdiffusion처럼 실험 검증까지 이어진 practical design milestone은 아니지만, much smaller from-scratch backbone diffusion model로 FrameDiff보다 강한 in silico self-consistency를 보인 contrast입니다.

Genie-SCOPe와 Genie-SwissProt

Genie는 training data setting에 따라 SCOPe-based model과 AlphaFold-SwissProt-based model을 비교합니다. Genie-SwissProt는 더 큰 training set을 사용하면서 designability가 크게 올라갑니다. 반면 diversity는 Genie-SCOPe보다 낮아집니다. 논문은 model capacity가 제한된 상황에서 larger dataset을 쓰면 distribution coverage와 designability는 좋아질 수 있지만, 다양성 측면에서는 tradeoff가 생길 수 있다고 해석합니다.

이 부분은 이후 Genie2로 이어집니다. Genie2는 AFDB-scale training으로 structure universe를 넓히고, motif conditioning까지 들어갑니다. 다만 원래 Genie 논문만 놓고 보면, data scale을 키우는 것만으로 모든 문제가 해결되지는 않습니다. Evaluation은 여전히 ProteinMPNN과 ESMFold/OmegaFold self-consistency에 기대고, wet-lab validation은 없습니다.

Structural plausibility proxy로서의 designability

Genie의 designability metric은 useful하지만 제한적입니다. Generated backbone에 ProteinMPNN으로 sequence를 붙이고, OmegaFold나 ESMFold가 그 sequence를 generated backbone과 비슷하게 예측한다면, 그 backbone은 sequence로 구현될 가능성이 있어 보입니다. 이것은 structural plausibility를 보는 좋은 computational sanity check입니다.

하지만 이것은 실험적 foldability가 아닙니다. Prediction model이 novel fold에서 얼마나 일반화하는지, ProteinMPNN sequence가 실제로 expression되고 soluble하게 접히는지, sidechain packing이나 biophysical stability가 충분한지는 별도 문제입니다. Binder design에서는 target interface와 affinity, specificity까지 더해져야 합니다.

Genie 논문 자체도 short-model section에서 purely in silico라는 표현을 씁니다. 이 점이 오히려 깔끔합니다. Genie의 성과는 computational backbone generator benchmark 안에서 봐야 합니다. 실험으로 접힌 protein이나 functional binder를 만든 논문으로 소개하면 evidence 범위를 넘어갑니다.

RFdiffusion, FrameDiff, Chroma와의 차이

Genie는 RFdiffusion과 같은 backbone diffusion 범주에 있지만, 계보는 다릅니다. RFdiffusion은 RoseTTAFold/RF 계열 pretrained structure prediction model을 fine-tune해 practical generator로 바꿨습니다. Motif scaffolding, symmetric design, target-conditioned binder design까지 보여줬고, wet-lab BLI/cryo-EM validation도 있습니다.

FrameDiff는 SE(3) manifold diffusion을 더 원칙적으로 정리한 논문입니다. Rotation에는 SO(3) Brownian motion을 쓰고, translation은 centered process로 다룹니다. Genie는 FrameDiff보다 덜 formal한 대신 forward noising을 Cα Gaussian으로 단순화하고, denoiser에서 oriented frame reasoning을 사용하는 asymmetric design을 택합니다.

Chroma는 또 다릅니다. Chroma는 correlated polymer diffusion, ChromaDesign, conditioner framework, wet-lab foldability validation을 묶은 programmable protein generation system입니다. Genie는 이보다 더 작은 backbone-generation method paper이고, sequence/sidechain design은 외부 평가 pipeline에 둡니다.

이 비교를 통해 보이는 점은 하나입니다. “Backbone diffusion”이라는 말 아래에도 pretrained predictor reuse, SE(3) manifold diffusion, Cα Gaussian noising, polymer-correlated diffusion, conditioner framework처럼 서로 다른 선택지가 있습니다. Genie는 그중 forward noising과 reverse denoising representation을 분리한 사례입니다.

평가: 작은 모델이 보여준 asymmetric backbone diffusion

Genie의 장점은 명확합니다. Cα coordinate에는 표준 Gaussian diffusion을 적용하면서, denoising 단계에서는 residue-local frames와 IPA-style geometric reasoning을 사용했습니다. 이 asymmetric representation은 구현의 단순함과 SE(3)-equivariant geometry reasoning을 함께 가져가려는 실용적인 선택입니다.

결과도 초기 backbone generator 기준으로 의미가 있습니다. ProtDiff와 FoldingDiff보다 short-backbone designability가 훨씬 높고, long setting에서는 FrameDiff보다 강한 self-consistency를 보입니다. RFdiffusion에는 못 미치지만, model size와 from-scratch nature를 생각하면 좋은 contrast입니다.

한계도 분명합니다. Wet-lab validation은 없습니다. Sequence, sidechain, all-atom geometry를 직접 생성하지 않습니다. Binder/interface/function design도 원 논문의 중심이 아닙니다. Sampling도 RFdiffusion보다 느릴 수 있습니다. Genie의 숫자는 ProteinMPNN + OmegaFold/ESMFold self-consistency라는 in silico proxy의 범위 안에서 이해하는 편이 자연스럽습니다.

그래서 Genie는 “실험적으로 검증된 design platform”보다 “backbone diffusion design choice를 보여주는 method anchor”에 가깝습니다. 이후 Genie2와 Genie3로 이어지는 lineage의 출발점이기도 합니다. Genie2는 motif conditioning과 AFDB-scale generation으로, Genie3는 partial atomization과 binder design으로 나아갑니다. 그 출발점에는 Cα noising과 oriented frame denoising을 분리한 Genie의 선택이 있습니다.

참고

•

Lin, Y. and AlQuraishi, M. “Generating Novel, Designable, and Diverse Protein Structures by Equivariantly Diffusing Oriented Residue Clouds”, ICML/PMLR, 2023.

•

arXiv: https://arxiv.org/abs/2301.12485

•

Code: https://github.com/aqlaboratory/genie

•

주요 비교 축: RFdiffusion, FrameDiff, Chroma, ProteinMPNN, Genie2, Genie3.