실패한 protein design으로 Rosetta energy function 개선

PLOS Computational Biology에 발표된 이 논문은 de novo protein design의 실험 결과를 biomolecular energy function 개선에 활용하는 전략을 제시함. 저자들은 Rosetta로 설계했지만 실험적으로 불안정했던 miniprotein design을 분석해, Rosetta energy function이 protein core의 steric overpacking을 과하게 허용하는 failure mode를 찾음. 이후 관련 parameter를 소규모로 refit해 clash bias를 줄인 beta_jan25 energy function을 만들었고, design 실패가 model development의 training signal이 될 수 있음을 보임.

요약

•

논문은 University of Washington과 Institute for Protein Design(IPD) 연구진이 참여한 work로, Rosetta 기반 de novo protein design 실험 결과를 다시 Rosetta energy function 개발에 활용하는 접근을 다룸.

•

핵심 아이디어는 learning from design임. Energy function으로 protein을 설계하고, wet-lab에서 어떤 design이 성공하거나 실패했는지 본 뒤, 반복적으로 나타나는 failure mode를 model 개선에 되먹임하는 구조임.

•

저자들은 Rosetta design dataset에서 computationally stable하다고 예측됐지만 실험적으로 unstable했던 21개 outlier miniprotein design에 주목함.

•

각 design에 대해 yeast-display protease-resistance assay 기반 deep mutational scanning을 수행해 single amino-acid mutation이 stability에 미치는 효과를 측정함.

•

대부분의 mutation은 큰 효과가 없었지만 약 1%는 강하게 stabilizing한 rescue mutation으로 나타났고, 대부분의 failed design에서 적어도 하나 이상의 rescue mutation이 관찰됨.

•

Rescue mutation 중 일부는 hydrophobic core boundary 근처의 polar residue를 nonpolar residue로 바꾸는 패턴을 보였고, 다른 중요한 패턴은 core 내부의 bulky hydrophobic residue를 alanine/glycine처럼 더 작은 residue로 바꾸는 것이었음.

•

두 번째 패턴이 핵심 단서였음. Valine/isoleucine-to-alanine/glycine rescue mutation은 original model의 steric clash를 완화해 design stability를 rescue하는 것으로 해석됨.

•

저자들은 Rosetta miniprotein design 전반에서 native high-resolution crystal structure보다 nonpolar sidechain clash가 과하게 나타난다는 점을 확인함. 이는 일부 failed design의 문제가 아니라 Rosetta design bias일 가능성을 시사함.

•

실험적으로 구조가 풀린 17개 Rosetta design을 비교했을 때, 실제 crystal structure는 design model보다 평균 약 30% 적은 clashing nonpolar carbon-carbon pair를 보였다고 보고됨. 일부 clash는 backbone adjustment로 사라졌고, 일부는 의도한 design geometry를 바꿀 정도의 conformational change가 필요했음.

•

저자들은 high-resolution crystal structure relaxation benchmark에서 atom-pair distance distribution을 비교해 beta_nov16 energy function이 짧은 interatomic distance, 특히 hydrophobic carbon과 backbone oxygen 관련 pair를 과하게 허용한다는 신호를 찾음.

•

이 failure mode를 바탕으로 Lennard-Jones repulsion, atomic radii, well depth 관련 15개 parameter만 refit했고, atom-pair distance benchmark weight를 높여 beta_jan25 energy function을 만듦.

•

beta_jan25는 short-distance clash bias를 크게 줄이면서 mutation free-energy benchmark와 다른 core task 성능은 대체로 유지함. Protein-protein interface discrimination benchmark에서는 modest improvement도 보고됨.

원문

https://doi.org/10.1371/journal.pcbi.1014215