MIT News가 OpenProtein.AI의 no-code protein engineering platform과 창업 배경을 소개함. OpenProtein.AI는 protein language model과 structure/function prediction tool을 웹 인터페이스와 API로 제공해, machine-learning-in-the-loop protein engineering을 wet-lab researcher가 직접 쓰게 만드는 것을 목표로 함. 최근 Boehringer Ingelheim과의 협업 확장, PoET-2 release, academic free access도 함께 언급됨.
요약
•
OpenProtein.AI는 Tristan Bepler와 Tim Lu가 설립한 MIT spinout 성격의 AI-biology company로, biologist가 coding이나 GPU infrastructure 없이 protein design model을 사용할 수 있게 하는 platform을 개발함.
•
Platform은 protein sequence generation, protein structure/function prediction, model training, sequence optimization을 한 workflow 안에서 다루는 방향으로 구성됨.
•
핵심 모델 중 하나인 PoET는 Protein Evolutionary Transformer의 약자로, protein family 단위의 evolutionary constraint를 학습해 related protein set을 생성하는 protein language model임.
•
MIT News에 따르면 PoET는 retraining 없이 새로운 protein sequence 정보를 받아들일 수 있고, researcher가 자체 experimental data를 넣어 model과 sequence optimization workflow를 개선하는 데 쓰일 수 있음.
•
OpenProtein.AI의 workflow는 in silico sequence library generation → predictive model filtering → structural predictor/validation → lab testing candidate selection에 가까움. 실제 병목은 sequence 생성 자체보다 어떤 후보를 wet-lab validation으로 보낼지 줄이는 단계에 있음.
•
OpenProtein.AI는 platform을 academic scientist에게 무료로 제공하고, code 기반 접근이 필요한 사용자에게는 API도 제공함. 이는 AI protein design tool의 접근성을 넓히려는 product positioning으로 볼 수 있음.
•
Boehringer Ingelheim은 2025년부터 OpenProtein platform을 사용했고, 최근 collaboration 확장을 통해 cancer, autoimmune, inflammatory condition 관련 protein engineering workflow에 platform/model을 embedding하는 방향으로 협업 중임.
•
기사에서는 PoET-2가 더 큰 모델보다 적은 compute와 experimental data로 좋은 성능을 냈다고 언급하지만, 구체 benchmark와 task별 성능 수치는 이 MIT News article만으로는 제한적으로 확인됨.
•
AI-bio 관점에서 이 사례는 foundation model의 성능 경쟁만큼이나 interface와 deployment가 중요하다는 점을 보여줌. 모델이 wet-lab cycle 안에 들어가려면 no-code UI, API, data ingestion, consistent experimental data generation이 함께 필요함.