Search

CellxPert, 단일세포 멀티오믹스 perturbation 모델

CellxPert는 single-cell과 spatial multi-omics를 공통 표현 공간에 묶는 multimodal foundation model임. scRNA-seq, ATAC-seq, CITE-seq에 더해 MERFISH와 imaging mass cytometry를 2D/3D spatial-visual layer로 다루며, in-silico perturbation 예측을 주요 downstream task로 포함함. 특히 gene token 삭제·재정렬 대신 Metropolis-Hastings 기반 샘플러를 써서 perturbation 후 transcriptomic state를 점진적으로 이동시키는 점이 특징임.

요약

CellxPert는 cell-type annotation, LoRA 기반 효율적 fine-tuning, genome-wide transcriptomic response prediction, multi-omic integration을 기본 downstream task로 제시함.
모델은 scRNA-seq, chromatin accessibility, surface proteomics, spatial transcriptomics/visual layer를 함께 다루며 단일 assay 모델보다 넓은 입력 modality를 목표로 함.
세포 타입 주석은 154개 largely overlapping identity label space를 대상으로 하며, 논문은 이를 fine-grained discrimination에 대한 엄격한 평가로 제시함.
In-silico perturbation에서는 masked conditional distribution을 proposal kernel로 쓰는 Metropolis-Hastings sampler가 perturbed gene 조건에서 새 transcriptomic state로 이동함.
저자들은 기존 single-cell foundation model의 gene deletion/reordering 방식이 out-of-distribution artifact를 만들 수 있다고 보고, Markov-chain trajectory가 더 해석 가능한 생물학적 변화를 제공한다고 설명함.
평가는 PBMC68K, Replogle Perturb-seq, Systema, BMMC benchmark에서 진행됐고, cell-type annotation·perturbation response prediction·multi-omic integration에서 classical 및 state-of-the-art baseline을 넘었다고 보고함.
AI-bio 관점에서는 virtual cell/perturbation 모델이 단순 embedding benchmark를 넘어 개입 후 상태 전이를 샘플링하는 방향으로 이동하고 있음을 보여줌.
다만 arXiv preprint이며 성능 수치와 benchmark 세부 검증은 논문 본문 기준으로 추가 확인 필요, 실제 실험 설계 의사결정에 바로 쓰기보다는 후보 생성·가설 우선순위화 도구로 보는 편이 안전함.

원문