CellxPert는 single-cell과 spatial multi-omics를 공통 표현 공간에 묶는 multimodal foundation model임. scRNA-seq, ATAC-seq, CITE-seq에 더해 MERFISH와 imaging mass cytometry를 2D/3D spatial-visual layer로 다루며, in-silico perturbation 예측을 주요 downstream task로 포함함. 특히 gene token 삭제·재정렬 대신 Metropolis-Hastings 기반 샘플러를 써서 perturbation 후 transcriptomic state를 점진적으로 이동시키는 점이 특징임.
요약
•
CellxPert는 cell-type annotation, LoRA 기반 효율적 fine-tuning, genome-wide transcriptomic response prediction, multi-omic integration을 기본 downstream task로 제시함.
•
모델은 scRNA-seq, chromatin accessibility, surface proteomics, spatial transcriptomics/visual layer를 함께 다루며 단일 assay 모델보다 넓은 입력 modality를 목표로 함.
•
세포 타입 주석은 154개 largely overlapping identity label space를 대상으로 하며, 논문은 이를 fine-grained discrimination에 대한 엄격한 평가로 제시함.
•
In-silico perturbation에서는 masked conditional distribution을 proposal kernel로 쓰는 Metropolis-Hastings sampler가 perturbed gene 조건에서 새 transcriptomic state로 이동함.
•
저자들은 기존 single-cell foundation model의 gene deletion/reordering 방식이 out-of-distribution artifact를 만들 수 있다고 보고, Markov-chain trajectory가 더 해석 가능한 생물학적 변화를 제공한다고 설명함.
•
평가는 PBMC68K, Replogle Perturb-seq, Systema, BMMC benchmark에서 진행됐고, cell-type annotation·perturbation response prediction·multi-omic integration에서 classical 및 state-of-the-art baseline을 넘었다고 보고함.
•
AI-bio 관점에서는 virtual cell/perturbation 모델이 단순 embedding benchmark를 넘어 개입 후 상태 전이를 샘플링하는 방향으로 이동하고 있음을 보여줌.
•
다만 arXiv preprint이며 성능 수치와 benchmark 세부 검증은 논문 본문 기준으로 추가 확인 필요, 실제 실험 설계 의사결정에 바로 쓰기보다는 후보 생성·가설 우선순위화 도구로 보는 편이 안전함.