继Evo 2之后,Arc Institute发布首个虚拟细胞模型STATE,训练数据涉及 70 种不同细胞系
💡
原文中文,约7400字,阅读约需18分钟。
📝
内容提要
非盈利研究机构Arc Institute与多所高校联合推出虚拟细胞模型STATE,能够预测干细胞、癌细胞和免疫细胞对药物和基因干预的反应。该模型基于1.7亿个细胞和1亿个干预的数据,显著提高药物研发效率并减少副作用。实验结果表明,STATE在预测转录组变化方面优于现有方法,现已开源供非商业用途。
🎯
关键要点
- 非盈利研究机构Arc Institute与多所高校联合推出虚拟细胞模型STATE,能够预测干细胞、癌细胞和免疫细胞对药物和基因干预的反应。
- STATE模型基于1.7亿个细胞和1亿个干预的数据,显著提高药物研发效率并减少副作用。
- 实验结果显示,STATE在预测转录组变化方面优于现有方法,现已开源供非商业用途。
- STATE由两大核心模块组成:STATE Transition(ST)和STATE Embedding(SE),能够融合观察性和干预性数据。
- ST模型通过自注意力机制建模干预在细胞集合中的转化过程,能够有效捕捉复杂的生物变异性。
- SE模型旨在学习细胞嵌入,优化捕捉细胞类型特异性的基因表达模式,特别在干预数据有限的情况下效果显著。
- STATE在跨细胞环境的扰动效应预测上全面领先,能够实现零样本预测。
- Arc Institute成立于2021年,专注于生命科学前沿研究,已推出多项重磅成果。
- Arc Institute与多家生物科技公司合作,加速开发虚拟细胞图谱,推动生物学AI模型的构建。
❓
延伸问答
STATE模型的主要功能是什么?
STATE模型能够预测干细胞、癌细胞和免疫细胞对药物和基因干预的反应。
STATE模型是基于什么数据训练的?
STATE模型基于1.7亿个细胞的观察性数据和1亿个干预数据进行训练。
STATE模型的开源情况如何?
STATE模型已开源,供非商业用途使用。
STATE模型的核心模块有哪些?
STATE模型由STATE Transition(ST)和STATE Embedding(SE)两个核心模块组成。
STATE模型在预测转录组变化方面的表现如何?
实验结果显示,STATE在预测转录组变化方面优于现有方法,准确率显著提升。
Arc Institute的成立背景是什么?
Arc Institute成立于2021年,旨在推动生命科学前沿研究,获得了6.5亿美元的投资。
➡️