继Evo 2之后,Arc Institute发布首个虚拟细胞模型STATE,训练数据涉及 70 种不同细胞系
内容提要
非盈利研究机构Arc Institute与多所高校联合推出虚拟细胞模型STATE,能够预测干细胞、癌细胞和免疫细胞对药物和基因干预的反应。该模型基于1.7亿个细胞和1亿个干预的数据,显著提高药物研发效率并减少副作用。实验结果表明,STATE在预测转录组变化方面优于现有方法,现已开源供非商业用途。
关键要点
-
非盈利研究机构Arc Institute与多所高校联合推出虚拟细胞模型STATE,能够预测干细胞、癌细胞和免疫细胞对药物和基因干预的反应。
-
STATE模型基于1.7亿个细胞和1亿个干预的数据,显著提高药物研发效率并减少副作用。
-
实验结果显示,STATE在预测转录组变化方面优于现有方法,现已开源供非商业用途。
-
STATE由两大核心模块组成:STATE Transition(ST)和STATE Embedding(SE),能够融合观察性和干预性数据。
-
ST模型通过自注意力机制建模干预在细胞集合中的转化过程,能够有效捕捉复杂的生物变异性。
-
SE模型旨在学习细胞嵌入,优化捕捉细胞类型特异性的基因表达模式,特别在干预数据有限的情况下效果显著。
-
STATE在跨细胞环境的扰动效应预测上全面领先,能够实现零样本预测。
-
Arc Institute成立于2021年,专注于生命科学前沿研究,已推出多项重磅成果。
-
Arc Institute与多家生物科技公司合作,加速开发虚拟细胞图谱,推动生物学AI模型的构建。
延伸解读
虚拟细胞模型的实际应用前景
STATE模型的推出为药物研发带来了新的可能性。通过精准预测细胞对药物和基因干预的反应,研究人员可以更有效地筛选治疗方案,减少临床试验中的失败率。这种模型的应用不仅能提高研发效率,还能降低药物的副作用,推动个性化医疗的发展。
STATE模型的技术优势
STATE模型结合了观察性和干预性数据,采用自注意力机制,能够捕捉复杂的生物变异性。这使得模型在处理细胞类型特异性和不同干预条件下的表现显著优于现有方法,尤其在数据量有限的情况下,SE模块的应用提升了预测的准确性。
开源带来的科研机遇
STATE模型的开源使得非商业用途的研究人员能够利用这一先进工具进行探索。这不仅促进了学术界的合作与创新,也为新兴的生物技术公司提供了基础,推动了生物学AI模型的进一步发展。开源的策略可能会加速相关领域的研究进展。
延伸问答
STATE模型的主要功能是什么?
STATE模型能够预测干细胞、癌细胞和免疫细胞对药物和基因干预的反应。
STATE模型是基于什么数据训练的?
STATE模型基于1.7亿个细胞的观察性数据和1亿个干预数据进行训练。
STATE模型的开源情况如何?
STATE模型已开源,供非商业用途使用。
STATE模型的核心模块有哪些?
STATE模型由STATE Transition(ST)和STATE Embedding(SE)两个核心模块组成。
STATE模型在预测转录组变化方面的表现如何?
实验结果显示,STATE在预测转录组变化方面优于现有方法,准确率显著提升。
Arc Institute的成立背景是什么?
Arc Institute成立于2021年,旨在推动生命科学前沿研究,获得了6.5亿美元的投资。