1亿参数的细胞大模型来了!登Nature子刊,清华大学团队发布scFoundation:对2万基因同时建模
原文中文,约6700字,阅读约需16分钟。发表于: 。其将基于 scFoundation 的模型与以所有基因表达值作为输入的基线 SCAD 模型进行了比较,结果显示,基于 scFoundation 的模型在所有药物的 AUC 值上,都取得了更高的分数,对于 NVP-TAE684 和索拉非尼尤为显著,AUC 值增加了超过 0.2,如下图所示。研究人员将 scFoundation 与一个高级模型 GEARS...
清华大学研究人员发表了一篇名为「Large-scale foundation model on single-cell transcriptomics」的研究论文,介绍了一种名为scFoundation的细胞大模型,能够同时处理约2万个基因,具有卓越的性能提升。研究人员通过构建全面的单细胞数据集进行模型训练,结果显示scFoundation模型在细胞药物响应预测和细胞扰动预测等任务中表现出卓越性能。该研究为建立细胞预训练大模型提供了新的思路和方法,拓展了单细胞领域基础模型的边界。