HyperAI超神经 ·

1亿参数的细胞大模型来了！登Nature子刊，清华大学团队发布scFoundation：对2万基因同时建模

💡 原文中文，约6700字，阅读约需16分钟。

📝

内容提要

清华大学研究人员发表了一篇名为「Large-scale foundation model on single-cell transcriptomics」的研究论文，介绍了一种名为scFoundation的细胞大模型，能够同时处理约2万个基因，具有卓越的性能提升。研究人员通过构建全面的单细胞数据集进行模型训练，结果显示scFoundation模型在细胞药物响应预测和细胞扰动预测等任务中表现出卓越性能。该研究为建立细胞预训练大模型提供了新的思路和方法，拓展了单细胞领域基础模型的边界。

🎯

关键要点

清华大学研究人员发表了关于细胞大模型scFoundation的研究论文。
scFoundation模型能够同时处理约2万个基因，性能显著提升。
研究通过构建全面的单细胞数据集进行模型训练，解决了数据组织松散和测序深度差异等挑战。
scFoundation模型基于5000万个细胞的基因表达数据进行训练，拥有1亿参数。
模型采用非对称设计，减少计算和内存挑战，支持多种生物医学下游任务。
研究人员设计了RDA建模的预训练任务，考虑了测序深度的高方差。
scFoundation在细胞药物反应预测和细胞扰动预测等任务中表现出卓越性能。
模型支持开箱即用和微调两种模式，能够直接提升细胞数据质量。
研究结果显示，scFoundation在癌症药物反应预测和单细胞药物反应分类任务中表现优异。
scFoundation为建立细胞预训练大模型提供了新的思路和方法，拓展了单细胞领域基础模型的边界。
全球领先的人工智能企业和研究团队正在致力于构建更优的生物领域垂直大模型。

🏷️

继续阅读

不仿真不VLA不遥操：它石智航重磅发布“能干活的通用具身大模型 ”AWE3.0
它石智航发布了全球首个具身大模型AWE3.0，具备毫米级精度和柔性物体感知能力，显著提升机器人在复杂环境中的作业能力，推动工业领域的具身智能应用。
在家跑 AI Agent 团队？一条隧道，手机随时管
文章介绍了如何通过 Cloudflare Tunnel 实现安全的远程访问家中 AI Agent。用户只需简单配置，即可通过网址管理 AI Agent，无...
修改 docker 中安装的 MySQL 的配置参数
发现MySQL的binlog文件占用大量磁盘空间，重启后binlog_expire_logs_seconds参数失效。通过创建自定义配置文件并挂载到Doc...
华人博士4个月干出具身独角兽！斯坦福家务机器人再融11亿，开建中国团队
斯坦福创立的Sunday Robotics完成1.65亿美元B轮融资，估值达11.5亿美元，成为独角兽。公司计划在真实家庭中进行机器人Memo的Beta测...
Tromjaro是一个自由贸易的Linux发行版，提供了丰富的功能
HUD是Ubuntu Unity桌面中的一项功能，用户可以通过点击应用程序并按热键来搜索菜单项并执行操作。
浅谈AI作为游戏玩法组成部分的可能性
电子游戏产业正经历转型，AI从辅助工具转变为核心玩法机制。新游戏如《Suck Up!》和《Vaudeville》尝试引入Agentic AI，但面临技术问...

1亿参数的细胞大模型来了！登Nature子刊，清华大学团队发布scFoundation：对2万基因同时建模

内容提要

关键要点

标签

继续阅读