基因组的生成式AI:大型语言模型预测COVID变种特征

基因组的生成式AI:大型语言模型预测COVID变种特征

💡 原文英文,约700词,阅读约需3分钟。
📝

内容提要

GenSLMs是一种大型语言模型,能够生成与SARS-CoV-2病毒相似的基因序列。该模型由Argonne国家实验室、NVIDIA和芝加哥大学等研究机构和商业合作伙伴开发。GenSLMs能够生成序列并对COVID基因组进行分类和聚类。该模型的研究团队去年在SC22超级计算会议上获得Gordon Bell特别奖。

🎯

关键要点

  • GenSLMs是一种大型语言模型,能够生成与SARS-CoV-2病毒相似的基因序列。
  • 该模型由Argonne国家实验室、NVIDIA和芝加哥大学等研究机构和商业合作伙伴开发。
  • GenSLMs能够生成序列并对COVID基因组进行分类和聚类。
  • 研究团队在SC22超级计算会议上获得Gordon Bell特别奖。
  • GenSLMs能够解释长串核苷酸序列,理解基因组不同区域之间的关系。
  • 用户可以选择不同的COVID变种,了解AI模型如何追踪病毒基因组中的突变。
  • 该模型的训练数据包括超过1.1亿个原核基因组序列和约150万个COVID病毒序列。
  • 未来,GenSLMs可以针对其他病毒或细菌的基因组进行微调,支持新的研究应用。
  • 研究团队使用NVIDIA A100 Tensor Core GPU超级计算机进行模型训练。
  • 该研究得到了美国能源部科学办公室和国家核安全局的支持。
➡️

继续阅读