ProteinGPT:用于蛋白质属性预测和结构理解的多模态大型语言模型
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
通过创新的预训练框架,提出了一个统一的蛋白质语言模型xTrimoPGLM,能够同时处理蛋白质理解和生成任务。xTrimoPGLM具有超过1000亿个参数和1万亿个训练标记的规模,在18个蛋白质理解基准测试中优于其他基准。它能够提供蛋白质结构的原子分辨率视图,并超越现有基于语言模型的工具的3D结构预测能力。此外,xTrimoPGLM可以生成全新的蛋白质序列,并在精调后进行可编程的生成。这些结果凸显了xTrimoPGLM在蛋白质科学中的重要意义。
🎯
关键要点
-
提出了统一的蛋白质语言模型xTrimoPGLM,能够处理蛋白质理解和生成任务。
-
xTrimoPGLM拥有超过1000亿个参数和1万亿个训练标记的规模。
-
在18个蛋白质理解基准测试中,xTrimoPGLM优于其他先进基准。
-
能够提供蛋白质结构的原子分辨率视图,超越现有工具的3D结构预测能力。
-
可以生成全新的蛋白质序列,并在精调后进行可编程的生成。
-
xTrimoPGLM在蛋白质科学中的重要意义和多功能性得到了凸显。
➡️