PLM重大突破!上海交大与上海AI Lab最新成果入选NeurIPS 24,ProSST有效整合蛋白质结构信息
原文中文,约4900字,阅读约需12分钟。发表于: 。蛋白质作为生命体的关键分子,其序列决定结构,结构决定功能,蛋白质的功能与其三维结构紧密相关。数十年来,科学家们利用 X 射线晶体学、核磁共振等技术,解析了数千种蛋白质结构,为人们理解蛋白质功能提供了重要线索。然而,面对数百万级别的蛋白质数量,解析所有蛋白质结构的任务显得异常艰巨。。通过在海量未标记的蛋白质序列数据上进行学习,PLM...
蛋白质的功能与其三维结构密切相关。科学家们开发了预训练的蛋白质语言模型ProSST,结合结构信息以提高预测准确性。ProSST在1,880万蛋白质结构数据上预训练,采用解耦注意力机制,显著提升了热稳定性和金属离子结合等任务的预测性能,成为蛋白质研究的重要工具。