结合ESM-2,杜克大学开发高效PTM感知蛋白质语言模型,实现新SOTA

结合ESM-2,杜克大学开发高效PTM感知蛋白质语言模型,实现新SOTA

💡 原文中文,约3500字,阅读约需9分钟。
📝

内容提要

杜克大学和西湖大学的研究人员开发了PTM-Mamba,这是一种能够同时建模野生型和翻译后修饰(PTM)序列的蛋白质语言模型。该模型通过双向Mamba块和新门控机制,增强了对PTM的理解,支持疾病关联和药物可药性预测等任务。研究表明,PTM-Mamba在多个基准测试中优于现有模型,展示了其在生物学研究和精准治疗中的潜力。

🎯

关键要点

  • 杜克大学和西湖大学的研究人员开发了PTM-Mamba,一种PTM感知的蛋白质语言模型。

  • PTM-Mamba通过双向Mamba块和新门控机制增强了对翻译后修饰(PTM)的理解。

  • 该模型能够同时建模野生型和PTM序列,支持疾病关联和药物可药性预测等任务。

  • 研究表明,PTM-Mamba在多个基准测试中优于现有模型,展示了其在生物学研究和精准治疗中的潜力。

  • 研究团队整理了一个包含79,707个修饰序列的训练数据集,以验证模型的有效性。

  • PTM-Mamba采用双向建模,能够全面捕捉氨基酸和PTM的序列依赖关系。

  • 模型在疾病关联预测、成药性预测和PTM对蛋白质-蛋白质相互作用的影响等任务中表现优异。

  • PTM-Mamba能够准确预测特定残基的合理PTM,为生物学家提供新的见解。

  • 未来的工作将扩充训练数据集,并探索PTM修饰序列的结构预测。

延伸问答

PTM-Mamba模型的主要功能是什么?

PTM-Mamba模型能够同时建模野生型和翻译后修饰(PTM)序列,支持疾病关联和药物可药性预测等任务。

PTM-Mamba是如何提高对PTM的理解的?

PTM-Mamba通过双向Mamba块和新门控机制增强了对PTM的理解,能够全面捕捉氨基酸和PTM的序列依赖关系。

PTM-Mamba在基准测试中的表现如何?

研究表明,PTM-Mamba在多个基准测试中优于现有模型,显示出其在生物学研究和精准治疗中的潜力。

研究团队使用了什么样的数据集来训练PTM-Mamba?

研究团队整理了一个包含79,707个修饰序列的训练数据集,该数据集由Swiss-Prot数据库中的PTM记录构建而成。

PTM-Mamba在疾病关联预测中的表现如何?

在疾病关联预测中,PTM-Mamba的表现优于基线模型,能够捕捉识别疾病相关蛋白质的PTM特定效应。

未来的研究方向是什么?

未来的工作将扩充训练数据集,并探索PTM修饰序列的结构预测,以推动PTM-Mamba的应用。

➡️

继续阅读