蛋白质功能预测新SOTA,上海理工、牛津等基于统计的AI方法,登Nature子刊

蛋白质功能预测新SOTA,上海理工、牛津等基于统计的AI方法,登Nature子刊

💡 原文中文,约3200字,阅读约需8分钟。
📝

内容提要

牛津大学等研究团队设计了一种基于统计的图网络方法PhiGnet,用于蛋白质功能注释和功能位点识别。PhiGnet在性能上优于其他方法,即使没有结构信息也能缩小序列-功能差距。研究结果表明,将深度学习应用于进化数据可以突出残基级别的功能位点,为解释和研究蛋白质的特性和新功能提供支持。该研究发表在《Nature Communications》上。

🎯

关键要点

  • 牛津大学等研究团队设计了一种基于统计的图网络方法PhiGnet,用于蛋白质功能注释和功能位点识别。
  • PhiGnet在性能上优于其他方法,即使没有结构信息也能缩小序列-功能差距。
  • 研究结果表明,将深度学习应用于进化数据可以突出残基级别的功能位点。
  • 该研究发表在《Nature Communications》上,强调了蛋白质功能对健康、疾病和生物体功能理解的重要性。
  • 目前超过2亿种蛋白质仍未表征,计算方法依赖于蛋白质的结构信息。
  • 研究团队提出利用基于统计的图网络仅从蛋白质序列预测其功能,定量评估残基的重要性。
  • PhiGnet使用双通道架构的堆叠图卷积网络来注释蛋白质功能,包括酶委员会编号和基因本体术语。
  • 通过激活分数评估每个残基在特定功能中的重要性,PhiGnet能够精确定位功能位点。
  • PhiGnet在九种蛋白质中表现出良好的准确性,平均准确率超过75%。
  • 与其他最先进的方法相比,PhiGnet在功能注释的预测能力上表现优异。
  • PhiGnet的泛化稳健性在不同序列同一性阈值下表现良好,随着序列同一性的增加,预测性能提高。
  • 进化数据在PhiGnet中起着重要作用,能够准确分配蛋白质功能注释。
  • PhiGnet的成功在于利用蛋白质序列的进化数据和高阶模式,超越现有方法。
  • PhiGnet的局限性包括序列多样性较低的蛋白质家族中的偏差和噪音。

延伸问答

PhiGnet是什么?

PhiGnet是一种基于统计的图网络方法,用于蛋白质功能注释和功能位点识别。

PhiGnet的主要优势是什么?

PhiGnet在没有结构信息的情况下仍能缩小序列-功能差距,并在功能注释的预测能力上优于其他方法。

PhiGnet如何评估残基的重要性?

PhiGnet使用激活分数评估每个残基在特定功能中的重要性,从而精确定位功能位点。

PhiGnet的准确性如何?

在九种蛋白质中,PhiGnet的平均准确率超过75%,表现出良好的预测性能。

PhiGnet的局限性是什么?

PhiGnet在序列多样性较低的蛋白质家族中可能出现偏差和噪音,影响功能位点的识别。

PhiGnet的研究成果发表在哪里?

该研究成果发表在《Nature Communications》上。

➡️

继续阅读