糖蛋白组学新方法,复旦开发基于Transformer和GNN的混合端到端框架,登Nature子刊

糖蛋白组学新方法,复旦开发基于Transformer和GNN的混合端到端框架,登Nature子刊

💡 原文中文,约1800字,阅读约需5分钟。
📝

内容提要

研究人员提出了基于深度学习的框架DeepGP,用于预测糖肽的MS/MS光谱和保留时间。该框架由Transformer和图神经网络组成,能够捕获糖结构和预测糖离子强度。研究人员验证了DeepGP在小鼠和人类样本数据集上的高精度。该研究为糖蛋白质组学提供了新的预测方法。

🎯

关键要点

  • 蛋白质糖基化是重要的翻译后修饰,影响细胞的生理和病理功能。
  • 糖蛋白质组学研究蛋白质糖基化,利用液相色谱与串联质谱技术获取相关信息。
  • 当前糖蛋白质组学的数据库搜索方法难以确定聚糖结构,光谱库构建复杂。
  • 复旦大学研究人员提出DeepGP框架,结合Transformer和图神经网络,预测糖肽的MS/MS光谱和保留时间。
  • DeepGP模型通过两个图神经网络模块捕获糖结构和预测糖离子强度,并实施预训练策略。
  • 糖基化影响超过50%的哺乳动物蛋白质,导致糖肽异构体多样性,增加识别难度。
  • 液相色谱串联质谱是主要技术,但仅靠质荷比不足以确定糖结构,光谱匹配方法提高识别灵敏度。
  • DeepGP框架由预训练的Transformer模块和两个图神经网络模块组成,能够处理糖肽的多种特征。
  • 研究评估了三种GNN架构,GCN在糖嵌入任务中表现最佳,GIN在B/Y离子强度预测中表现优异。
  • DeepGP使用无标注的自然语言数据进行预训练,提高模型在小规模标注数据上的表现。
  • 研究人员在小鼠和人类样本数据集上验证了DeepGP的高精度预测。
  • DeepGP在合成和生物数据集上的基准测试验证了其有效性,并可提高糖肽检测灵敏度。

延伸问答

DeepGP框架的主要功能是什么?

DeepGP框架用于预测糖肽的MS/MS光谱和保留时间,结合了Transformer和图神经网络。

糖蛋白质组学研究的主要技术是什么?

糖蛋白质组学主要利用液相色谱与串联质谱技术获取相关信息。

DeepGP如何提高糖肽检测的灵敏度?

DeepGP通过结合数据库搜索和深度学习模型,提高了糖肽的检测灵敏度。

DeepGP模型的预训练策略有什么作用?

预训练策略使DeepGP在面对小规模标注数据时表现得更好,提升了模型的知识基础。

研究中评估了哪些图神经网络架构?

研究评估了图卷积网络(GCN)、图同构网络(GIN)和图注意网络(GAT)三种架构。

糖基化对哺乳动物蛋白质的影响有多大?

糖基化影响超过50%的哺乳动物蛋白质,关键作用于多种生理和病理过程。

➡️

继续阅读