糖蛋白组学新方法,复旦开发基于Transformer和GNN的混合端到端框架,登Nature子刊

糖蛋白组学新方法,复旦开发基于Transformer和GNN的混合端到端框架,登Nature子刊

💡 原文中文,约1800字,阅读约需5分钟。
📝

内容提要

研究人员提出了基于深度学习的框架DeepGP,用于预测糖肽的MS/MS光谱和保留时间。该框架由Transformer和图神经网络组成,能够捕获糖结构和预测糖离子强度。研究人员验证了DeepGP在小鼠和人类样本数据集上的高精度。该研究为糖蛋白质组学提供了新的预测方法。

🎯

关键要点

  • 蛋白质糖基化是重要的翻译后修饰,影响细胞的生理和病理功能。
  • 糖蛋白质组学研究蛋白质糖基化,利用液相色谱与串联质谱技术获取相关信息。
  • 当前糖蛋白质组学的数据库搜索方法难以确定聚糖结构,光谱库构建复杂。
  • 复旦大学研究人员提出DeepGP框架,结合Transformer和图神经网络,预测糖肽的MS/MS光谱和保留时间。
  • DeepGP模型通过两个图神经网络模块捕获糖结构和预测糖离子强度,并实施预训练策略。
  • 糖基化影响超过50%的哺乳动物蛋白质,导致糖肽异构体多样性,增加识别难度。
  • 液相色谱串联质谱是主要技术,但仅靠质荷比不足以确定糖结构,光谱匹配方法提高识别灵敏度。
  • DeepGP框架由预训练的Transformer模块和两个图神经网络模块组成,能够处理糖肽的多种特征。
  • 研究评估了三种GNN架构,GCN在糖嵌入任务中表现最佳,GIN在B/Y离子强度预测中表现优异。
  • DeepGP使用无标注的自然语言数据进行预训练,提高模型在小规模标注数据上的表现。
  • 研究人员在小鼠和人类样本数据集上验证了DeepGP的高精度预测。
  • DeepGP在合成和生物数据集上的基准测试验证了其有效性,并可提高糖肽检测灵敏度。
➡️

继续阅读