同时生成蛋白序列和结构,David Baker团队序列空间扩散新模型登Nature子刊

同时生成蛋白序列和结构,David Baker团队序列空间扩散新模型登Nature子刊

💡 原文中文,约2900字,阅读约需7分钟。
📝

内容提要

华盛顿大学David Baker团队开发了ProteinGenerator (PG),一种基于RoseTTAFold的模型,能同时生成蛋白质序列和结构。PG通过迭代去噪,以所需属性为指导,设计耐热蛋白质和生物活性肽。研究显示,PG在设计准确度上优于传统方法,能生成多状态和功能蛋白,并适应多种序列约束。PG还能设计含稀有氨基酸的蛋白质,展示了超越天然序列的能力。

🎯

关键要点

  • 华盛顿大学David Baker团队开发了基于RoseTTAFold的ProteinGenerator (PG)模型,能够同时生成蛋白质序列和结构。
  • PG通过迭代去噪生成序列和结构对,并以所需的蛋白质属性为指导。
  • PG在设计准确度上优于传统方法,能够生成多状态和功能蛋白,并适应多种序列约束。
  • PG能够设计含稀有氨基酸的蛋白质,展示了超越天然序列的能力。
  • PG可以轻松生成受到各种序列域约束的蛋白质,包括耐热蛋白质和生物活性肽。
  • 研究表明PG能够推理超出天然蛋白质样序列组成的序列-结构关系。
  • PG能够生成重复蛋白,只需给定重复单元的序列长度和重复次数。
  • PG设计的生物活性肽笼能够在特定条件下释放活性肽,具有潜在的治疗应用。
  • PG能够设计多状态父子蛋白质三元组,展示相同序列在不同结构条件下的折叠能力。
  • PG的生成方法能够利用丰富的序列结构先验信息,提高生成序列的折叠和功能可能性。
➡️

继续阅读