中科院计算所团队提出CarbonNovo,基于AI进行蛋白质结构和序列的端到端从头设计

中科院计算所团队提出CarbonNovo,基于AI进行蛋白质结构和序列的端到端从头设计

💡 原文中文,约3700字,阅读约需9分钟。
📝

内容提要

中国科学院计算所张海仓团队提出了CarbonNovo,是第一个针对所有蛋白质家族的结构-序列联合设计模型,通过多种技术提高了训练和推断效率。CarbonNovo在性能评测中显著超过其他设计模型,并展示了在蛋白质结构插值方面的应用。该研究为AI蛋白质设计和药物设计领域提供了新的方法。

🎯

关键要点

  • 中国科学院计算所张海仓团队提出了CarbonNovo,首个针对所有蛋白质家族的结构-序列联合设计模型。
  • CarbonNovo以端到端的方式设计蛋白质主链结构和序列,显著提高了训练和推断效率。
  • AI蛋白质设计得益于AlphaFold 2模型和AIGC技术的突破,提升了设计成功率和效率。
  • 传统的两阶段设计框架存在序列设计模块过拟合和缺乏交互的问题。
  • CarbonNovo通过network recycling技术引入蛋白质语言模型,利用天然蛋白质序列数据的先验信息。
  • CarbonNovo建立了蛋白质结构和序列的联合能量模型,采用扩散模型和Potts模型进行设计。
  • 性能评测显示CarbonNovo在可折叠性、多样性和新颖性等指标上显著优于传统模型。
  • 在不同长度的蛋白质设计中,CarbonNovo的性能随着蛋白质长度增加而显著提升。
  • 消融实验表明语言模型对CarbonNovo性能贡献最大,能量基础的序列设计模块也显著提升性能。
  • CarbonNovo实现了蛋白质结构的插值,展示了其在蛋白质设计领域的创新应用。
  • CarbonNovo可扩展到蛋白质复合物设计和条件设计,团队正在与生物实验室合作验证其设计成果。
➡️

继续阅读