权威期刊Cell Discovery新成果!上海交大洪亮团队提出CPDiffusion模型,超低成本、全自动设计功能型蛋白质

💡 原文中文,约4400字,阅读约需11分钟。
📝

内容提要

上海交大团队开发了CPDiffusion模型,通过低成本训练生成多样化蛋白质序列,成功设计出高活性内切核酸酶。该模型无需专家指导,自动识别保守区域,提高序列多样性,显著提升蛋白质活性,推动AI在生命科学中的应用。

🎯

关键要点

  • 上海交大团队开发了CPDiffusion模型,能够低成本生成多样化蛋白质序列。
  • CPDiffusion模型无需专家指导,自动识别保守区域,提高序列多样性。
  • 该模型显著提升蛋白质活性,成功设计出高活性内切核酸酶KmAgo和PfAgo。
  • 研究表明,生成的蛋白质序列在湿实验中以高成功率通过测试。
  • CPDiffusion模型结合蛋白质骨架结构和活性位点等多种生成条件。
  • 该研究为蛋白质工程提供了更多可能性,能够一次性改变数百个氨基酸。
  • 新型蛋白序列扩展了蛋白质家族的数据库,丰富了研究资源。
  • CPDiffusion模型通过CATH 4.2中的2万条野生型蛋白质进行训练,确保样本多样性。
  • 研究人员利用CPDiffusion框架设计新型pAgo蛋白,展示了其在DNA干扰中的重要作用。
  • CPDiffusion成功学习蛋白质序列的保守特征和表面性质,提升了生成序列的多样性。
  • 研究结果显示,生成的新KmAgo和PfAgo序列在活性和热稳定性上均优于野生型。
  • 洪亮教授团队长期关注AI在蛋白质设计中的应用,已发表多篇相关论文。
  • 深度学习在蛋白质设计中的应用将推动蛋白质工程的进一步发展。

延伸问答

CPDiffusion模型的主要功能是什么?

CPDiffusion模型能够低成本生成多样化的蛋白质序列,并自动识别保守区域,提高序列多样性。

CPDiffusion模型如何提升蛋白质活性?

该模型通过结合蛋白质骨架结构和活性位点等条件,生成的蛋白质序列在活性和热稳定性上显著优于野生型。

CPDiffusion模型的训练过程需要专家指导吗?

CPDiffusion的训练和推理过程几乎不需要专家指导,能够自动识别高度保守的区域。

CPDiffusion模型在实验验证中表现如何?

生成的蛋白质序列在湿实验中以高成功率通过测试,近90%的新序列具备DNA切割活性。

CPDiffusion模型对蛋白质工程的影响是什么?

该模型为蛋白质工程提供了更多可能性,能够一次性改变数百个氨基酸,扩展蛋白质家族的数据库。

CPDiffusion模型是如何处理蛋白质序列的?

模型通过前向扩散和逆向扩散阶段,逐步去噪并生成新的蛋白质序列,结合多种生成条件。

➡️

继续阅读