权威期刊Cell Discovery新成果!上海交大洪亮团队提出CPDiffusion模型,超低成本、全自动设计功能型蛋白质
💡
原文中文,约4400字,阅读约需11分钟。
📝
内容提要
上海交大团队开发了CPDiffusion模型,通过低成本训练生成多样化蛋白质序列,成功设计出高活性内切核酸酶。该模型无需专家指导,自动识别保守区域,提高序列多样性,显著提升蛋白质活性,推动AI在生命科学中的应用。
🎯
关键要点
- 上海交大团队开发了CPDiffusion模型,能够低成本生成多样化蛋白质序列。
- CPDiffusion模型无需专家指导,自动识别保守区域,提高序列多样性。
- 该模型显著提升蛋白质活性,成功设计出高活性内切核酸酶KmAgo和PfAgo。
- 研究表明,生成的蛋白质序列在湿实验中以高成功率通过测试。
- CPDiffusion模型结合蛋白质骨架结构和活性位点等多种生成条件。
- 该研究为蛋白质工程提供了更多可能性,能够一次性改变数百个氨基酸。
- 新型蛋白序列扩展了蛋白质家族的数据库,丰富了研究资源。
- CPDiffusion模型通过CATH 4.2中的2万条野生型蛋白质进行训练,确保样本多样性。
- 研究人员利用CPDiffusion框架设计新型pAgo蛋白,展示了其在DNA干扰中的重要作用。
- CPDiffusion成功学习蛋白质序列的保守特征和表面性质,提升了生成序列的多样性。
- 研究结果显示,生成的新KmAgo和PfAgo序列在活性和热稳定性上均优于野生型。
- 洪亮教授团队长期关注AI在蛋白质设计中的应用,已发表多篇相关论文。
- 深度学习在蛋白质设计中的应用将推动蛋白质工程的进一步发展。
❓
延伸问答
CPDiffusion模型的主要功能是什么?
CPDiffusion模型能够低成本生成多样化的蛋白质序列,并自动识别保守区域,提高序列多样性。
CPDiffusion模型如何提升蛋白质活性?
该模型通过结合蛋白质骨架结构和活性位点等条件,生成的蛋白质序列在活性和热稳定性上显著优于野生型。
CPDiffusion模型的训练过程需要专家指导吗?
CPDiffusion的训练和推理过程几乎不需要专家指导,能够自动识别高度保守的区域。
CPDiffusion模型在实验验证中表现如何?
生成的蛋白质序列在湿实验中以高成功率通过测试,近90%的新序列具备DNA切割活性。
CPDiffusion模型对蛋白质工程的影响是什么?
该模型为蛋白质工程提供了更多可能性,能够一次性改变数百个氨基酸,扩展蛋白质家族的数据库。
CPDiffusion模型是如何处理蛋白质序列的?
模型通过前向扩散和逆向扩散阶段,逐步去噪并生成新的蛋白质序列,结合多种生成条件。
➡️