SimpleFold是首个基于流匹配的蛋白质折叠模型,使用通用变换器层,训练规模达到3B参数,超越现有基准,挑战复杂架构依赖,推动蛋白质结构预测进展。
蛋白质在生命活动中至关重要,但传统研究面临高成本和效率低下的挑战。近年来,AI和大数据技术的进步为蛋白质智能计算体系的构建提供了新机遇,显著提升了蛋白质结构预测、功能注释和交互识别的效率,推动了药物发现和生命系统模拟的发展。
2025年3月22-23日,上海交通大学将举办AI蛋白质设计峰会,汇聚300多位专家学者,探讨AI在蛋白质设计中的应用。西湖大学的原发杰博士将分享蛋白质语言模型的研究进展,包括SaProt、ProTrek、Pinal和Evolla等,展示AI在蛋白质结构预测和设计中的重要性。
新加坡国立大学的张阳教授团队开发了深度学习框架DRfold2,显著提升了非编码RNA的三维结构预测精度,超越现有方法,为RNA结构解析提供了新计算手段,推动了分子生物学的发展。
自2018年AlphaFold问世以来,蛋白质结构预测领域取得显著进展。最新研究提出的AlphaFold-Metainference方法,通过结合AlphaFold预测的对齐误差与分子动力学模拟,成功构建了无序蛋白质结构集合,拓展了AlphaFold的应用,为无序蛋白质研究提供了新思路。
本研究提出了一种新的周期贝叶斯流方法CrysBFN,旨在解决晶体数据生成建模中的周期性物理对称性问题。实验结果表明,CrysBFN在晶体生成和结构预测任务中表现优异,显著提高了采样效率。
本研究提出了一种新框架,通过对比学习从输出训练数据中直接学习可微结构损失函数,以应对结构预测中的复杂性挑战。实验结果表明,该方法在性能上优于传统的预定义核方法。
今年诺贝尔化学奖授予三位科学家,表彰他们在蛋白质设计和结构预测方面的贡献。David Baker 开发了 Rosetta 软件用于蛋白质结构预测,Demis Hassabis 和 John Jumper 利用 AI 实现蛋白质结构预测。蛋白质是生命的化学工具,了解其结构有助于理解功能。AI 工具如 AlphaFold 和 RoseTTAFold 提升了研究,但实验仍不可替代。Baker 强调科学合作和科研成果商业化的重要性。
哈萨比斯、贝克和约翰·Jumper因在蛋白质设计和结构预测方面的贡献获得2024年诺贝尔化学奖。贝克创造了新型蛋白质,哈萨比斯和Jumper开发的AlphaFold 2解决了蛋白质结构预测难题。这一突破帮助科学家更好地理解抗生素耐药性和设计分解塑料的酶,展示了蛋白质作为生命化学工具的潜力。
北京大学、昌平实验室和哈佛大学的研究团队提出了ColabDock,一个通用框架,用于蛋白质-蛋白质对接的结构预测。ColabDock在复杂结构预测和抗体-抗原界面预测方面表现优于其他模型。该框架通过整合实验约束和蛋白质结构预测模型的能量景观,包含生成阶段和预测阶段。ColabDock在合成数据集和实验约束上取得了令人满意的性能,具有潜在的抗体设计应用价值。然而,ColabDock目前存在一些局限性,如对限制距离的限制和计算耗时较长。
洛桑联邦理工学院的研究团队开发了一种使用蛋白质语言模型的方法,可以预测蛋白质之间的相互作用。该方法在小型数据集上表现良好,并可改进蛋白质复合物的结构预测。研究人员已免费提供该方法,希望推动计算生物学的发展。该方法有助于了解疾病机制和开发治疗方法。
AlphaFold3是通过减少多序列比对的使用和引入扩散模块来进行结构预测的技术杰作。尽管具有更高的分辨率和预测相互作用的模型元素,但AlphaFold3的伪代码无法轻松重现模型,引发了科学界的批评。AlphaFold3的发布提醒学术界依赖科技公司开发和分发工具的风险。尽管弥补了一些缺陷,但由于封闭源和幻觉的限制,AlphaFold3不会对社区产生同样的影响。
研究发现,将概率模型与约束解码方法相结合可以提高结构预测性能。Lazy-$k$ 是一种新的解码方法,提供了解码时间和准确性之间更大的灵活性。约束解码方法在使用较小模型时尤其有效。
本文研究了结构预测任务中的模型更新回归问题,并探索了降低模型更新回归的技术。通过测量和分析不同模型更新设置下的情况,提出了一种名为“Backward-Congruent Re-ranking (BCR)”的简单有效方法,该方法比模型集成和知识蒸馏更好地缓解了模型更新回归问题。
完成下面两步后,将自动完成登录并继续当前操作。