同时处理蛋白质主链和侧链信息,斯坦福等基于消息传递神经网络实现全原子结构建模
💡
原文中文,约6000字,阅读约需15分钟。
📝
内容提要
蛋白质侧链构象是氨基酸残基在三维空间中的排列。斯坦福大学团队提出的FAMPNN模型能够显式建模氨基酸的序列和侧链结构,显著提升蛋白质序列设计的质量和预测准确性。该模型结合图神经网络和改进的MPNN,处理主链与侧链信息,推动蛋白质工程和药物设计的发展。
🎯
关键要点
- 蛋白质侧链构象是氨基酸残基在三维空间中的排列。
- 斯坦福大学团队提出的FAMPNN模型能够显式建模氨基酸的序列和侧链结构。
- FAMPNN模型结合图神经网络和改进的MPNN,处理主链与侧链信息。
- FAMPNN显著提升蛋白质序列设计的质量和预测准确性。
- 研究成果以「Sidechain conditioning and modeling for full-atom protein sequence design with FAMPNN」为题,入选ICML 2025。
- 研究引入了一种结合交叉熵和扩散损失目标的方法。
- 研究实现了一种轻量级的迭代采样方法,用于从联合分布中生成样本。
- FAMPNN通过显式建模全原子结构,能够有效改进序列设计和实验蛋白质适应性预测的准确性。
- 研究团队采用复杂的多数据集进行训练和评估,确保模型的有效性和可靠性。
- FAMPNN在多个数据集上表现优于其他方法,显示出强大的泛化能力。
- 研究团队设计了预测侧链Packing误差的置信度模块,提升了模型的可解释性。
- FAMPNN在蛋白质适应性预测方面相较于仅基于主链的模型具有显著优势。
- 全球多个学术研究机构正在通过深度学习技术推动侧链建模的研究。
- 复旦大学的OPUS-Rota5和北京大学的GeoPacker等方法在侧链建模方面表现优异。
- 解码侧链构象对生命科学领域的发展至关重要,推动了结构生物学和计算生物学的进步。
➡️