以不足10万结构数据训练,瑞士洛桑联邦理工提出PET-MAD,原子模拟精度媲美专业模型

以不足10万结构数据训练,瑞士洛桑联邦理工提出PET-MAD,原子模拟精度媲美专业模型

💡 原文中文,约5800字,阅读约需14分钟。
📝

内容提要

电子结构是材料性能的关键。尽管第一性原理计算精确,但计算量大,难以模拟复杂过程。机器学习为原子尺度模拟提供了新路径,PET-MAD模型通过广泛的数据集和高效的网络结构,实现了高精度与低计算成本,提升了材料建模的普适性与效率。

🎯

关键要点

  • 电子结构是理解材料性能的关键。
  • 第一性原理计算虽然精确,但计算量大,难以模拟复杂过程。
  • 机器学习为原子尺度模拟提供了新路径,降低了计算成本。
  • PET-MAD模型通过广泛的数据集和高效的网络结构,实现了高精度与低计算成本。
  • MAD数据集包含85种元素,近10万个结构,旨在为通用机器学习原子间势的训练提供高质量数据基础。
  • PET-MAD模型的训练采用了帕累托前沿优化架构,展现出优秀的拟合精度。
  • PET-MAD引入低秩适配技术,避免了灾难性遗忘,提升了模型的适应性。
  • PET-MAD通过最后一层预测刚性方法实现不确定性的量化,适合大规模原子模拟。
  • PET-MAD在多种应用案例中表现出色,能够以极少专属数据达到专用模型的精度。
  • MLIPs领域正在推动材料研发范式的变革,成为量子化学理论与产业应用的桥梁。

延伸问答

PET-MAD模型的主要优势是什么?

PET-MAD模型通过广泛的数据集和高效的网络结构,实现了高精度与低计算成本,提升了材料建模的普适性与效率。

MAD数据集包含哪些元素和结构?

MAD数据集包含85种元素,近10万个结构,旨在为通用机器学习原子间势的训练提供高质量数据基础。

PET-MAD模型如何避免灾难性遗忘?

PET-MAD引入低秩适配技术,冻结基础模型的所有权重,仅在注意力模块中注入可训练的低秩矩阵,从而避免灾难性遗忘。

PET-MAD模型在实际应用中表现如何?

PET-MAD在多种应用案例中表现出色,能够以极少专属数据达到专用模型的精度,可靠预测离子输运、相变及表面反应等性质。

PET-MAD模型的训练过程是怎样的?

PET-MAD模型的训练基于帕累托前沿优化架构,使用256维的token表征和8头多头注意力机制,训练在8块NVIDIA H100 GPU上并行执行。

PET-MAD模型如何实现不确定性的量化?

PET-MAD通过最后一层预测刚性方法分析模型在训练集上的隐藏特征协方差,来估计新预测的后验误差,几乎不产生额外计算成本。

➡️

继续阅读