HyperAI超神经 ·

以不足10万结构数据训练，瑞士洛桑联邦理工提出PET-MAD，原子模拟精度媲美专业模型

💡 原文中文，约5800字，阅读约需14分钟。

📝

内容提要

电子结构是材料性能的关键。尽管第一性原理计算精确，但计算量大，难以模拟复杂过程。机器学习为原子尺度模拟提供了新路径，PET-MAD模型通过广泛的数据集和高效的网络结构，实现了高精度与低计算成本，提升了材料建模的普适性与效率。

🎯

🔎

PET-MAD模型的提出标志着机器学习在材料科学领域的应用进入新阶段。通过高效的网络结构和丰富的数据集，PET-MAD不仅降低了计算成本，还提高了模拟的普适性。这为材料研发提供了更为灵活的工具，尤其是在处理复杂的化学反应和材料特性时，机器学习的优势愈加明显。

MAD数据集的构建是PET-MAD模型成功的关键之一。它涵盖了85种元素和近10万个结构，确保了训练数据的多样性和一致性。然而，数据集的质量和覆盖范围仍然是通用模型性能的限制因素，未来需要持续优化数据生成策略，以应对更复杂的材料系统。

PET-MAD引入的低秩适配（LoRA）微调技术，能够在有限数据下提升模型性能，避免了传统微调可能导致的灾难性遗忘。这一技术的应用使得通用模型在特定化学体系中表现出色，展现了其在实际应用中的灵活性和可靠性，值得关注。

❓

PET-MAD模型通过广泛的数据集和高效的网络结构，实现了高精度与低计算成本，提升了材料建模的普适性与效率。

MAD数据集包含85种元素，近10万个结构，旨在为通用机器学习原子间势的训练提供高质量数据基础。

PET-MAD引入低秩适配技术，冻结基础模型的所有权重，仅在注意力模块中注入可训练的低秩矩阵，从而避免灾难性遗忘。

PET-MAD在多种应用案例中表现出色，能够以极少专属数据达到专用模型的精度，可靠预测离子输运、相变及表面反应等性质。

PET-MAD模型的训练基于帕累托前沿优化架构，使用256维的token表征和8头多头注意力机制，训练在8块NVIDIA H100 GPU上并行执行。

PET-MAD通过最后一层预测刚性方法分析模型在训练集上的隐藏特征协方差，来估计新预测的后验误差，几乎不产生额外计算成本。

🏷️