从符号到材料:利用语言模型推动科学发现
原文中文,约600字,阅读约需2分钟。发表于: 。本研究解决了材料科学中材料属性预测的不足,通过评估多种上下文嵌入方法和预训练模型,证明了专门针对材料的模型,特别是MatBERT,在从化合物名称和材料属性中提取隐含知识方面显著优于通用模型。研究发现,MatBERT的第三层信息密集嵌入,结合上下文平均方法,是有效捕捉材料属性关系的最佳方法,强调了针对材料科学的训练和文本处理的重要性。
本研究评估了多种上下文嵌入方法和预训练模型,以改善材料科学中的属性预测。结果显示,MatBERT模型在提取化合物名称和材料属性方面优于通用模型。研究指出,MatBERT的第三层嵌入结合上下文平均法是捕捉材料属性关系的最佳方法,强调了针对材料科学的训练重要性。