LLM4ED:大型语言模型用于自动方程式发现
原文中文,约500字,阅读约需2分钟。发表于: 。通过自然语言提示指导大型语言模型自动从数据中挖掘执法方程的新框架降低了学习和应用等式发现技术的难度,显示了大型语言模型在知识发现领域的应用潜力。
利用大型语言模型进行特定领域的数学推导是新兴研究方向。研究发现,fine-tuned FLAN-T5-large (MathT5) 在性能上超过了GPT模型。然而,fine-tuned模型对于未知符号的扰动更敏感。合成数据上训练模型可以提高其数学能力。
通过自然语言提示指导大型语言模型自动从数据中挖掘执法方程的新框架降低了学习和应用等式发现技术的难度,显示了大型语言模型在知识发现领域的应用潜力。
利用大型语言模型进行特定领域的数学推导是新兴研究方向。研究发现,fine-tuned FLAN-T5-large (MathT5) 在性能上超过了GPT模型。然而,fine-tuned模型对于未知符号的扰动更敏感。合成数据上训练模型可以提高其数学能力。