通过大型语言模型将专家知识整合到逻辑程序中
📝
内容提要
本研究针对大型语言模型 (LLMs) 在逻辑推理系统中有效整合专家知识的能力进行评估,特别是在工程领域的应用。提出的 ExKLoP 框架通过系统评估 LLM 生成的逻辑规则,发现尽管模型生成的代码几乎无语法错误,但在翻译专家知识时常会出现逻辑错误,迭代自我修正的效果有限。该框架为选择有效的自我修正系统模型提供了明确的评估平台,能显著改善系统安全和可靠性。
🏷️
标签
➡️