本文提出了一种用户可控机制,通过数值标签度量词汇重叠度和语义相似度,控制 LLM 对外部知识的依赖程度,实验证明该方法有效,强调了增强 LLM 的多功能性和准确性平衡的潜力。
本文提出了一种用户可控机制,通过在 LLM 训练的微调阶段引入一个代表生成回答中对参考知识忠实程度的数值标签,用户可以操作这一数值标签来控制 LLM 对外部知识的依赖程度。实验证明该方法适用且有效,能够增强 LLM 的多功能性同时保持创造性和准确性平衡。
完成下面两步后,将自动完成登录并继续当前操作。