本文提出了一种用户可控机制,通过在 LLM 训练的微调阶段引入一个代表生成回答中对参考知识忠实程度的数值标签,用户可以操作这一数值标签来控制 LLM 对外部知识的依赖程度。实验证明该方法适用且有效,能够增强 LLM 的多功能性同时保持创造性和准确性平衡。
正在访问的资源需要验证您是否真人。
或在微信中搜索公众号“小红花技术领袖”并关注
第二步:在公众号对话中发送验证码: