Apple Machine Learning Research ·

通过信心标记学习路由大型语言模型

💡 原文英文，约200词，阅读约需1分钟。

📝

内容提要

大型语言模型（LLMs）在多种任务中表现优异，但在高风险环境中，了解其输出的可靠性至关重要。本文探讨了LLMs如何有效表达答案的信心，并提出了一种轻量级训练策略Self-REF，通过引入信心标记来提升答案准确性。研究表明，信心标记显著改善了后续任务中的路由和拒绝学习效果。

🎯

❓

在高风险环境中，系统可以根据答案的可信度选择将问题转发给其他专家或采取安全的默认行为。

Self-REF是一种轻量级训练策略，通过引入信心标记来提升大型语言模型答案的准确性。

信心标记显著改善了后续任务中的路由和拒绝学习效果，提升了答案的准确性。

大型语言模型通过引入信心标记来表达其答案的信心，并从中提取信心分数。

与传统方法相比，信心标记在后续的路由和拒绝学习任务中显示出显著改善。

大型语言模型在多种任务中表现优异，越来越多地应用于现实世界。

🏷️

献给计算机严谨细致的颂歌
文章探讨了计算机编程中的精确性与用户思维的关系。编程要求明确数据类型，促使开发者深思。然而，随着大型语言模型（LLMs）的出现，精确性减弱，用户可以更快实...
2026.06.02 16:44
网络流行文化通过缩短句子产生了“梗”，而大型语言模型则通过连词和副词的堆叠构建逻辑和情感。这种缩短与扩展的过程导致了准确性、意义和美感的缺失。
微软发布了Scout，这是一款基于OpenClaw构建的智能体
微软发布了Scout，一款基于OpenClaw的自主AI代理，能够在Microsoft 365中自动完成任务，如安排会议和管理日历。Scout标志着AI从...
《战神：劳菲》将登陆PS5
索尼在2026年6月的State of Play展示中宣布了新游戏《战神：劳菲》。玩家将控制角色Faye/Laufey，游戏风格与以往不同，强调魔法和空中...
工业软件领袖利用NVIDIA NemoClaw构建安全的自主AI工程师
在台北GTC大会上，NVIDIA展示了NemoClaw，旨在帮助工业软件公司构建自主AI工程师，显著缩短仿真工作时间。这些AI工程师通过自动化设计、仿真和...
《控制》续集将于九月发布
续集《控制共鸣》将于2026年9月24日发布，主角为迪伦·法登，故事将探讨法登兄妹的复杂过去。预购数字豪华版可提前48小时游玩，并附赠数字艺术书和游戏原声带。