小红花·文摘

本研究提出了一种新颖的模型内部置信度估计器（MICE），用于校准工具使用代理的置信度。MICE通过解码语言模型的中间层来评估置信度，显著提高了工具调用的效率和置信度，具备高样本效率和零次泛化能力，适用于不同风险场景。