机器之心 ·

NeurIPS 2024 | 数学推理场景下，首个分布外检测研究成果来了

💡 原文中文，约4100字，阅读约需10分钟。

📝

内容提要

AIxiv专栏介绍了首个数学推理场景下的分布外检测研究，提出了基于动态Embedding轨迹的TV Score算法，克服了传统方法的不足。研究表明，TV Score在离线和在线检测中表现优异，具备良好的泛化能力，适用于更复杂的推理任务。

🎯

🔎

分布外检测（OOD检测）在深度学习模型的实际应用中至关重要，尤其是在处理复杂的数学推理任务时。随着模型在现实世界中的应用增多，确保模型能够有效识别并处理分布偏移的数据，能够显著提高模型的安全性和可靠性。

TV Score算法通过动态Embedding轨迹进行OOD检测，克服了传统静态方法的局限性。其创新之处在于能够捕捉到数学推理场景中复杂的模式坍缩现象，从而提高了检测的准确性和泛化能力。这一方法为未来的研究提供了新的思路。

研究团队在多个数学推理数据集上验证了TV Score的有效性，结果显示其在离线和在线检测场景中均表现优异。这表明，针对特定任务设计的检测算法能够更好地适应不同的应用场景，未来可能会推动更多领域的OOD检测研究。

❓

TV Score算法是一种基于动态Embedding轨迹的分布外检测算法，主要用于数学推理场景下的OOD检测。

传统方法的静态Embedding在数学推理场景中不可行，无法有效捕捉复杂的输入输出关系。

TV Score的计算分为三个步骤：拟合高斯分布、计算马氏距离和获取样本的轨迹波动率得分。

TV Score在离线检测中AUROC指标提高了10个点以上，在线检测中也展现出优秀的判别准确度。

TV Score在任务和场景泛化测试中表现良好，适用于多种输出空间满足模式坍缩特性的场景。

分布外检测可以防止模型在遇到分布偏移数据时产生不可控输出，确保模型在现实世界中的安全部署。

🏷️