小红花·文摘

本研究提出了一种基于范畴的解释函子的方法，以提高可解释人工智能的解释一致性和可靠性。验证结果表明，该方法在合成基准测试中有效减少了矛盾和不忠实的解释生成。

Logic Explanation of AI Classifiers through Categorical Explaining Functors

BriefGPT - AI 论文速递 ·

这项研究探讨了大型语言模型中的不确定性量化，提出了新的度量标准以评估生成解释的可靠性。研究发现，口头化不确定性不可靠，而探测不确定性与解释忠实度相关。通过实证分析，提出了Two-phase Verification方法，旨在提高医学问答中的不确定性估计，结果显示该方法在准确性和稳定性上优于现有技术。

大语言模型中量化不确定性的问题改述：在分子化学任务中的应用

BriefGPT - AI 论文速递 ·