小红花·文摘

本研究探讨了从大型语言模型输出中重建提示的方法，特别关注风格转换和改述。通过高质量基准数据集，发现一击和微调策略效果最佳，并指出传统句子相似性度量的不足，推动了输入提示恢复的研究进展。

StyleRec: A Benchmark Dataset for Prompt Recovery in Writing Style Transformation

BriefGPT - AI 论文速递 ·

这项研究探讨了大型语言模型中的不确定性量化，提出了新的度量标准以评估生成解释的可靠性。研究发现，口头化不确定性不可靠，而探测不确定性与解释忠实度相关。通过实证分析，提出了Two-phase Verification方法，旨在提高医学问答中的不确定性估计，结果显示该方法在准确性和稳定性上优于现有技术。

大语言模型中量化不确定性的问题改述：在分子化学任务中的应用

BriefGPT - AI 论文速递 ·