小红花·文摘

本研究探讨了大型语言模型对提示表述变化的敏感性，提出了新任务“提示敏感性预测”，并设计了数据集PromptSET。研究表明，现有方法难以有效应对该预测，强调了准确表述信息以获得精准回复的重要性。

BriefGPT - AI 论文速递 ·

本研究探讨大型语言模型（LLMs）对提示敏感性的变化，提出ProSA框架来评估这一现象。引入新的敏感性度量标准PromptSensiScore，发现模型敏感性在不同数据集和模型间波动，大型模型展现出更强的鲁棒性，为提高用户满意度和评估准确性提供了重要工具。

BriefGPT - AI 论文速递 ·