基于大型语言模型的相关性判断中的提示敏感性的人机对比分析
📝
内容提要
本研究解决了大型语言模型(LLMs)在信息检索相关性判断中提示敏感性对可靠性和稳健性的影响。通过对不同模型与人类专家生成的提示进行系统比较,发现提示变化对模型与人类标签的一致性的影响,这为未来基于LLM的评估研究提供了数据支持和重要见解。
🏷️
标签
➡️