小红花·文摘

本研究探讨大型语言模型（LLMs）在检测冒犯性语言时的人类注释分歧，发现LLMs对分歧样本的信心与人类一致性相关，为改进检测提供指导。

BriefGPT - AI 论文速递 ·

研究显示，大型语言模型在语言生成质量评估中有潜力，但存在偏好偏向和对提示敏感的问题。为此，提出了ZEPO框架，提升评估公平性和与人类判断的一致性。ZEPO在无标定数据情况下表现出显著改进，强调了偏好公平性与人类一致性的重要性。

BriefGPT - AI 论文速递 ·