微妙偏见需要更微妙的度量：用于评估大型语言模型中代表性偏见和亲和偏见的双重度量

研究大型语言模型中的偏差，包括代表性偏差和亲和力偏差，引入了两种新的度量指标 —— 代表性偏差分数（RBS）和亲和力偏差分数（ABS），并提出了以检测这些微妙偏差为目标的创意生成套件（CoGS）。分析发现知名的大型语言模型存在明显的代表性偏差，偏向与白人、异性恋和男性相关的身份，同时亲和力偏差研究揭示了每个模型独特的评估模式，类似于...

大型语言模型偏差指数（LLMBI）是量化和解决大型语言模型中偏见的重要工具。通过复合评分系统，LLMBI系统地衡量和缓解可能影响模型响应的偏见。研究发现，LLMs在文本生成方面展示了令人印象深刻的能力，但存在不同程度的偏见。LLMBI提供了量化度量，用于比较不同模型和不同时期的偏见，并强调了持续监测和校准模型的必要性。