麻省理工学院和MIT-IBM Watson AI实验室的研究人员引入了一种名为“温度计”的校准方法,用于大型语言模型(LLMs)。该方法通过构建辅助模型来校准LLMs,提高校准响应和效率。温度计可以帮助用户识别模型过于自信的错误预测,并防止在可能失败的情况下部署该模型。研究人员还发现,温度计模型可以直接应用于较大的LLMs。未来,他们计划将温度计应用于更复杂的文本生成任务和更大的LLMs。
本研究提出多种去偏见方法,利用辅助模型、优化框架和对比学习等技术,旨在减轻机器学习中的社会偏见。实验结果表明,这些方法在准确性和去偏成本上优于现有技术,尤其在处理特定子群体和图像分类器偏见方面表现突出。
完成下面两步后,将自动完成登录并继续当前操作。