大型语言模型的人格对齐
原文中文,约500字,阅读约需2分钟。发表于: 。本研究解决了当前大型语言模型在体现个体用户独特特征和偏好方面的不足,提出了人格对齐的概念。通过构建包含30万名真实受试者的PAPI数据集,开发了一种激活干预优化方法(PAS),使得模型能够在仅用1/5优化时间的情况下,高效匹配个体的行为偏好,从而推动个性化人工智能的发展。
本研究发现,GPT-4驱动的聊天机器人能够从自由交互中推断人格特质,准确性优于从静态文本中推断的方法。在个性相关对话环境下表现最佳,用户体验相似。ChatGPT作为助手机器人准确性较低,但仍能捕捉人格特质信息。个性推断准确性在不同人口子群中差异轻微。LLMs在心理剖析中具有潜力。