本研究探讨叙事对大型语言模型(LLM)代理合作的影响,发现共同叙事显著提升合作效果,而不同叙事则导致自利行为。这一发现对多代理系统设计和人工智能对齐具有重要意义。
本研究探讨了直接偏好对齐算法(DPA)的技术和概念框架,提出了一种新的形式主义,通过离散推理问题正式化DPA损失,旨在指导人类与人工智能的对齐。
本文探讨了大型语言模型(LLMs)在社交互动和决策中的表现,发现其对人类行为的预测存在偏差,倾向于假设人类更理性。研究表明,LLMs的决策模型与人类对他人行为的理性预期一致,但与实际行为不符,揭示了模型的隐含偏见及其对人工智能对齐的影响。
完成下面两步后,将自动完成登录并继续当前操作。