本研究提出NaVAB基准,评估大型语言模型与中国、美国、英国、法国和德国五国价值观的对齐度,旨在识别和减少价值冲突,提高全球适用性。
本研究提出了SOLAR框架,以解决大规模语言模型在个体主观性建模中的不足。该框架通过分析用户生成文本中的价值冲突和权衡,显著提升了推断结果和处理争议情境的能力,并解释了个体的价值偏好。
本研究评估了语言模型在高风险困境中的判断能力,特别是在复杂价值冲突中的表现。通过引入CLASH数据集,揭示了语言模型在模糊决策和价值转变理解方面的不足,准确率不足50%,强调了改进的必要性。
本研究探讨了AI伴侣与用户之间的价值冲突,开发了名为Minion的技术探针,结合专家和用户的解决策略。参与者在274个任务中以94.16%的成功率有效解决了冲突,并提出了设计建议,以减少冲突并增强用户的自我解决能力。
完成下面两步后,将自动完成登录并继续当前操作。