小红花·文摘 - 小红花技术领袖俱乐部

本研究提出NaVAB基准，评估大型语言模型与中国、美国、英国、法国和德国五国价值观的对齐度，旨在识别和减少价值冲突，提高全球适用性。

Benchmarking Multinational Value Alignment of Large Language Models

BriefGPT - AI 论文速递 ·

本研究提出了SOLAR框架，以解决大规模语言模型在个体主观性建模中的不足。该框架通过分析用户生成文本中的价值冲突和权衡，显著提升了推断结果和处理争议情境的能力，并解释了个体的价值偏好。

Characterizing Individual Subjectivity through Modeling Value Conflicts and Trade-offs

BriefGPT - AI 论文速递 ·

本研究评估了语言模型在高风险困境中的判断能力，特别是在复杂价值冲突中的表现。通过引入CLASH数据集，揭示了语言模型在模糊决策和价值转变理解方面的不足，准确率不足50%，强调了改进的必要性。

CLASH: Evaluating the Judgment Ability of Language Models in High-Stakes Dilemmas from Multiple Perspectives

BriefGPT - AI 论文速递 ·

本研究探讨了AI伴侣与用户之间的价值冲突，开发了名为Minion的技术探针，结合专家和用户的策略进行冲突解决。研究表明，参与者在274个任务中以94.16%的成功率有效解决了冲突，并提出了设计建议以减少冲突并增强用户自我解决能力。

Minion: A Technology Probe for Resolving Value Conflicts in AI Companion Applications through Expert-Driven and User-Driven Strategies

BriefGPT - AI 论文速递 ·