小红花·文摘

本研究提出了一种新方法，结合软提示调优与差分进化，解决大语言模型（LLM）对齐中缺乏文化维度的问题，显著提升了LLama-3-8B-Instruct在多个地区的文化对齐效果。

Achieving Cultural Alignment in Large Language Models through Soft Prompt Tuning

BriefGPT - AI 论文速递 ·

本研究分析了大语言模型（LLMs）在文化对齐评估中使用封闭式选择调查的局限性，并提出了更灵活真实的评估方法。结果表明，LLMs在开放环境中表现更佳，呼吁建立更完善的评估框架。

打破选择框：挑战大语言模型文化对齐的封闭式评估

BriefGPT - AI 论文速递 ·

本文探讨大型语言模型（LLMs）中的对齐问题，强调人类价值的多样性对模型的影响。研究比较了不同文化背景下LLMs的表现，提出了文化对齐测试（Cultural Alignment Test，CAT）和CultureLLM，以解决文化不匹配问题。结果显示，GPT-4在理解美国文化方面表现最佳，且CultureLLM在文化相关数据集上优于其他模型。研究强调多语言预训练数据集的平衡性，以增强LLMs的文化适应性和安全性。

自我对齐：通过上下文学习改善大型语言模型中的文化价值观对齐

BriefGPT - AI 论文速递 ·