小红花·文摘

本研究提出了一种视觉语言模型对话游戏，通过自我对弈生成高质量的图像和文本数据，解决了训练数据不足的问题，显著提升了下游任务的性能，具有广泛的应用潜力。

视觉语言模型对话游戏自我提升

BriefGPT - AI 论文速递 ·

本研究探讨了语言在战略互动中的重要性，提出“对话游戏”作为一种多阶段博弈，强调语言交互的核心作用。通过“裁决游戏”，验证了战略代理相较于简单代理的优势，填补了相关研究的空白。

Conversation Games and a Strategic Perspective on the Turing Test

BriefGPT - AI 论文速递 ·

本文探讨了通过目标驱动的对话游戏评估大型语言模型（LLMs）的方法，重点分析了模型在横向思维和解决复杂问题方面的能力。研究显示，现有模型与人类在这些能力上存在显著差距，并提出了改进提示方法以提升模型表现的建议。作者通过案例研究列出了设计高质量AI系统认知评估的指导方针，旨在推动AI心理学领域的最佳实践发展。

弱评估-强评估：通过情境难题评估和引导大型语言模型的侧向思维

BriefGPT - AI 论文速递 ·