本研究探讨大型语言模型(LLM)在游戏中的随机性与策略适应能力。通过测试“石头剪子布”和“囚徒困境”,发现LLM倾向于非随机反应,并在重复博弈中形成损失厌恶策略,揭示其在战略决策中的局限性。
本研究探讨了说服技巧在虚假信息中的跨领域应用,发现不同领域的说服技巧存在显著差异,语言、心理和文化因素对策略的适应性影响显著,尤其在气候变化虚假信息中尤为明显。
本研究提出了一种对比提示集成(ConPE)框架,旨在解决化身强化学习智能体在未见视觉观察下的快速策略适应问题,利用预训练的视觉-语言模型实现高效的策略学习。
完成下面两步后,将自动完成登录并继续当前操作。