小红花·文摘

机器之心数据服务现已上线，提供高效稳定的数据获取服务，帮助用户轻松获取所需数据。

突破高分辨率图像推理瓶颈，复旦联合南洋理工提出基于视觉Grounding的多轮强化学习框架MGPO

机器之心 ·

MoCha：开启自动化多轮对话电影生成新时代

机器之心 ·

本研究提出了多轮多模态澄清问题（MMCQ），解决了传统方法无法捕捉复杂用户偏好的问题。通过构建ClariMM数据集和新型检索框架Mario，实验证明该方法在多轮澄清中提高了12.88%的MRR，尤其在长对话中效果显著。

多轮多模态问题澄清以增强对话理解

BriefGPT - AI 论文速递 ·

本研究解决了现有对话系统在多轮管理和功能调用方面的不足，提出了一种统一的语言模型CALM，能够同时处理对话能力和智能代理功能。通过开发CALM-IT多任务数据集，我们训练的模型在多个基准测试中表现优于现有行业特定模型，展示了其在实际应用中的潜在影响。

单一模型能否同时掌握多轮对话和工具使用？

BriefGPT - AI 论文速递 ·

本研究提出两种新方法，解决多轮意图分类中的数据稀缺和对话上下文复杂性问题，分类准确率提高5.09%，标注成本降低40%。

平衡多轮意图分类的准确性与效率：面向生产环境的LLM驱动对话系统

BriefGPT - AI 论文速递 ·

本文介绍了一种基于GPT-2的开放域对话模型，通过学习上下文与回复的隐式模式来提升回复质量。提出了改进的抽样方法和回复感知机制，使回复更具多样性和人类特征。实验结果表明，该模型在评估中优于基线模型。

多轮对话生成的静态与动态注意力框架

BriefGPT - AI 论文速递 ·

本研究提出了SegLLM，一种新型的多轮互动推理分割模型，通过对话记忆增强了大语言模型的分割能力。SegLLM在多轮任务中的性能提升超过20%，在单轮分割和定位任务中也有显著改善。

SegLLM：多轮推理分割

BriefGPT - AI 论文速递 ·

我们推出了LogicAsker，一种自动化方法，用于评估和提升大型语言模型的逻辑推理能力。在GPT-3、ChatGPT、GPT-4等模型上测试发现，逻辑推理错误率在25%到94%之间。LogicAsker的测试用例还能用于设计上下文学习示例，提高逻辑推理能力，例如GPT-4提升了10%。所有代码和数据将公开以支持未来研究。

WILT：一个多轮、记忆鲁棒的归纳逻辑基准测试

BriefGPT - AI 论文速递 ·

本研究提出了“自我控制器”框架，通过自我意识提升大型语言模型的推理能力。实验表明，该方法能有效控制文本长度，利用二分搜索加速生成，并通过上下文缓存技术降低计算成本，展现了在各基础模型中的一致性和可控性。

自我控制器：通过多轮逐步自我意识控制大型语言模型

BriefGPT - AI 论文速递 ·

通过修剪大型语言模型（LLM）的参数，可以提高其对Jailbreaking攻击的抵抗力。实验结果显示修剪有助于LLM集中注意力于与提示相关的标记。修剪作为提高LLM安全性的可推广方法具有潜力。

大型语言模型防御对多轮人类越狱攻击不够稳健

BriefGPT - AI 论文速递 ·

本文介绍了一种新的游戏搜索算法PN-MCTS，结合了Monte-Carlo树搜索和证明数搜索。实验结果表明，在不同的时间设置中，PN-MCTS在多个游戏领域中表现优于MCTS，其中Lines of Action的胜率高达96.2%。

胜利贪吃蛇：多轮ASP中的设计选择

BriefGPT - AI 论文速递 ·

研究人员创造了一个用于基础视觉聊天的数据集，并提出了一种模型设计来支持各种类型的视觉提示。实验结果表明，该模型在基准测试中表现优秀。

多轮多模态指称及锚定

BriefGPT - AI 论文速递 ·