小红花·文摘

本研究提出MUG-Eval框架，旨在解决大型语言模型在资源稀缺语言中的多语言生成评估问题，通过对话任务评估生成能力，提供高效解决方案。

MUG-Eval: A Proxy Evaluation Framework for Multilingual Generation Capability

BriefGPT - AI 论文速递 ·

Qwen团队发布的QwQ-32B模型拥有320亿参数，在代码生成和对话任务中表现优异，推理能力接近DeepSeek-R1。vLLM架构的更新提升了性能，支持高效部署。OpenManus项目为开发者提供低成本构建智能体的解决方案。

开源顶流集结！QwQ-32B 解锁多元玩法，OpenManus 低成本构建 AI 智能体！vLLM v1 赋能高效模型推理

HyperAI超神经 ·

本研究分析了多智能体系统在对话任务中的局限性，发现其在复杂推理任务中表现良好，但在基础任务中存在挑战，同时揭示了会话延续导致的对齐崩溃和决策公平性问题。

多智能体大语言模型在对话任务解决中的应用

BriefGPT - AI 论文速递 ·

本研究探讨了基于提示的少样本学习在对话任务中的应用，提出了一种无需微调的提示分类器，并创建了Few-Shot Bot聊天机器人。研究评估了ChatGPT在心理健康分析中的表现，发现情感提示能有效提升其性能。同时，引入了MentalManip数据集，分析心理操纵语言，指出现有模型在识别操纵性对话方面的不足。

通过先进提示技术增强对对话心理操控的检测

BriefGPT - AI 论文速递 ·

该论文介绍了一种名为KnowExpert的框架，将轻量级适配器注入预训练的语言模型中，实现知识驱动的对话任务。实验结果表明，该方法在开放领域闲聊场景中表现良好，推理效率高。

面向任务导向对话系统的双向反馈知识检索

BriefGPT - AI 论文速递 ·

InstructERC是一种新的情绪识别对话任务方法，通过生成性框架和多层次监督信息整合，达到了全面的SOTA水平。该方法引入了检索模板模块和情绪对齐任务，能够预测未来情绪趋势。

InstructERC: 用检索多任务 LLMs 框架改革对话中的情感识别

BriefGPT - AI 论文速递 ·