小红花·文摘

构建《老友记》主题聊天机器人：探索亚马逊Bedrock进行对话优化

DEV Community ·

本研究提出了“多面心理技能”对话数据集，以解决大型语言模型在复杂社交对话中的技能规划问题。新模型“Thanos”显著提升了对话质量，促进了利社会行为。

Thanos: Enhancing Dialogue Agents with Psychological Skills in Language Models

BriefGPT - AI 论文速递 ·

ConvKGYarn：利用大型语言模型生成可配置和可扩展的对话知识图谱问答数据集

Apple Machine Learning Research ·

NormSAGE框架通过语言模型和自我验证机制，发现多语言文化规范，提升对话的相关性和准确性。研究表明，ChatGPT在不同文化背景下的适应性存在差异，尤其偏向美国文化。NormDial和ReNoVi等项目构建了高质量的对话数据集，探讨中美社会规范差异，并提出评估大型语言模型文化适应性的工具，强调文化包容性在AI中的重要性。

文化背景导向谈话的LLM-人类流程

BriefGPT - AI 论文速递 ·

本文探讨了领域外意图识别的方法，提出了基于Transformer的编码器微调、广义意图发现（GID）和自适应软伪标签（ASoul）等新技术。这些方法在多个对话数据集上显著提升了意图检测性能，尤其在多轮对话和超出预定义领域的任务中表现突出。通过对比学习和大型语言模型的应用，分析了当前技术的优势与挑战，为未来研究提供了指导。

基于多样性的通道原型学习用于分布外意图检测

BriefGPT - AI 论文速递 ·

本文介绍了多个大型语言模型（LLM）及其数据集的研究进展，如UltraChat、LMSYS-Chat-1M和WildChat，强调了通过对话数据集进行微调的有效性。同时，探讨了生成式语言模型在可视化和教育中的应用，提出了AI Threads和StuGPTViz等工具，以提升用户交互和教学效果。

WildVis：用于处理百万级聊天记录的开源可视化工具

BriefGPT - AI 论文速递 ·

本文探讨了如何利用大型语言模型（LLM）构建角色扮演对话数据集，并评估其角色扮演能力。研究开发了RoleBench和RoleInteract基准，涵盖多种角色和对话示例，揭示个体与群体互动中的表现差异。此外，提出了通过MORTISE改进角色对齐能力的策略，强调LLM在模拟人类行为和社会信念方面的潜力。

基于身份驱动的层次角色扮演代理

BriefGPT - AI 论文速递 ·

本文介绍了一种创建多模态对话数据集的方法，强调文本与图像结合的重要性。研究表明，上下文感知的理解方式可以提升对话质量。此外，提出了个性化展示和基于图片的对话任务，展示了多模态系统在推荐和解释生成中的潜力。

以意象为探索：探索一种用于对话推荐的多模态数据集

BriefGPT - AI 论文速递 ·

本文探讨了利用大型语言模型（LLM）生成个性化对话的研究，创建了多个对话数据集，如PersonalDialog和CPED，强调个性和情感在对话生成中的重要性。研究表明，基于个性特征的对话模型在多种情境下表现优越，推动了对话人工智能的发展。

基于个性化的大型语言模型的人工对话生成

BriefGPT - AI 论文速递 ·

文本风格转换在自然语言处理中越来越受欢迎。研究者使用预定义语义槽的对话数据集进行了风格转换技术的对比研究，发现改进的无监督方法LEWIS在任务中表现优于原始方法和基准方法。

英语和印地语中的文本去毒化作为风格转换

BriefGPT - AI 论文速递 ·

我们提出了一种新方法来增强大型语言模型（LLMs），通过训练知识矿工LLMiner自动从相关文档中提取问题和答案对，并将其与对话数据集结合来微调LLM，从而提升其在特定领域的专业知识和对话能力。该模型在新的评估基准上表现出显著的性能改进，并且只需要少量的种子实例，为LLMs通过模型合成的训练数据实现自我改善提供了可能性。

QuantAgent：通过自我提升的大型语言模型在交易中寻找圣杯

BriefGPT - AI 论文速递 ·

通过训练用户模拟器UserGPT和生成对话数据集RealChat，实验结果显示模型在Vicuna-Bench和MT-Bench中表现优于基线模型，并通过与LLaMA 2模型微调在MT-Bench中获得6.33的领先分数。方法还展示了可扩展性和可迁移性，并初步探索了训练集数据质量与模型性能之间的相互作用。

多用户聊天助手 (MUCA): 一种利用 LLMs 促进群组对话的框架

BriefGPT - AI 论文速递 ·

该文介绍了文本风格转换在自然语言处理中的应用，重点研究了各种方法的内容保留能力。作者创建了一个对话数据集，包含必须保留的预定义语义槽。作者对无监督方法 LEWIS 进行改进，在任务中取得了明显的优势。

文本事实传递

BriefGPT - AI 论文速递 ·

本文介绍了Conversation Chronicles数据集，用于实现长期对话设置。作者提出了一个对话模型ReBot，它表现出高人类参与度的长期上下文理解能力。

会话编年史：多会话对话中的多元时态与关系动力

BriefGPT - AI 论文速递 ·