小红花·文摘

语言模型微调的温和介绍

MachineLearningMastery.com ·

移远通信“飞鸢AIoT大模型应用算法”赋能AI玩具方案落地

全球TMT-美通国际 ·

ChatGPT是如何生成听起来自然且像人类的文本的？

DEV Community ·

本研究提出GraphTOD框架，旨在解决传统任务导向对话系统对高质量数据集的需求和成本问题。通过用户以JSON格式指定转移图，简化了对话生成过程，显著降低了数据集创建的成本和复杂性。

Generating End-to-End Synthetic Task-Oriented Dialogues Using Graph Structures and Large Language Models

BriefGPT - AI 论文速递 ·

本研究提出了一种新框架，通过分析Reddit的长篇日记条目生成个性化对话，克服了现有模型对静态人格的依赖。研究表明，基于大五人格特质的对话生成在个性捕捉上提高了11%，显著优于传统方法。

Beyond Discrete Personas: Personality Modeling Through Intensive Conversations in Journals

BriefGPT - AI 论文速递 ·

本文探讨了基于场景的对话研究，介绍了RoleCraft-GLM和PSYDIAL等项目，旨在提升个性化对话生成的质量。研究表明，细致的角色描绘和环境上下文能够增强对话的真实感和情感共鸣，从而提高用户参与度。此外，提出了新的评估框架，以评估语言模型在角色扮演中的表现，推动对话型人工智能的发展。

MCPDial：一个基于角色的Minecraft对话数据集

BriefGPT - AI 论文速递 ·

本文介绍了PhotoBook数据集，研究对话历史共享信息对对话模型的影响。提出了长期记忆对话模型（PLATO-LTM）和新的对话生成框架（ReBot），强调在多会话设置中理解上下文的重要性。通过Conversation Chronicles数据集，研究表明改进的对话系统在长期对话中表现出更好的连贯性和一致性。

共享记忆感知的开放领域长期对话数据集：基于电影剧本的构建

BriefGPT - AI 论文速递 ·

本研究提出了“检索和记忆”框架，利用神经上下文感知检索和多解码器网络生成系统，提升了对话生成的连贯性和吸引力。实验验证了该框架在长期记忆对话中的有效性，并提出了新的记忆共享机制，显著提高了开放性问题的性能。

将时间表征融入大语言模型的动态记忆检索与管理

BriefGPT - AI 论文速递 ·

本文探讨了大型语言模型（LLMs）在对话生成中的表现，特别是ChatGPT与人类对话的比较。研究发现，LLMs在语言处理上能够模仿人类，但在可变性和真实性方面仍存在差距。尽管LLMs在社交过程和情感表达上表现良好，但在情感内容上与人类没有显著差异。此外，研究提出了有效AI对话的原则，强调了对话中的关怀建模挑战。

尝试成为人类：语言模型中随机共情的语言痕迹

BriefGPT - AI 论文速递 ·

本文介绍了多种新型记忆机制和系统，如MemoryBank、RecallM、MemGPT和MemoDroid，旨在提升大型语言模型（LLM）在长期交互中的表现。这些机制有效改善了对话生成、情境感知和用户体验，同时也提出了伦理挑战和评估框架，以应对AI助手的潜在风险。

MemSim：用于评估基于LLM的个人助理记忆能力的贝叶斯模拟器

BriefGPT - AI 论文速递 ·

本文探讨了检索增强生成（RAG）技术在自然语言处理中的应用，提出了多种新方法和框架以提升大型语言模型的性能。研究表明，结合检索系统与语言模型可显著改善对话生成、文本摘要和机器翻译等任务的效果，并提出了新的数据集以应对模糊查询和时间事件查询的挑战，推动了RAG代理的发展。

渐进式检索增强生成方法在具身日常任务规划中的应用

BriefGPT - AI 论文速递 ·

本文介绍了多种对话连贯性评估方法，包括基于知识图谱和机器学习的模型、抽象意义表示（AMR）等，旨在提升对话生成的质量和一致性。研究表明，这些方法在不同数据集上表现优异，能够有效评估和改善对话系统的性能。

基于图模型的会话测试自动口语评估研究

BriefGPT - AI 论文速递 ·

本研究结合对象识别与自然语言表达，提出多种模型和方法以提升性能。通过评估多个数据集，验证了新方法在指代表达生成与理解上的优势，尤其在视觉推理和对话生成中表现突出。

视觉基础对话中的指代表达生成与话语意识理解指导

BriefGPT - AI 论文速递 ·

本文探讨了大型语言模型（LLMs）在对话生成和信息提取中的应用，介绍了多个数据集和框架，如ChatUIE和CoA，强调了LLMs在长对话和多轮对话中的挑战及改进空间。研究表明，尽管LLMs在某些任务上表现良好，但仍需提升其效率和可靠性，以满足未来的应用需求。

未知未知领域中的参与式人类学习

BriefGPT - AI 论文速递 ·

本文提出了一种基于常识的共情反应生成方法，结合用户情感和认知理解，实验结果表明其在生成共情性响应方面优于基线模型。研究引入了串行编码和情感-知识相互作用方法，显著提升了对话生成的表现，CAB框架和自适应模块的应用也改善了共情回应的质量，展示了该领域的创新进展。

基于因果感知的同理回应生成通过思维链微调

BriefGPT - AI 论文速递 ·

本文介绍了多种基于变分推断和高斯过程的模型及算法，旨在提升语音合成、文本分类和对话生成等任务的性能。研究内容包括自回归语音合成模型与变分自编码器的结合、半监督学习方法、变分循环自编码器和条件变分自动编码器，展示了在真实数据集上的有效性和优越性。

用变分状态空间模型并行化自回归生成

BriefGPT - AI 论文速递 ·

本文探讨了大型语言模型（LLM）在翻译、对话生成和文本分析中的应用，评估了ChatGPT和GPT-4的表现，发现其在多轮对话和文本分析中具有显著优势。同时，研究提出了DialogBench评估基准，强调了LLM在医疗健康领域的潜力和改进空间。

通过在人类循环中使用 LLMs 优化和评估检索增强型问答聊天机器人

BriefGPT - AI 论文速递 ·

本研究探讨了扩展检索方法在个性化大型语言模型中的应用，采用优化算法和预生成模型进行检索优化。通过大量实验，提出了数据增强策略和检索增强生成（RAG）方法，显著提升了模型在对话生成和医疗领域的性能，验证了其有效性和适用性。

个性化对话生成的检索增强学习

BriefGPT - AI 论文速递 ·

本文介绍了多种创新的对话生成和理解方法，如位置感知微调、自动评分模型、长期控制对话生成和个性化对话生成。这些方法在处理长上下文和评估对话性能方面表现出显著优势，推动了对话系统的自动评估和因果推理能力的发展。

长期对话中的因果知觉位置去偏微调

BriefGPT - AI 论文速递 ·

本文介绍了多种基于大规模语言模型的创新应用，包括BioGPT（生物医学）、SeqGPT（增强型）、PhoGPT（越南语）、GraphGPT（自我监督建模）、RecurrentGPT（文本生成）、GPT4Rec（推荐系统）、DialoGPT（对话生成）、VisualGPT（图像字幕）以及BookGPT（书籍推荐）。这些模型在各自领域展现了优越的性能和应用潜力。

RecGPT：文本推荐的生成式预训练

BriefGPT - AI 论文速递 ·