小红花·文摘

Measure Zero ·

实时互动网 ·

The New Stack ·

OpenAI的GPT-4.5模型目前仅限于每月200美元的订阅，许多人认为这不公平。用户可以通过OpenAI平台以每次请求约0.20美元的价格访问该模型，需创建账户并充值5至10美元。尽管使用成本较低，但仍需谨慎选择使用时机。GPT-4.5在准确性和对话质量上优于其他模型。

KDnuggets ·

本研究提出了GuideLLM，旨在提升大型语言模型（LLM）在自传访谈中的对话引导能力。通过目标导航、上下文管理和同理心参与三个组成部分，GuideLLM显著提高了对话质量和自传生成效果，优于基线LLM。

BriefGPT - AI 论文速递 ·

DEV Community ·

本研究提出了“多面心理技能”对话数据集，以解决大型语言模型在复杂社交对话中的技能规划问题。新模型“Thanos”显著提升了对话质量，促进了利社会行为。

BriefGPT - AI 论文速递 ·

本研究提出了一个新的基准，用于评估语言模型的角色扮演能力。通过模拟用户动态对话和评估对话质量，构建了包含玩家模型、询问者模型和评估模型的框架。实验结果显示，自动评估与人类标注之间存在强相关性，为语言模型在互动场景中的能力评估奠定了基础。

BriefGPT - AI 论文速递 ·

本文提出了多种对话系统评估指标，如USL-H、GRADE和PairEval，旨在提高对话质量评估的准确性和效率。这些方法结合了机器学习和语言模型，减少了人工评估的时间成本，并在不同数据集上表现出良好的相关性和鲁棒性。

BriefGPT - AI 论文速递 ·

本研究探讨了社交媒体新闻推送算法对在线对话质量的影响，发现新算法能够促进跨政治观点的建设性对话。同时，研究利用大型语言模型（LLM）模拟人类行为，揭示LLM代理人在竞争环境中自发建立合作关系，为社会现象提供了新的洞察。

BriefGPT - AI 论文速递 ·

本文介绍了SalesBot 2.0，利用大型语言模型缩小闲聊与任务导向对话的差距，构建新数据集以实现更自然的对话。提出的DOCTOR推理框架显著提升了对话质量，并探索了社交对话与任务导向对话的转换，支持商业机会。研究表明，使用新方法开发聊天机器人所需工作量减少，且具备良好的可扩展性。

BriefGPT - AI 论文速递 ·

本研究探讨社交媒体新闻推送算法对在线对话质量的影响，发现新算法能促进跨政治观点的建设性对话，但个性化模型可能导致情感极化和过滤泡沫。同时，研究分析了虚假新闻的传播及其对用户的影响，强调大型语言模型在检测虚假信息中的潜力与局限性。

BriefGPT - AI 论文速递 ·