小红花·文摘

谷歌AI推出Gemini 3.1 Flash Live，帮助开发者构建实时语音和视觉代理。该模型提升了对话自然性和响应速度，支持90多种语言，并能在嘈杂环境中更好地执行任务。开发者可通过Gemini Live API集成，增强应用交互体验。

使用Gemini 3.1 Flash Live构建实时对话代理

The Keyword ·

亚马逊新模型Nova Sonic，助力AI语音对话更自然

全球TMT-美通国际 ·

本研究提出了“机器人战争”框架，利用大型语言模型模拟电话诈骗对抗，展示了GPT-4在对话自然性和角色真实感方面的优势，具有重要意义。

进化的机器人战争：在反击电话诈骗中的竞争大型语言模型的协调

BriefGPT - AI 论文速递 ·

OpenAI 最近推出的 GPT-4.5 模型用户反馈不一，失望情绪明显。尽管在情感共鸣和对话自然性上有所提升，但相较于前代产品改进有限，且高昂的订阅和 API 费用让普通用户难以接受。用户对该模型的价值表示怀疑。

GPT-4.5 发布——期待与失望并存

dotNET跨平台 ·

该研究开发了智能助手TalkTive，利用backchanneling技术帮助老年人评估神经认知障碍。研究发现，主动反馈更受欢迎，并探讨了非语言提示在社交机器人中的应用，以提升机器人的共情能力和互动质量。通过整合大型语言模型，研究旨在改善机器人对话的自然性和趣味性，强调情感交流在机器人与人类互动中的重要性。

在线对话促进中的机器人回声：跨代研究

BriefGPT - AI 论文速递 ·