小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
面壁智能 SuperMate 升级:智能座舱正在从语音助手走向端侧 Agent丨北京车展

智能座舱的升级使其从传统语音助手转变为复杂的车载Agent,能够理解用户偏好并主动服务。面壁智能的SuperMate方案强调全场景服务和多模态交互,提升用户体验。新功能包括事故处理和儿童安全监测,旨在提供低干扰的智能服务。未来,汽车将成为具备AI能力的智能终端,连接用户生活与出行。

面壁智能 SuperMate 升级:智能座舱正在从语音助手走向端侧 Agent丨北京车展

爱范儿
爱范儿 · 2026-04-24T09:44:49Z

Cloudflare推出了Agents SDK的实验性语音管道,允许开发者为AI代理添加实时语音功能。通过@cloudflare/voice,用户可以实现语音交互,支持语音转文本和文本转语音,简化音频传输和处理流程,提升代理的多模态交互能力。

为您的代理添加语音功能

The Cloudflare Blog
The Cloudflare Blog · 2026-04-15T13:00:00Z
黄仁勋也站台的抱抱脸机器人卖爆了,背后公司竟来自中国

由中国矽递科技打造的桌面机器人Reachy Mini,具备多模态交互能力,销售火爆。该机器人为开源平台,支持开发者二次开发,旨在降低参与门槛,推动具身智能的发展。

黄仁勋也站台的抱抱脸机器人卖爆了,背后公司竟来自中国

量子位
量子位 · 2026-03-31T04:20:55Z
探索MCP Apps Protocol

MCP Apps是一个开源项目,旨在为AI聊天机器人提供交互式用户界面,支持在对话中嵌入图表和视频等组件,提升人机交互体验。通过MCP协议,开发者可以创建多种客户端的丰富应用,推动AI向多模态交互转变。

探索MCP Apps Protocol

dotNET跨平台
dotNET跨平台 · 2026-02-22T00:00:57Z

傅利叶在CES 2026展示了新一代人形机器人GR-3,强调人机交互的情感响应和多模态能力,旨在提供社交陪伴和辅助服务,推动人形机器人商业化进程。

傅利叶首秀CES 2026,全面展示“有温度”的人机交互

量子位
量子位 · 2026-01-06T06:54:30Z
GLM-4.7 可以平替 Claude Code 的国产编码大模型

GLM-4.7是智谱的最新旗舰模型,增强了编码能力和任务规划,支持多种思考模式和工具调用,适用于Agentic Coding和多模态交互,提升编程和视觉效果,生成高质量内容。

GLM-4.7 可以平替 Claude Code 的国产编码大模型

文武科技柜
文武科技柜 · 2026-01-01T13:08:40Z

科大讯飞在1024开发者节上展示了升级版星火大模型X1.5,强调AI应更好地理解用户需求。通过自主可控的国产技术,讯飞致力于提升AI的情感理解和多模态交互能力,推动AI从工具向智能伙伴转变,应用于教育、医疗等多个领域,提供更深的行业应用和个性化服务。

告别盲目卷参数!科大讯飞1024亮出底牌:all in“更懂你”

量子位
量子位 · 2025-11-06T13:33:46Z
版本速递 | 华为云Versatile智能体平台 新增特性介绍(2025年9月发布)

华为云Versatile智能体平台920版本新增27个特性,优化8个功能,支持多模态交互、敏感内容审查和风险控制,增强企业级特性,促进AI应用的开发与管理。

版本速递 | 华为云Versatile智能体平台 新增特性介绍(2025年9月发布)

华为云官方博客
华为云官方博客 · 2025-09-22T03:48:47Z
AI眼镜正在改写科技消费新格局

眼镜被认为是AI变革的关键,未来将成为人机交互的核心。预计到2025年,全球智能眼镜市场将显著增长,AI眼镜的功能将从翻译和拍照向多模态交互发展。小米、阿里等大厂积极布局,竞争激烈,推动技术与用户需求的深度融合。

AI眼镜正在改写科技消费新格局

TechWeb 全站精华
TechWeb 全站精华 · 2025-09-08T03:18:41Z
杜绝幻觉、拒绝谄媚,GPT-5的「路由革命」

GPT-5的发布标志着人工智能的新纪元,其核心突破在于动态资源分配的“路由系统”,提升了多模态交互能力。GPT-5在医疗、教育和商业领域展现出巨大潜力,并引入“安全补全”机制以降低AI幻觉率,增强用户信任。同时,通过个性化交互,GPT-5实现了更人性化的沟通,推动人机协作的发展。

杜绝幻觉、拒绝谄媚,GPT-5的「路由革命」

TechWeb 全站精华
TechWeb 全站精华 · 2025-08-09T06:51:47Z

千里科技与阶跃星辰、吉利在WAIC 2025发布了下一代智能座舱Agent OS,具备多模态交互、全融合地图和个性化记忆等功能,旨在提升用户体验,实现座舱从“工具”向“伙伴”的转变。

千里科技联手阶跃星辰、吉利发布下一代智能座舱Agent OS

量子位
量子位 · 2025-07-26T14:20:25Z

OpenDeepWiki 进行了重大更新,提升了用户界面和功能体验。新版本支持智能代码分析、文档生成和知识图谱创建,响应速度提升300%。新增AI对话系统和多模态交互功能,适用于团队协作和技术债务评估等场景。

颠覆性Code Agent工具OpenDeepWiki全面升级!一键为代码库注入AI智能体

dotNET跨平台
dotNET跨平台 · 2025-07-10T00:02:55Z

科大讯飞发布会展示了智能交互的新模式,强调人机交互从命令式转向深度智能协作。AI技术的进步使设备更自然地理解和响应用户情感,提升交互体验。讯飞的AIUI平台和机器人超脑平台实现多模态交互,推动智能硬件在儿童教育等领域的应用,展现未来人机协作的潜力。

智能交互终于步入真·人机交互时代了,这很讯飞

量子位
量子位 · 2025-06-13T05:22:25Z

豆包·播客模型由火山引擎推出,能够快速生成高质量的播客音频,语气自然,接近真人。用户操作简单,支持实时热点话题和长文本解读,具备情感理解和多模态交互能力,提升语音对话的效率与质量。

太逼真!豆包·播客模型来了:一句话生成「苏超联赛」播客,很懂13太保的梗

量子位
量子位 · 2025-06-09T08:36:13Z

谷歌发布了Gemma 3n,这是其最新的生成式AI模型,旨在手机等设备上离线运行。Gemma 3n具备音频、图像和文本理解能力,性能优于GPT-4.1 Nano。新架构优化了内存使用和计算效率,支持多模态交互,具备自动语音识别和多语言翻译功能,确保用户隐私。开发者可通过Google AI Studio和Google AI Edge集成该模型。

Gemma 3n:更智能、更快速、支持离线运行

KDnuggets
KDnuggets · 2025-05-22T12:00:19Z
人工智能聊天机器人的演变:到2025年实现类人互动

到2025年,聊天机器人将具备更高的情感智能和自然语言处理能力,能够理解复杂对话并满足人类需求。这将增强用户与AI的情感联系,可能替代部分人际关系,但也引发情感依赖和数据隐私等伦理问题。未来,AI将通过多模态交互进一步发展,促进人类理解与连接。

人工智能聊天机器人的演变:到2025年实现类人互动

DEV Community
DEV Community · 2025-05-12T08:32:34Z

本研究提出了一种多层融合与推理架构(MFRA),旨在解决视觉与语言导航中的复杂多模态交互问题。MFRA通过层次化机制显著提高了代理在导航场景中的决策准确性,优于现有方法。

Hierarchical Thinking and Dynamic Action: Hierarchical Multi-modal Fusion and Reasoning for Vision-and-Language Navigation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-23T00:00:00Z

博世在电动汽车百人会上表示,未来智能驾驶将实现语音交互,L4级别将成为标配,激光雷达不再必要。大疆展示个性化智驾方案,支持用户自定义驾驶风格。长安汽车强调多模态交互。博世建议主机厂与供应商合作,放弃自研中阶智驾。整体来看,智能驾驶正向更强算力和交互体验发展。

博世暴论震动百人会:FSD断代领先,智驾迟早标配没必要自研

量子位
量子位 · 2025-03-31T01:50:37Z

本研究提出了一个包含310K多图像多轮对话的数据集MMCR,解决了视觉语言模型在多轮对话中的数据不足问题。微调后的模型在上下文准确性上提高了5.2%,显著增强了多模态交互效果。

MMCR: Advancing Contextual Reasoning in Multimodal Multi-Turn Visual Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-24T00:00:00Z
谷歌Gemini的C# .Net多模态实时API

谷歌的Gemini模型支持实时多模态交互,开发者可通过Google_GenerativeAI SDK在C#中构建语音应用。新推出的Multimodal Live API利用WebSockets实现双向通信,支持文本和音频的动态交换,适合自然对话应用,具备实时通信和事件驱动架构等特点。

谷歌Gemini的C# .Net多模态实时API

DEV Community
DEV Community · 2025-03-22T23:39:12Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码