小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
SmoothConv & DuplexConv:面向对话式 AI的大规模中文全双工语音数据集开源!

全双工人机交互技术受到关注,ASLP实验室与上海元音矩阵科技公司联合开源了SmoothConv和DuplexConv两个中文长音频对话数据集。这些数据集包含真实对话场景,旨在支持语音大模型研发,提供高质量对话数据,涵盖教育和闲聊领域,助力全双工系统的中断与响应决策。

SmoothConv & DuplexConv:面向对话式 AI的大规模中文全双工语音数据集开源!

实时互动网
实时互动网 · 2026-06-12T03:03:31Z
为什么AI实时语音技术重要?哪些场景需要AI实时语音技术

AI实时语音技术提升了人机交互的效率和情感温度,语音沟通比文字交流更自然、快速,适用于客服、陪伴和教育等场景。它不仅提高了交互效率,还能传递情感,成为新的商业入口。未来,随着技术进步,AI实时语音的应用场景将不断扩展。

为什么AI实时语音技术重要?哪些场景需要AI实时语音技术

实时互动网
实时互动网 · 2026-06-08T08:26:07Z
[MAF预定义ChatClient中间件-02]FunctionInvokingChatClient——实现ReAct循环和人机交互的大功臣 - Artech

FunctionInvokingChatClient是IChatClient中的关键中间件,驱动Agent执行ReAct循环。ReAct通过分析问题并调用工具函数来解决复杂任务,并在敏感操作中引入人机交互审批流程,以确保用户同意后再执行。示例包括根据天气提供穿衣建议和银行转账的审批流程,确保操作的安全性和有效性。

[MAF预定义ChatClient中间件-02]FunctionInvokingChatClient——实现ReAct循环和人机交互的大功臣 - Artech

Artech
Artech · 2026-06-04T00:45:00Z
Google I/O 2026:Jeff Dean 携 DeepMind 众神宣告,AI Agent 正在终结“标准化软件”时代

在2026年Google I/O大会上,Jeff Dean和DeepMind团队宣布AI已进入“智能体时代”,将彻底改变软件开发和人机交互。AI将成为独立工作的“数字员工”,提升效率并提供异步任务控制。未来软件将根据用户需求实时生成,程序员需适应这一变化,利用AI工具提升创造力,转变为“建筑师”。

Google I/O 2026:Jeff Dean 携 DeepMind 众神宣告,AI Agent 正在终结“标准化软件”时代

Tony Bai
Tony Bai · 2026-05-30T22:11:55Z
京东JoyInside戴文军:AI的终极形态不是聊天,是融入你家每一件物品丨AIGC2026

京东科技戴文军提出“AI World”概念,强调硬件应主动适应用户需求,融入家庭生活。通过JoyInside,京东将AI技术应用于家居和玩具等设备,提升人机交互体验,解决家庭痛点,如陪伴孩子学习和家务。未来目标是广泛应用AI技术于各类终端,推动数字技术与物理世界的结合。

京东JoyInside戴文军:AI的终极形态不是聊天,是融入你家每一件物品丨AIGC2026

量子位
量子位 · 2026-05-25T09:37:05Z
苹果新专利:通过随机化音频反馈,让空间计算交互更自然

苹果公司于2026年申请了“声音随机化”专利,旨在改善XR头显等设备的音效体验。该技术通过为每个虚拟控件定义特征音频反馈,并随机调整音效,减少用户的听觉疲劳,强调音频在空间计算中的重要性,未来可能实现更智能的音频适配,提升人机交互效率。

苹果新专利:通过随机化音频反馈,让空间计算交互更自然

实时互动网
实时互动网 · 2026-05-19T06:25:55Z
重生之我在AI时代当老板:让一群Agent互相PUA

MiniMax推出了新Agent Mavis,采用团队协作模式,分为Leader、Worker和Verifier角色。用户只需提供目标,Agent Team会自动拆解任务并执行,从而显著提高效率,避免了单Agent的上下文焦虑和停顿问题。新架构使人机交互更像管理团队,提升了使用体验。尽管多Agent的成本较高,但在复杂任务中效果显著,MiniMax计划开源该技术。

重生之我在AI时代当老板:让一群Agent互相PUA

量子位
量子位 · 2026-05-14T11:14:25Z
杀死 ChatGPT 聊天框的,是「鼠标」

谷歌在Android Show上推出了“魔法指针”功能,旨在通过AI技术重新定义鼠标光标,使其具备“眼睛”和“大脑”。用户只需指向屏幕并发出指令,AI即可理解并执行,降低了交互成本。这项技术提升了人机交互的直观性,未来的AI将更贴近人类的自然沟通方式。

杀死 ChatGPT 聊天框的,是「鼠标」

爱范儿
爱范儿 · 2026-05-14T08:47:15Z
云知声 U2-ASR 2.5上线:覆盖七大方言体系,支持100种以上方言及地方口音识别转写

云知声推出的U2-ASR 2.5方言语音识别模型支持100种以上方言,识别准确率超过90%。该模型通过优化数据处理、解码和语义理解,将方言转化为规范普通话,广泛应用于政务、医疗和客服等领域。

云知声 U2-ASR 2.5上线:覆盖七大方言体系,支持100种以上方言及地方口音识别转写

实时互动网
实时互动网 · 2026-05-13T03:24:32Z
Markdown要凉…卡帕西也站HTML了

Anthropic工程师Thariq提出Markdown(MD)已不再适用,建议使用HTML作为替代。HTML在信息密度、可读性、分享便利性和交互性方面优于MD。尽管生成HTML的成本较高,但其提供的信息量和用户体验更佳。Thariq强调,随着AI的发展,文件格式设计应更适应AI需求,未来可能会重新审视人机交互的规则。

Markdown要凉…卡帕西也站HTML了

量子位
量子位 · 2026-05-12T07:08:08Z
AI 硬件时代,手机不会轻易的狗带|AI 器物志

智能手机在数字生态中占据主导地位,随着AI的发展,其角色将逐渐转变。AI需要持续感知物理世界,谷歌的Android 17 Beta 3推出了桌面模式,允许手机连接显示器,接近PC功能。未来手机将与AI硬件更紧密结合,成为数据中枢,推动人机交互的演变。

AI 硬件时代,手机不会轻易的狗带|AI 器物志

爱范儿
爱范儿 · 2026-05-08T10:00:41Z
看齐特斯拉!地平线也有了属于它的「FSD+Grok」

特斯拉推出的「Hey Grok」语音助手需每月支付9.99美元,但因硬件隔离无法完全控制车辆。地平线科技的新型5nm融合芯片提升了智能汽车的性能与安全性,其HSD系统能快速响应驾驶环境变化,用户体验显著改善。KaKaClaw操作系统支持自然语言控制,增强人机交互,未来智能汽车将更注重底层架构与用户需求的结合。

看齐特斯拉!地平线也有了属于它的「FSD+Grok」

爱范儿
爱范儿 · 2026-04-23T08:57:22Z

本文分析了Apple在macOS Tahoe中图标设计的缺陷,指出图标数量过多且缺乏一致性和清晰性,导致用户难以快速识别功能。作者认为图标应简洁且具辨识度,避免重复使用相同图标表示不同功能,整体设计未遵循人机交互原则,影响用户体验。

译文|Tahoe 的图标令人难评

少数派
少数派 · 2026-04-16T03:26:02Z
2026年ACM人机交互会议(CHI)

苹果将在2026年4月13日至17日在西班牙巴塞罗那的ACM人机交互会议(CHI 2026)上展示新研究,展位将提供AirPods Pro 3的互动演示,强调其人性化设计背后的研究,包括超过10,000个3D耳朵扫描和100,000小时的用户研究,旨在促进关于可穿戴设备设计的讨论。

2026年ACM人机交互会议(CHI)

Apple Machine Learning Research
Apple Machine Learning Research · 2026-04-10T00:00:00Z

本文介绍了在 HagiCode 项目中应用“渐进式披露”理念,以提升 AI 产品的人机交互效率。通过分步引导、智能补全和即时反馈,用户的模糊输入被转化为结构化提案,从而显著提高输入质量和用户满意度。

渐进式披露:如何用少即是多的理念改进 AI 产品的人机交互

dotNET跨平台
dotNET跨平台 · 2026-04-05T23:56:36Z
Furby的可爱与诅咒故事

Furby是1998年最受欢迎的玩具,以其可爱的外形和独特的人机交互设计而闻名。尽管功能有限,Furby能够与人类建立情感联系。本文回顾了Furby的起源及其对未来科技的启示。

Furby的可爱与诅咒故事

The Verge
The Verge · 2026-03-08T12:17:40Z
CATS Net:当 AI 开始像人类一样理解概念,从感官体验到抽象思维的突破!

本文探讨了人类如何从具体事物中抽象出概念,提出了CATS Net模型,模拟人脑的概念形成过程。该模型通过感官-运动编码器和概念压缩器,展示了AI在概念理解和交流方面的潜力,可能改变人机交互方式。

CATS Net:当 AI 开始像人类一样理解概念,从感官体验到抽象思维的突破!

Micropaper
Micropaper · 2026-03-02T22:30:00Z
从提示工程到意图工程:人机交互通信的演变

意图工程逐渐取代提示工程,重点在于清晰传达需求,以确保AI理解真实目标,促进更有效的人机协作。

从提示工程到意图工程:人机交互通信的演变

实时互动网
实时互动网 · 2026-03-02T03:03:00Z
法拉利纯电亮相!苹果传奇设计师给法拉利装回了实体按键

法拉利首款纯电GT车型Ferrari Luce的内饰设计融合了复古与现代元素,方向盘和仪表盘致敬经典,强调驾驶体验。与苹果前设计总监Jony Ive合作,Luces注重人机交互,保留物理按钮,提升驾驶乐趣。整体风格简约而富有情感,体现了法拉利对驾驶员的尊重。

法拉利纯电亮相!苹果传奇设计师给法拉利装回了实体按键

爱范儿
爱范儿 · 2026-02-11T01:46:09Z
多模态人工智能指南:视觉、语音、文本及更多

多模态人工智能(AI)能够同时处理图像、语音和文本等多种数据,改变了人机交互方式,提升了工作效率。新兴AI系统在视觉、语音和文本整合方面取得显著进展,推动了医疗、创意和无障碍等领域的应用。

多模态人工智能指南:视觉、语音、文本及更多

KDnuggets
KDnuggets · 2026-01-27T17:00:50Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码