小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

YoooClaw C·ONE是一款新型智能卡片,旨在提升AI助手的使用体验。它可连接手机,整理通知,生成待办事项,并通过语音指令简化操作。用户可长按说话记录灵感或指挥AI执行任务,具备录音和转写功能,适合会议和讨论。此次众测活动邀请用户体验并反馈其在工作流中的实际应用。

众测|邀你一同探索随身 AI 硬件入口 YoooClaw C·ONE

少数派
少数派 · 2026-04-29T03:34:17Z
【2026 AI硬件开发学习必看系列】快速通过MCP让你的桌面宠物学会摇尾巴(语音控制舵机)

本文介绍了如何使用MCP工具通过语音指令控制LS26(Arcs-mini)开发板上的MG90S舵机。用户可以通过四次点击按钮启动或停止舵机旋转,并通过云端调用MCP工具设置旋转方向和速度。教程包括硬件接线、代码实现及常见问题解决方案,适合初学者。

【2026 AI硬件开发学习必看系列】快速通过MCP让你的桌面宠物学会摇尾巴(语音控制舵机)

分享AI芯片开发经验
分享AI芯片开发经验 · 2026-04-17T12:20:45Z
HIL-DAFT——双智能体的人类在环RL框架微调的人形VLA(先离线预热后在线交互):为完成螺栓装配,主智能体负责常规操作、精细化执行体依据语音指令实行细粒度调整

本文探讨了一种双执行体强化学习框架,结合人类反馈优化视觉-语言-动作(VLA)模型。通过“对话与微调”机制,机器人在长时域操作中实现高效学习,成功率达到100%。该方法在多任务设置中展现出良好的样本效率和训练稳定性,适用于复杂的机器人操作任务。

HIL-DAFT——双智能体的人类在环RL框架微调的人形VLA(先离线预热后在线交互):为完成螺栓装配,主智能体负责常规操作、精细化执行体依据语音指令实行细粒度调整

结构之法 算法之道
结构之法 算法之道 · 2026-03-14T16:24:12Z
深度解析谷歌版「豆包手机」:Android 的统治者下了一盘什么棋?|AI 器物志

三星与谷歌推出的Galaxy S26系列搭载Gemini智能体,支持通过语音指令打车和点外卖。目前该功能在美国和韩国预览,未来将扩展至更多设备。Gemini结合AI读屏和API,模仿人类操作,提升用户体验,尽管功能尚有限,但谷歌生态系统将促进其发展。

深度解析谷歌版「豆包手机」:Android 的统治者下了一盘什么棋?|AI 器物志

爱范儿
爱范儿 · 2026-02-27T02:21:15Z

本文介绍了一种适用于高温、高湿工业环境的C#离线语音指令系统。该系统利用Windows语音引擎,实现设备控制和参数设置,确保数据安全和快速响应。支持多种语音指令,资源占用低,识别率高,适合无法触控的场景,提升操作效率。

C# 轻量级工业语音指令系统:离线识别 + 语音播报

dotNET跨平台
dotNET跨平台 · 2026-02-07T00:02:26Z
Emerson的SmartVoice设备无需Wi-Fi或中心即可遵循语音指令

IAI Smart推出了Emerson Smart系列智能家电,支持语音控制,无需Wi-Fi或应用程序。产品包括塔扇、加热器、电源插头和空气炸锅,内置麦克风和扬声器,能响应超过1000个语音指令,确保用户隐私安全。这些产品在Best Buy、Walmart和Amazon等平台上销售。

Emerson的SmartVoice设备无需Wi-Fi或中心即可遵循语音指令

The Verge
The Verge · 2026-01-06T05:01:00Z
体验豆包手机助手,它把我的手机「变薄」了

豆包手机助手通过深度整合操作系统,简化手机操作,能够高效处理复杂任务,如文件管理和比价购物。用户只需通过语音指令,助手便可自动执行,提升生活便利性,实现智能化交互。

体验豆包手机助手,它把我的手机「变薄」了

爱范儿
爱范儿 · 2025-12-01T05:37:59Z
Bitmovin 推出 Agentic AI Hub 实现自然语言交互

Bitmovin推出Agentic AI Hub,旨在简化视频工作流程并提升观众体验。该平台结合新工具和AI场景分析,支持自然语言生成短视频,优化VoD编码器,便于内容推广至TikTok等平台,用户可通过语音指令与内容互动,提供更自然的观看体验。

Bitmovin 推出 Agentic AI Hub 实现自然语言交互

实时互动网
实时互动网 · 2025-11-14T02:21:15Z

美团的智能秘书“小美”通过语音指令简化生活服务,如点外卖和找餐厅,操作简单,适合各年龄层用户。它利用真实数据和强大模型提供个性化推荐和智能提醒,增强用户体验。

小而美的生活秘书!美团Agent落地生活服务

量子位
量子位 · 2025-09-13T04:39:20Z
目前最佳的机器人吸尘器优惠

现代机器人吸尘器已具备吸尘和拖地的双重功能,部分型号支持自动清理垃圾和水箱,且可通过语音指令操作。市场上有多款性价比高的选择,如iRobot的Roomba Combo j7 Plus和Yeedi Cube,适合不同预算的消费者。

目前最佳的机器人吸尘器优惠

The Verge
The Verge · 2025-09-04T18:42:52Z

智谱推出全球首个手机通用Agent,用户可通过语音指令让手机自动执行任务,如点外卖和比价。该Agent在云端运行,不占用本地资源,支持安卓和iOS,并可集成到智能音箱等设备,推动通用人工智能的发展。

厉害了,智谱造了全球首个手机通用Agent!人人免费,APP甚至直接操控云电脑

量子位
量子位 · 2025-08-20T08:27:25Z
Spotify的AI DJ现已支持点歌

Spotify的AI DJ功能现已支持语音指令,Premium用户可以通过语音请求播放特定艺术家或风格的音乐。用户只需按住“DJ”按钮并发出指令,如“播放电子音乐”或“给我一些独立曲目”,从而更好地控制播放内容。

Spotify的AI DJ现已支持点歌

The Verge
The Verge · 2025-05-13T13:00:00Z

本研究提出了一种基于大型语言模型的虚拟现实搬运工具,旨在自然支持物体操作。该工具理解用户语音指令,提升用户体验和多物体操作表现,减少工作负担和手臂疲劳,为未来物体操作界面设计提供重要启示。

你能把这些移动到那里吗?一个基于大型语言模型的虚拟现实搬运工具以支持物体操作

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-04T00:00:00Z

一名开发者在 Reddit 展示了一个基于 ChatGPT 的自动步枪炮台,能够快速响应语音指令进行射击。因违反 OpenAI 使用协议,该开发者的账号被封禁,此事件引发了对人工智能武器化的担忧。

利用ChatGPT驱动炮台(自动步枪)的开发者账号因违反使用协议被OpenAI封号

蓝点网
蓝点网 · 2025-01-10T00:47:50Z
无问芯穹发布全球首个端侧全模态理解的开源模型Megrez-3B-Omni,小巧全能,极速推理

无问芯穹于12月16日开源了全球首个端侧全模态理解模型Megrez-3B-Omni,该模型具备图片、音频和文本处理能力,参数为30亿,推理速度领先300%。在多个基准测试中表现优异,支持语音指令和网页搜索,旨在提升端侧智能设备的性能与效率。

无问芯穹发布全球首个端侧全模态理解的开源模型Megrez-3B-Omni,小巧全能,极速推理

机器之心
机器之心 · 2024-12-16T06:26:35Z

国产AI AutoGLM实现手机和电脑网页的自动操作,用户可通过语音指令完成点赞、发微信、点外卖等功能,简化了操作流程,标志着AI向自动化发展。

今天起,国产AI可以像人一样用手机了!一手实测在此

量子位
量子位 · 2024-10-26T10:05:11Z
这款前门可通过语音指令从透明变为不透明

家得宝推出智能玻璃前门,白天透明,夜晚不透明,提供隐私保护。用户可通过按钮、语音或手机应用控制,并可设置定时。价格根据玻璃面积为$798、$899和$998。兼容Alexa和Google Home,支持蓝牙和Wi-Fi,需电池供电,门框内置可拆卸电池和充电器。门不含锁或把手,需自行安装。

这款前门可通过语音指令从透明变为不透明

The Verge
The Verge · 2024-09-30T16:50:08Z

我们开发了COSMIC,一种高效的多模态语言模型,将语音融入大型语言模型中。COSMIC在少于20M个参数和450小时语音数据下,展示了指令跟随和上下文学习能力,甚至在未见过的语音转文本任务中也能生成文本。多任务评估证明了低成本构建语音语言模型的方法有效性。

无需语音指令调优数据的指令跟随语音语言模型的开发

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-30T00:00:00Z
Qwen2-Audio:开启语音对话!

Qwen2-Audio是新发布的多模态音频语言模型,支持语音指令和音频分析,能够处理超过8种语言。该模型在语音聊天、音频分析和多语言支持方面表现优异,未来将进行更大规模的训练以提升性能。

Qwen2-Audio:开启语音对话!

Blog on Qwen
Blog on Qwen · 2024-08-09T08:22:39Z

Pramit Bhargava创建了名为Louie的应用程序,为视障人士提供全语音控制。他在30岁左右开始出现视力问题,但通过使用Google的屏幕阅读器TalkBack,他恢复了信心。他创建了Louie来帮助自己和其他处于同样困境的人。

工程师如何创建语音指令应用以实现更高的独立性

The Keyword
The Keyword · 2023-10-18T15:02:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码