小红花·文摘 - 小红花技术领袖俱乐部

$HoloAgent-0——具备三维空间记忆的统一具身Agent框架：Agent自主拆解、规划，且按需调用技能层中的导航、VLA操作、全身运控，以及记忆层中的空间与时间记忆$

HoloAgent-0——具备三维空间记忆的统一具身Agent框架：Agent自主拆解、规划，且按需调用技能层中的导航、VLA操作、全身运控，以及记忆层中的空间与时间记忆

结构之法算法之道 ·

如何用OpenAI Codex子代理让你的编程效率翻三倍

如何用OpenAI Codex子代理让你的编程效率翻三倍

极道 ·

港大开源AI交易助手Vibe-Trading：散户不用写代码就能搞量化交易

港大开源AI交易助手Vibe-Trading：散户不用写代码就能搞量化交易

极道 ·

AI改了画面却没改声音？浙大团队首次将一句话编辑视频延伸到音频维度

AI改了画面却没改声音？浙大团队首次将一句话编辑视频延伸到音频维度

实时互动网 ·

OpenCode 对接 Suno MCP

OpenCode 对接 Suno MCP

静觅 ·

Gemini Omni视频模型发布：好像比Seedance2还差点！

Gemini Omni视频模型发布：好像比Seedance2还差点！

极道 ·

OpenClaw结合Chrome 144+的远程调试功能，简化了浏览器控制，用户可通过自然语言指令高效处理网页任务，无需重复登录或编写代码，特别适合需要批量操作多个网页的用户。

Chrome 远程调试 + OpenClaw：让 AI 直接接管你正在用的浏览器

WordPress 果酱 ·

百度智能云推出OpenClaw一键部署服务，开发者可免费体验AI数字员工。用户通过轻量应用服务器快速部署，执行自然语言指令，提升办公效率。限时活动提供首月免费体验，降低AI应用门槛。

百度智能云推出OpenClaw限时免费一键部署服务，开发者零成本体验AI数字员工

量子位 ·

中国团队Hyper3D推出Rodin Gen-2 Edit，实现3D模型的局部编辑，标志着3D生成进入可编辑时代。用户可通过自然语言指令修改模型，提升3D创作效率与可控性，推动行业从“结果展示”向“可迭代工作流”转变。

3D版Nano Banana来了！AI修模成为现实，3D生成进入可编辑时代

量子位 ·

低门槛试用Open-AutoGLM：屏幕理解+自动执行的智能体体验；Spatial-SSRL-81k构建空间感知的自监督提升路径

低门槛试用Open-AutoGLM：屏幕理解+自动执行的智能体体验；Spatial-SSRL-81k构建空间感知的自监督提升路径

HyperAI超神经 ·

用自然语言控制手机的轻量级自动化工具

用自然语言控制手机的轻量级自动化工具

dotNET跨平台 ·

$Uni-NaVid(NaVid升级版)——基于视频和指令规划动作：通过在线Token合并和前瞻性预测，试图一统4类导航任务$

Uni-NaVid(NaVid升级版)——基于视频和指令规划动作：通过在线Token合并和前瞻性预测，试图一统4类导航任务

结构之法算法之道 ·

阿里推出的AI代码编辑器Qoder现已免费试用，具备强大的上下文理解能力，能够深度分析代码库并生成文档。它支持自然语言指令，自动规划开发步骤，实时展示修改内容，并学习用户的编码风格，从而提升编程效率。

阿里全新AI IDE现在免费用：超强上下文理解，覆盖整个代码库

量子位 ·

本文介绍了NaVid，一个用于视觉与语言导航的新模型。NaVid通过视频输入和自然语言指令，在连续环境中导航，无需地图或深度信息。该模型结合预训练的视觉编码器和大型语言模型，实现高效的动作规划，展现出优越的泛化能力和鲁棒性，尤其在仿真到现实的应用中表现突出。

NaVid——基于单目RGB捕获的视频让VLM规划「连续环境中VLN」的下一步：无需地图/里程计/深度信息(含后续升级版Uni-NaVid的详解)

结构之法算法之道 ·

本研究提出了VeriSafe Agent (VSA)，旨在提高移动GUI代理执行指令的可靠性。通过将自然语言指令转化为可验证的规范，VSA确保代理行为与用户意图一致，从而显著提升动作验证准确率和任务完成率。

Safeguarding Mobile GUI Agents via Logic-based Action Verification

BriefGPT - AI 论文速递 ·

Cursor AI的崛起：AI驱动编码的未来

Cursor AI的崛起：AI驱动编码的未来

DEV Community ·

ICLR 2025｜AI不语，只是一味根据人类意图推理3D空间定位

ICLR 2025｜AI不语，只是一味根据人类意图推理3D空间定位

机器之心 ·

Claude Code是什么？如何使用Claude Code｜Claude Code使用教程与完整指南

Claude Code是什么？如何使用Claude Code｜Claude Code使用教程与完整指南

人言兑 ·

Helix是首款高速控制的人形机器人，能够灵活应对复杂家庭场景。通过结合快慢系统，Helix实现高效的视觉语言理解与动作执行，支持自然语言指令，提升操作的泛化能力和效率。

Helix——Figure 02上的通用人形VLA：不用微调即可做多个任务的快与慢双系统，让两个机器人协作干活(含清华HiRT详解)

结构之法算法之道 ·

Figure推出的Helix机器人能够通过自然语言指令感知、理解并抓取物品，具备高速控制和多机器人协作能力，且无需特定任务微调，展现出强大的对象泛化能力，标志着人形机器人技术的重大进步。

断交OpenAI后，人形机器人独角兽首秀：一个神经网络控制整个上身，能听懂人话可抓万物

量子位 ·