小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

OpenClaw结合Chrome 144+的远程调试功能,简化了浏览器控制,用户可通过自然语言指令高效处理网页任务,无需重复登录或编写代码,特别适合需要批量操作多个网页的用户。

Chrome 远程调试 + OpenClaw:让 AI 直接接管你正在用的浏览器

WordPress 果酱
WordPress 果酱 · 2026-03-20T09:55:07Z

百度智能云推出OpenClaw一键部署服务,开发者可免费体验AI数字员工。用户通过轻量应用服务器快速部署,执行自然语言指令,提升办公效率。限时活动提供首月免费体验,降低AI应用门槛。

百度智能云推出OpenClaw限时免费一键部署服务,开发者零成本体验AI数字员工

量子位
量子位 · 2026-02-03T06:12:19Z

中国团队Hyper3D推出Rodin Gen-2 Edit,实现3D模型的局部编辑,标志着3D生成进入可编辑时代。用户可通过自然语言指令修改模型,提升3D创作效率与可控性,推动行业从“结果展示”向“可迭代工作流”转变。

3D版Nano Banana来了!AI修模成为现实,3D生成进入可编辑时代

量子位
量子位 · 2026-01-27T04:21:46Z
低门槛试用Open-AutoGLM:屏幕理解+自动执行的智能体体验;Spatial-SSRL-81k构建空间感知的自监督提升路径

智谱AI推出手机端智能助理框架Open-AutoGLM,利用视觉语言模型实现屏幕内容的深度理解与自动化操作。用户可通过自然语言指令完成任务,系统确保安全性并支持远程调试,已覆盖50余款主流应用,逐步成为全场景智能助手。

低门槛试用Open-AutoGLM:屏幕理解+自动执行的智能体体验;Spatial-SSRL-81k构建空间感知的自监督提升路径

HyperAI超神经
HyperAI超神经 · 2025-12-15T07:10:51Z
用自然语言控制手机的轻量级自动化工具

DroidRun是一个开源自动化框架,支持通过自然语言指令驱动移动设备,适用于自动化测试和移动助手。它结合自然语言理解、检索与设备控制,实现灵活的端到端自动化,便于集成与扩展。

用自然语言控制手机的轻量级自动化工具

dotNET跨平台
dotNET跨平台 · 2025-12-04T23:53:58Z
Uni-NaVid(NaVid升级版)——基于视频和指令规划动作:通过在线Token合并和前瞻性预测,试图一统4类导航任务

本文介绍了Uni-NaVid,一个基于视频的多任务具身导航模型。该模型结合RGB视频流和自然语言指令,能够高效生成导航动作,并通过在线token合并机制优化推理速度。Uni-NaVid支持视觉与语言导航、目标物体导航、具身问答和人类跟随等任务,研究表明其在真实环境中表现出色,具备良好的泛化能力和计算效率。

Uni-NaVid(NaVid升级版)——基于视频和指令规划动作:通过在线Token合并和前瞻性预测,试图一统4类导航任务

结构之法 算法之道
结构之法 算法之道 · 2025-10-05T16:41:21Z

阿里推出的AI代码编辑器Qoder现已免费试用,具备强大的上下文理解能力,能够深度分析代码库并生成文档。它支持自然语言指令,自动规划开发步骤,实时展示修改内容,并学习用户的编码风格,从而提升编程效率。

阿里全新AI IDE现在免费用:超强上下文理解,覆盖整个代码库

量子位
量子位 · 2025-08-22T06:16:12Z

本文介绍了NaVid,一个用于视觉与语言导航的新模型。NaVid通过视频输入和自然语言指令,在连续环境中导航,无需地图或深度信息。该模型结合预训练的视觉编码器和大型语言模型,实现高效的动作规划,展现出优越的泛化能力和鲁棒性,尤其在仿真到现实的应用中表现突出。

NaVid——基于单目RGB捕获的视频让VLM规划「连续环境中VLN」的下一步:无需地图/里程计/深度信息(含后续升级版Uni-NaVid的详解)

结构之法 算法之道
结构之法 算法之道 · 2025-07-26T16:29:02Z

本研究提出了VeriSafe Agent (VSA),旨在提高移动GUI代理执行指令的可靠性。通过将自然语言指令转化为可验证的规范,VSA确保代理行为与用户意图一致,从而显著提升动作验证准确率和任务完成率。

Safeguarding Mobile GUI Agents via Logic-based Action Verification

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-24T00:00:00Z
Cursor AI的崛起:AI驱动编码的未来

Cursor AI是Anysphere Inc.开发的下一代AI集成开发环境,旨在提高程序员的编码效率。它通过自然语言指令生成代码、智能自动补全和批量重构等功能,简化开发流程,帮助开发者更快完成任务,提高代码质量,减少调试时间。

Cursor AI的崛起:AI驱动编码的未来

DEV Community
DEV Community · 2025-03-14T17:55:29Z
ICLR 2025|AI不语,只是一味根据人类意图推理3D空间定位

AIxiv专栏促进学术交流,报道超过2000篇内容。新任务3D意图定位(3D-IG)通过自然语言指令在3D场景中检测目标,提升人机交互。研究构建了Intent3D数据集,利用GPT-4生成意图文本,并采用IntentNet方法显著提高了意图理解和目标检测性能。

ICLR 2025|AI不语,只是一味根据人类意图推理3D空间定位

机器之心
机器之心 · 2025-03-01T13:02:49Z
Claude Code是什么?如何使用Claude Code|Claude Code使用教程与完整指南

Claude Code 是由 Anthropic 开发的 AI 编程工具,能够在终端中运行,帮助开发者高效编写代码。它支持自然语言指令,自动化任务,调试和修复代码,并简化版本控制。用户需满足系统要求并通过 NPM 安装,提供 CLI 命令和交互模式,适合复杂开发任务。

Claude Code是什么?如何使用Claude Code|Claude Code使用教程与完整指南

人言兑
人言兑 · 2025-02-25T12:35:04Z

Helix是首款高速控制的人形机器人,能够灵活应对复杂家庭场景。通过结合快慢系统,Helix实现高效的视觉语言理解与动作执行,支持自然语言指令,提升操作的泛化能力和效率。

Helix——Figure 02上的通用人形VLA:不用微调即可做多个任务的快与慢双系统,让两个机器人协作干活(含清华HiRT详解)

结构之法 算法之道
结构之法 算法之道 · 2025-02-21T06:22:48Z

Figure推出的Helix机器人能够通过自然语言指令感知、理解并抓取物品,具备高速控制和多机器人协作能力,且无需特定任务微调,展现出强大的对象泛化能力,标志着人形机器人技术的重大进步。

断交OpenAI后,人形机器人独角兽首秀:一个神经网络控制整个上身,能听懂人话可抓万物

量子位
量子位 · 2025-02-20T16:54:43Z
Agentforce的有效指令:10个Flow公式限制与Transform元素中的多数据源整合

本文介绍了Salesforce的多个方面,包括撰写有效自然语言指令的方法、Salesforce Flow的公式限制及其解决方案、使用Transform元素整合多数据源、Service Replies与Prompt Builder的兼容性,以及管理Pardot账户参与限制的策略。

Agentforce的有效指令:10个Flow公式限制与Transform元素中的多数据源整合

DEV Community
DEV Community · 2025-02-04T15:33:52Z
引领人机交互革命?微软研究团队发布80页的大模型GUI智能体综述

AIxiv专栏促进学术交流,微软研究团队发布综述论文,探讨基于大语言模型的GUI智能体。该智能体通过自然语言指令自动操作界面,克服传统GUI自动化的局限,提升人机交互效率,未来将在多个领域广泛应用。

引领人机交互革命?微软研究团队发布80页的大模型GUI智能体综述

机器之心
机器之心 · 2025-01-09T05:32:58Z

VLABench是一个针对语言条件下机器人操控的长远推理任务的大规模基准,包含100类任务和2000多个对象,强调自然语言指令和推理能力。研究表明,现有视觉语言行动模型在这些任务中仍面临挑战。

VLABench: A Large-Scale Benchmark for Long-Horizon Reasoning Tasks in Language-Conditioned Robotics Manipulation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-24T00:00:00Z

本研究提出FLARE方法,旨在解决机器人助手在自然语言指令下进行复杂任务规划时的标注需求问题。该方法结合语言指令与环境感知,生成合理计划,并通过视觉提示修正模糊指令,从而显著提升任务规划效果。

Efficient Replanning for Multi-Modal Grounded Planning and Learning Embodied Agents

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-23T00:00:00Z

本研究推出安全代理基准(SafeAgentBench),探讨具身代理执行复杂自然语言指令的安全风险。实验基于750个任务的数据集和通用环境,结果显示安全任务成功率为69%,而危险任务拒绝率仅为5%,揭示了潜在的安全隐患。

安全代理基准:具身大型语言模型代理的安全任务规划基准

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-17T00:00:00Z

本研究提出了NAVCON,一个基于R2R和RxR数据集的大规模视觉语言导航语料库。研究引入了四个核心的认知和语言基础导航概念,并开发了生成自然语言导航指令的算法,评估了注释质量,对未来研究和应用具有重要意义。

NAVCON: A Cognitively Inspired and Linguistically Grounded Corpus for Vision and Language Navigation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-17T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码