小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
从看懂世界到做对动作,卧安机器人OneModel 1.7用一条「隐式通路」打通了具身智能的关键断层

卧安机器人发布了OneModel 1.7 FrontoStria-RL,该模型通过隐式传导机制将世界模型与动作执行连接,提升了家庭机器人在真实环境中的操作能力。其在标准评测中的成功率达到99%,显示出在家庭场景中的应用潜力。OneModel通过真实数据的持续反馈不断进化,推动家庭机器人向可靠工作迈进。

从看懂世界到做对动作,卧安机器人OneModel 1.7用一条「隐式通路」打通了具身智能的关键断层

量子位
量子位 · 2026-06-03T12:28:44Z
EgoScale——第一视角的2万小时人类标注数据扩展VLA的灵巧操作能力(提出human egocentric data下的缩放定律):先大规模人类预训练,再人机对齐,最后单条示范微调

EgoScale是一个基于大规模自中心人类数据的灵巧操作迁移框架。通过在20854小时的动作标注视频上训练视觉-语言-动作模型,发现人类数据规模与验证损失呈对数线性关系。该框架采用两阶段迁移方案,先进行大规模预训练,再进行少量对齐的中期训练,使机器人在极少监督下实现灵巧操作。研究表明,预训练策略在不同机器人平台上均能有效迁移,提升任务成功率。

EgoScale——第一视角的2万小时人类标注数据扩展VLA的灵巧操作能力(提出human egocentric data下的缩放定律):先大规模人类预训练,再人机对齐,最后单条示范微调

结构之法 算法之道
结构之法 算法之道 · 2026-03-02T10:39:29Z

Clawdbot(现称OpenClaw)是一个桌面AI助手,通过聊天软件与用户互动并执行任务。与Claude Code相似,但更依赖桌面系统,操作能力更强。然而,其复杂的文档和高成本使普通用户难以使用,且安全性不足,可能导致数据泄露。总体来看,Clawdbot的成功体现了桌面系统的优势,而非AI技术的突破。

具透 Plus:Clawdbot 的成功是桌面系统的成功;如何手动开启 Chrome 中的 Gemini

少数派
少数派 · 2026-01-31T11:29:42Z
InternVLA-A1——面向场景理解、未来状态生成、动作执行的一体化框架:融合VLM的语义理解与世界模型的未来动态预测

本文介绍了InternVLA-A1模型,该模型结合了多模态大语言模型的语义理解与动态预测能力,旨在提升机器人在复杂环境中的操作能力。通过构建包含真实和仿真数据的多层数据金字塔,InternVLA-A1有效解决了现有模型在场景变化适应性方面的不足,增强了机器人操作的鲁棒性与泛化能力。

InternVLA-A1——面向场景理解、未来状态生成、动作执行的一体化框架:融合VLM的语义理解与世界模型的未来动态预测

结构之法 算法之道
结构之法 算法之道 · 2026-01-22T15:12:29Z
TrajBooster——通过“轨迹中心学习”提升人形全身操作能力的VLA:把智元轮式数据迁移到宇树G1上,先二次预训练后微调(免去动捕)

本文介绍了TrajBooster框架,旨在提升双足人形机器人全身操作能力。通过提取末端执行器轨迹并进行重定向,TrajBooster解决了数据稀缺问题,增强了视觉-语言-动作模型的泛化能力。该方法结合真实与仿真数据,经过二次预训练和微调,使机器人能够在复杂环境中自主执行多样化任务,展现出强大的操作能力和适应性。

TrajBooster——通过“轨迹中心学习”提升人形全身操作能力的VLA:把智元轮式数据迁移到宇树G1上,先二次预训练后微调(免去动捕)

结构之法 算法之道
结构之法 算法之道 · 2025-10-20T11:11:35Z
如何将Okta日志与Grafana Loki集成以增强SIEM功能

Okta开发了日志收集工具,用于自动检索其系统日志API的事件日志。该工具可以丰富数据并将其发送到Grafana Loki等可观察性平台。通过配置环境变量并运行Okta日志收集器Docker容器,用户可以监视、分析和设置警报以提高系统安全性和操作能力。文章还提供了如何在Grafana Alloy中设置和运行Okta日志收集器以及如何在Loki和Grafana中观察和分析日志的说明。Okta还正在开发第二版日志收集器,以提供更高级的功能并与Alloy组件无缝集成。

如何将Okta日志与Grafana Loki集成以增强SIEM功能

engineering on Grafana Labs
engineering on Grafana Labs · 2024-08-07T00:00:00Z

本文提出多种方法提升机器人操作能力,包括无标注数据训练、深度学习和自然语言指令。研究表明,利用少量专家演示和文本引导扩充数据,机器人在新场景中表现优异,具备自主学习和适应新任务的能力。

基于基础模型的自主提高指令遵循技能

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-30T00:00:00Z

Open-TeleVision是一种远程操作系统,结合了VR技术和机器人手控制,通过捕捉手部姿势实现操作。系统展示了在不同场景下的操作能力。

UC San Diego的三大机器人:AnyTeleop、Open-TeleVision、Bunny-VisionPro——从RGB相机到VR远程控制机器人

结构之法 算法之道
结构之法 算法之道 · 2024-07-12T15:11:20Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码