卧安机器人发布了OneModel 1.7 FrontoStria-RL,该模型通过隐式传导机制将世界模型与动作执行连接,提升了家庭机器人在真实环境中的操作能力。其在标准评测中的成功率达到99%,显示出在家庭场景中的应用潜力。OneModel通过真实数据的持续反馈不断进化,推动家庭机器人向可靠工作迈进。
EgoScale是一个基于大规模自中心人类数据的灵巧操作迁移框架。通过在20854小时的动作标注视频上训练视觉-语言-动作模型,发现人类数据规模与验证损失呈对数线性关系。该框架采用两阶段迁移方案,先进行大规模预训练,再进行少量对齐的中期训练,使机器人在极少监督下实现灵巧操作。研究表明,预训练策略在不同机器人平台上均能有效迁移,提升任务成功率。
Clawdbot(现称OpenClaw)是一个桌面AI助手,通过聊天软件与用户互动并执行任务。与Claude Code相似,但更依赖桌面系统,操作能力更强。然而,其复杂的文档和高成本使普通用户难以使用,且安全性不足,可能导致数据泄露。总体来看,Clawdbot的成功体现了桌面系统的优势,而非AI技术的突破。
本文介绍了InternVLA-A1模型,该模型结合了多模态大语言模型的语义理解与动态预测能力,旨在提升机器人在复杂环境中的操作能力。通过构建包含真实和仿真数据的多层数据金字塔,InternVLA-A1有效解决了现有模型在场景变化适应性方面的不足,增强了机器人操作的鲁棒性与泛化能力。
本文介绍了TrajBooster框架,旨在提升双足人形机器人全身操作能力。通过提取末端执行器轨迹并进行重定向,TrajBooster解决了数据稀缺问题,增强了视觉-语言-动作模型的泛化能力。该方法结合真实与仿真数据,经过二次预训练和微调,使机器人能够在复杂环境中自主执行多样化任务,展现出强大的操作能力和适应性。
Okta开发了日志收集工具,用于自动检索其系统日志API的事件日志。该工具可以丰富数据并将其发送到Grafana Loki等可观察性平台。通过配置环境变量并运行Okta日志收集器Docker容器,用户可以监视、分析和设置警报以提高系统安全性和操作能力。文章还提供了如何在Grafana Alloy中设置和运行Okta日志收集器以及如何在Loki和Grafana中观察和分析日志的说明。Okta还正在开发第二版日志收集器,以提供更高级的功能并与Alloy组件无缝集成。
本文提出多种方法提升机器人操作能力,包括无标注数据训练、深度学习和自然语言指令。研究表明,利用少量专家演示和文本引导扩充数据,机器人在新场景中表现优异,具备自主学习和适应新任务的能力。
Open-TeleVision是一种远程操作系统,结合了VR技术和机器人手控制,通过捕捉手部姿势实现操作。系统展示了在不同场景下的操作能力。
完成下面两步后,将自动完成登录并继续当前操作。