BriefGPT - AI 论文速递 ·

LOTUS：无监督技能发现的机器人操控持续模仿学习

💡 原文中文，约400字，阅读约需1分钟。

📝

内容提要

该研究提出了一种自我监督任务推理方法，使用自组织学习和联合动作-意图嵌入的学习训练任务推理网络，并通过强化学习进行训练，以优化任务的性能。该方法在人形机器人上进行评估，性能优于其他基线，尤其在具有挑战性的情况下，并且能够从不完整的演示中推断出任务。在单次任务泛化实验中，该方法还显示出对未见任务的推理能力。

🎯

关键要点

提出了一种自我监督任务推理方法。
使用自组织学习和联合动作-意图嵌入的学习训练任务推理网络。
通过强化学习优化任务性能。
在固定集合和持续多任务学习设置下使用人形机器人进行评估。
方法在持续学习设置下性能优于其他基线，尤其在挑战性情况下。
能够从不完整的演示中推断出任务。
在单次任务泛化实验中显示出对未见任务的推理能力。

🏷️

继续阅读

RoboTTT——面向机器人策略的上下文扩展：将TTT集成至VLA中以推理时建立记忆信息，从而将视觉-运动上下文扩展到 8K 个时间步
摘要：本文提出RoboTTT方法，通过将测试时训练（TTT）机制整合到机器人基础模型中，实现了8K时间步的长视觉-运动上下文建模。该方法采用快速权重机制，...
开普勒发布全球首款混动架构四足机器人——麒麟全系系列
(全球TMT 2026年07月21日讯)近日，2026世界人工智能大会（WAIC）在上海举办，开普勒携全系新品 […]
月之暗面发布Kimi K3加剧美国芯片股抛售；小米或上调手机出货目标；三星电子将成立机器人部门加速研发及商业化
(全球TMT 2026年07月21日讯)今日要点：月之暗面发布Kimi K3加剧美国芯片股抛售；小米或上调手机 […]
Announcing the Public Preview of Discover and Domains, powered by Unity Catalog
Today, we're announcing the Public Preview of Domains and the Discover pa...
Peak Design’s modular Field Bracket has a finder tag built-in
I am a very clumsy man. So clumsy, that I have AirTags hanging off practicall...
Nearly every Kindle is steeply discounted at Best Buy
If you’ve been thinking about picking up a Kindle before school starts, or fo...

内容提要

关键要点

标签

继续阅读