小红花·文摘

$T-WAM——用于富接触操作的视觉-触觉世界动作模型：在统一的流匹配框架下联合学习未来视觉预测、触觉形变预测以及动作预测(且在插入透明导管场景中增大触觉的权重)$

T-WAM——用于富接触操作的视觉-触觉世界动作模型：在统一的流匹配框架下联合学习未来视觉预测、触觉形变预测以及动作预测(且在插入透明导管场景中增大触觉的权重)

结构之法算法之道 ·

$ViVa——基于视频生成模型的机器人RL价值估计：比原先基于VLM的价值函数，能更好的在动态交互环境中对当前进度和未来走势下所带来的回报做估计$

ViVa——基于视频生成模型的机器人RL价值估计：比原先基于VLM的价值函数，能更好的在动态交互环境中对当前进度和未来走势下所带来的回报做估计

结构之法算法之道 ·

在线教程丨低门槛部署英伟达最新Physical AI模型，覆盖人形机器人/人体运动生成/扩散模型微调等

HyperAI超神经 ·

2026年2月19日

Haoxiang's Blog ·

我们是否有错误的人工智能梦想？

The JetBrains Blog ·

Agent设计模式——第 21 章：探索和发现

XINDOO的博客 ·

评估专家通才

Martin Fowler ·

HOMIE是一种人形外骨骼驾驶舱，结合全身控制与远程操作，通过强化学习提升机器人行走和操作能力。系统包括外骨骼手臂、运动感应手套和踏板，支持高效精准控制，扩展机器人的操作空间。实验表明，HOMIE在复杂环境中表现优异，能够自主执行多样化任务。

HOMIE——遥操类似ALOHA主从臂的外骨骼驾驶舱收集数据：通过上肢模仿学习和全身控制RL训练自主策略

结构之法算法之道 ·

本研究提出了一种以认识性人工智能为核心的新方法，旨在增强AI在复杂环境中的鲁棒性，解决其在处理不确定性和超越训练数据方面的不足。

Position: Epistemic Artificial Intelligence is Crucial for Machine Learning Models to Understand When They are Ignorant

BriefGPT - AI 论文速递 ·

该研究系统总结了图形用户界面（GUI）代理的最新进展，特别关注基于强化学习的架构，以及多模态感知和自适应动作生成在复杂环境中的应用。

A Summary of GUI Agents Enhanced by Reinforcement Learning-Based Foundation Models

BriefGPT - AI 论文速递 ·

本研究提出了一种通用基础设施和工作流，旨在解决在非结构化户外环境中应用深度强化学习于四旋翼的问题。该平台实现了训练到现实部署的无缝转移，显著提升了四旋翼在复杂环境中的飞行性能和适应性，并通过实证验证了其效率和鲁棒性。

A General Infrastructure and Workflow for Quadrotor Deep Reinforcement Learning and Real-World Deployment

BriefGPT - AI 论文速递 ·

本研究分析了反事实推理在复杂环境中的局限性，特别是在高模型不确定性和混沌动态下的影响，强调谨慎使用反事实推理的重要性。

When Counterfactual Reasoning Fails: Chaos and the Complexity of the Real World

BriefGPT - AI 论文速递 ·

本研究提出了一种神经符号方法，旨在解决机器人在复杂环境中与人类互动时的不确定性问题，从而提升社交导航能力，具有重要的应用潜力。

Neuro-Symbolic World Model with Perspective Shift: A Framework for Socially Aware Robot Navigation

BriefGPT - AI 论文速递 ·

本研究设计了一个强化学习环境，利用《龙与地下城》第五版战斗场景，通过与大型语言模型控制的对手互动，挑战小型强化学习智能体。研究结果表明，大型语言模型提升了AI在复杂环境中的表现，为后续研究和教育应用提供了重要见解。

基于大型语言模型控制的对手的强化学习环境在《龙与地下城》第五版战斗中的应用

BriefGPT - AI 论文速递 ·

上周人工智能动态 #303 - Gemini Robotics、Gemma 3、CSM-1B

Last Week in AI ·

本研究提出了一种新的显著性不变性持续政策学习（SCPL）算法，旨在提升视觉强化学习中代理在未见场景中的泛化能力。通过引入价值一致性模块和动态模块，该算法在各种基准测试中显著提高了泛化性能，尤其在复杂环境中表现突出。

Salience-Invariant Consistent Policy Learning for Generalization in Visual Reinforcement Learning

BriefGPT - AI 论文速递 ·

本研究提出了一种新方法，旨在提高在复杂环境中学习关系模型的样本效率和模型推广能力，解决了随机探索效率低的问题。

引导探索以高效学习关系模型

BriefGPT - AI 论文速递 ·

本研究提出了一种基于逆强化学习的无人机视觉导航框架，旨在克服现有学习方法的局限性。该框架能够在复杂环境中快速生成无碰撞航点，实现灵活飞行，且无需额外训练，适用于真实场景。

RAPID: A Robust and Agile Planner Using Inverse Reinforcement Learning for Vision-Based Drone Navigation

BriefGPT - AI 论文速递 ·

本研究提出了一种离散层次规划（DHP）方法，有效解决了长时间视觉规划任务中的挑战，显著提升了复杂环境中的规划效率和成功率。

离散层次规划：用于层次强化学习代理的研究

BriefGPT - AI 论文速递 ·

该研究提出了一种新型频率驱动特征分解网络FD2-Net，旨在改善红外-可见物体检测。该方法有效捕捉互补信息，提升了模型在复杂环境下的检测性能，并在多个基准测试中超越了现有模型。

FD2-Net: A Frequency-Driven Feature Decomposition Network for Infrared-Visible Object Detection

BriefGPT - AI 论文速递 ·