小红花·文摘

浙大与vivo合作推出LearnAct框架，通过示范学习使手机AI能够在多样场景中完成复杂操作，提升了AI性能，为个性化手机助手奠定基础。

量子位 ·

本文介绍了一种基于物体为中心的增强学习方法，用于训练软机械手进行复杂操作。该方法通过新算法实现示范学习，成功应用于RBO Hand 2，完成开关阀门和抓取等任务。同时，研究探讨了安全强化学习框架和模块化机器人操控平台，解决了软体机器人操作中的技能学习和硬件耐用性问题。

BriefGPT - AI 论文速递 ·

本文探讨了自由能原理与主动推理在机器学习中的应用，特别是在强化学习和示范学习中的结合。研究提出了预期自由能的数学基础，分析了探索与利用的平衡，并介绍了基于主动推理的深度强化学习理论及其在复杂任务中的应用，提供了新的算法和视角。

BriefGPT - AI 论文速递 ·

本文介绍了多种强化学习技术，重点在于通过任务分解、适应性探索和示范学习来提高学习效率。这些方法在稀疏奖励环境中表现优越，能够加速机器人任务的学习和收敛。

BriefGPT - AI 论文速递 ·

该文章讨论了在未知的随机马尔可夫环境或游戏中，从代理人的示范学习的问题。作者通过扩展逆强化学习方法，提出了一种估计代理人偏好并构建改进策略的方法。他们使用简化的概率模型和最大后验估计来处理这个问题，并发现该算法在与其他了解动态的逆强化学习方法相比具有很高的竞争力。

BriefGPT - AI 论文速递 ·

本研究利用半监督学习和示范学习技术，使机器人能够识别实物属性并生成所需运动。实验证明该方法在未知海绵上成功识别属性并生成擦拭运动，优于其他方法。通过机器人硬件验证模型生成的运动，并通过预训练触觉表示编码器提高实验结果的泛化能力。

BriefGPT - AI 论文速递 ·

该研究探讨了在未知的随机马尔可夫环境或游戏中代理人示范学习的问题。通过扩展逆强化学习方法，估计代理人的偏好并构建改进策略。通过简化概率模型处理演示者策略和效用，使用最大后验估计来解决凸优化问题。该算法在先验分布相同的情况下与其他了解动态的逆强化学习方法相比具有竞争力。

BriefGPT - AI 论文速递 ·

OpenAI ·