BriefGPT - AI 论文速递 ·

鲁棒确定性策略梯度用于干扰抑制及其在四旋翼控制中的应用

📝

内容提要

本研究解决了实际控制系统中由于模型不确定性和外部干扰而导致的最优控制策略识别困难。提出的鲁棒确定性策略梯度（RDPG）算法将$H_\infty$控制问题建模为一个二人零和动态博弈，通过深度强化学习实现了有效的干扰抑制。实验表明，该方法在干扰环境中具有优越的鲁棒性，能够在严重干扰条件下精确实时地跟踪移动目标。

➡️

继续阅读

远程控制安卓工具 Scrcpy 4.1 发布，新增 VP8 / VP9 视频编码支持，让更多安卓设备可以投屏
著名的开源电脑控制安卓工具 Scrcpy 4.1 已经发布，新增支持 VP8 / VP9 视频编码，可以让不支持 H.264、H.265 或 AV1 编码...
苹果更新TestFlight应用对于参与大量测试的玩家现在可以使用搜索功能
# 软件资讯苹果更新 TestFlight 应用，对于参与大量测试的玩家来说，现在可以使用底部的搜索框快速找到应用。为避免误解所以需要说明，搜索功能仅可...
RoboTTT——面向机器人策略的上下文扩展：将TTT集成至VLA中以推理时建立记忆信息，从而将视觉-运动上下文扩展到 8K 个时间步
摘要：本文提出RoboTTT方法，通过将测试时训练（TTT）机制整合到机器人基础模型中，实现了8K时间步的长视觉-运动上下文建模。该方法采用快速权重机制，...
Presentation: From Copy-Paste to Composition: Building Agents Like Real Software
Jake Mannix discusses moving AI agents past chaotic "1970s BASIC" arc...
I made a policy engine think it was in production
Kyverno is a Kubernetes-native policy engine that validates, mutates, and gen...
Meta made its own AI detection system. It should have just used Google’s
IIn March, Meta's Oversight Board called on the company to "meet its ...