BriefGPT - AI 论文速递 ·

融合编码的自动编码器作为时空学习耠

💡 原文中文，约400字，阅读约需1分钟。

📝

内容提要

该文介绍了一种运动引导的掩蔽算法(MGM)，以提高视频显著性。该算法在两个大规模视频基准中相比先前的最先进方法，为视频MAE提供了关键装备，并取得了高达+1.3%的改进。此外，该算法只使用了最多66%的训练时期，就可以获得与先前的视频MAE相等的性能。最后，该算法在多个数据集上对下游迁移学习和领域自适应任务的泛化能力比基线方法提高了高达+4.9%。

🎯

关键要点

提出了一种运动引导的掩蔽算法 (MGM)，利用运动矢量引导掩蔽位置。
在 Kinetics-400 和 Something-Something V2 两个大规模视频基准中，MGM 相比先前方法提高了视频 MAE 的性能，改进幅度高达 +1.3%。
MGM 只使用最多 66% 的训练时期，就能达到与先前视频 MAE 相等的性能。
在 UCF101、HMDB51 和 Diving48 数据集上，MGM 对下游迁移学习和领域自适应任务的泛化能力提高了高达 +4.9%。

🏷️

继续阅读

编码软件OpenCode封禁8,000个账号使用黑卡订阅转售API再申请退款
#人工智能 AI 编码软件 OpenCode 封禁 8,000 个违法薅羊毛账号，使用黑卡订阅再转售 API 给下游中转站。8,000 个账号理论成本为每...
Tesla Robotaxis go to Florida
It must be earnings day, because Tesla is making a Robotaxi announcement. The...
How to build interactive experiences with canvases
Canvases turn AI into interactive workspaces where you can visualize informat...
无需密码，一个请求就能拿下你的服务器，深度详解近几年 WordPress 最严重的漏洞「wp2shell」
昨天和大家说了「WordPress 发布紧急安全更新 7.0.2，高危漏洞“wp2shell”曝光，黑客无需密码即可控制网站」，可能大家还没有感觉到这个漏...
RoboTTT——面向机器人策略的上下文扩展：将TTT集成至VLA中以推理时建立记忆信息，从而将视觉-运动上下文扩展到 8K 个时间步
摘要：本文提出RoboTTT方法，通过将测试时训练（TTT）机制整合到机器人基础模型中，实现了8K时间步的长视觉-运动上下文建模。该方法采用快速权重机制，...
NVIDIA Vera Rubin Driving Performance Per Watt, Lowest Token Cost for Partners Worldwide
NVIDIA Vera Rubin is here, and it’s going gigascale. Vera Rubin NVL72 product...

内容提要

关键要点

标签

继续阅读