BriefGPT - AI 论文速递 ·

HAP: 面向人类感知的结构感知遮挡图像建模

💡 原文中文，约500字，阅读约需2分钟。

📝

内容提要

本文介绍了一种名为MIM的预训练方法，通过人体部位的引导来指导掩码采样过程，更好地捕捉人体结构信息。提出了一种结构不变的对齐损失，通过人体部位先验来引导不同的掩码视图在同一图像上紧密对齐。该方法命名为HAP，在11个人体为中心的基准测试上取得了新的最高性能。

🎯

关键要点

本文介绍了一种名为MIM的预训练方法。
MIM方法通过人体部位的引导来指导掩码采样过程。
该方法旨在更好地捕捉人体结构信息。
提出了一种结构不变的对齐损失。
对齐损失通过人体部位先验引导不同的掩码视图在同一图像上紧密对齐。
该方法命名为HAP，使用简单的ViT编码器。
HAP在11个人体为中心的基准测试上取得了新的最高性能。
在MSMT17上，HAP实现了78.1%的mAP。
在PA-100K上，HAP实现了86.54%的mA。
在MS COCO上，HAP实现了78.2%的AP。
HAP可进行2D姿势估计，在3DPW上实现了56.0的PA-MPJPE。
HAP还可进行3D姿势和形状估计。

🏷️

继续阅读

ChatGPT三周推翻三大数学猜想，人类数学家该醒醒了
ChatGPT三个月内连干翻三个百年数学猜想，人类数学家是不是该收拾东西回家种地了？ AI工具在2026年夏天狂飙突进，从推翻厄尔多斯单位距离猜想，到解决...
光鉴科技发布具身智能视觉感知方案，为物理AI提供视觉感知基础
并行编程暗黑哲学：处理器通信映射人类内耗，治好了我的精神死锁
GPU堆到10086个，程序照样卡成PPT，难道人类集体脑回路也短路了？并行计算之禅论：并行计算不光是CPU的事，更是人类协作和自我认知的硬核隐喻。看懂...
A社调整Claude Team订阅成员限制起步从5人下调到2人以便更多小团队开通订阅
#人工智能 A 社宣布调整 Claude Team 团队订阅机制，从最小 5 人席位下调到 2 人席位，即现在只需要 2 个成员就可以开通团队账号。此次调...
基于超1万肿瘤样本训练，哈佛医学院等提出泛癌症基础模型COMPASS，平均性能优于22种现有方法
COMPASS 首次将这一架构引入癌症转录组分析领域，通过利用免疫相关基因集，并建立：基因（gene）→ 基因集（gene set）→ 概念（concep...
Rust 不必取代 Java：进入大型商业软件的一条现实路径
Java 处理业务复杂度，Rust 承担运行时关键性。不同的微服务可以拥有不同的领域模型，但工程团队仍然可以拥有一致的开发体验。 Rust 的优点已经不...

内容提要

关键要点

标签

继续阅读