小红花·文摘

Meissonic模型是一种非自回归的遮掩图像建模技术，用于高效的文本到图像合成。相比传统扩散模型，Meissonic通过架构创新和优化，实现高质量图像生成，展示了MIM技术的潜力。

Meissonic：高效高分辨率文本到图像合成的非自回归MIM突破

DEV Community ·

费利佩从小热爱技术，自学前端开发。因经济原因未上大学，但通过互联网资源继续学习。现在他攻读软件工程，并创建博客分享免费学习资源，帮助他人实现梦想。

Sobre Mim

DEV Community ·

本研究探讨了遮蔽图像建模（MIM）在计算机视觉中的进展，提出了A^2MIM和MaskAlign等改进方案，提升了分类、检测和分割任务的表现。同时，研究引入了新的对称掩蔽策略SymMIM，显著提高了训练效率和准确率，解决了传统方法的不足。

SG-MIM：结构知识引导的高效预训练用于密集预测

BriefGPT - AI 论文速递 ·

本文介绍了一种高效红外小目标检测方法Mamba-in-Mamba，结合卷积网络和Transformer，通过子块分解和相互作用提升表征能力和计算效率。实验证明，该方法准确性和效率优于现有方法，推理速度快10倍，减少了73.4%的GPU内存使用量。

MiM-ISTD：高效红外小目标检测中的蟒蛇嵌套

BriefGPT - AI 论文速递 ·

本文介绍了计算机视觉领域的新趋势：视觉Transformer和掩蔽的图像建模(MIM)，通过引入注意力引导掩蔽(AttMask)策略，提高了MIM和基于蒸馏的自监督学习的效果，实验证明AttMask加速了学习过程并提高了性能。

Transformer 在屏蔽图像建模中证明能够学习特征 - 位置相关性

BriefGPT - AI 论文速递 ·

本文介绍了一种名为MIM的预训练方法，通过人体部位的引导来指导掩码采样过程，更好地捕捉人体结构信息。提出了一种结构不变的对齐损失，通过人体部位先验来引导不同的掩码视图在同一图像上紧密对齐。该方法命名为HAP，在11个人体为中心的基准测试上取得了新的最高性能。

HAP: 面向人类感知的结构感知遮挡图像建模

BriefGPT - AI 论文速递 ·

本文介绍了AI实战营第二期的环境配置及安装方法，推荐使用mim管理OpenMMLab repo，不要与pip混用。具体安装步骤包括配置pytorch环境、安装mim与mmcv、安装mmdetection、安装mmclassification(mmpretrain)、安装mmsegmentation、安装mmpose和安装mmagic。

AI实战营第二期 | 环境配置及安装 - Xu_Lin

Xu_Lin ·

@Author： MSRA Zhenda Xie@Source：Arxiv， Code TBP，Blog_CVer@Read：AikenHong 2021.11.22 “What I cannot create, I do not understand.” — Richard Feynman Intro & Simple...

MIM-V-simMIM

aikenh ·

@Read: AikenHong 2021 @Author: https://arxiv.org/abs/2111.07832 @解读：Machine Heart 基本思想基于NLP中的MLM(Masked Language Model)的核心训练目标: 也就是遮住文本的一部分, 然后通过模型去预测和补全, 这一过程是模型学到泛化的特征,...

MIM-V-iBOT

aikenh ·

@Author：Facebook AI Research-Kaiming HeKaiming-MAE

MIM-V-MAE

aikenh ·