BriefGPT - AI 论文速递 ·

动态模态-相机不变聚类用于无监督可见-红外行人重识别

💡 原文中文，约1500字，阅读约需4分钟。

📝

内容提要

本研究探讨了可见光-红外人员再识别的多种方法，提出了基于批量归一化的交叉模态神经架构搜索（CM-NAS）和无监督匹配框架，显著提升了跨模态匹配性能。通过模态统一网络和多内存匹配框架，解决了模态差异和类内变异问题，实验结果在多个数据集上优于现有方法。

🎯

🔎

本研究强调了批量归一化层的适当分离在跨模态匹配中的重要性。这一发现为后续的模态统一网络和无监督学习框架奠定了基础，表明在设计深度学习模型时，细节处理对性能提升至关重要。

文章提出的无监督匹配学习框架通过生成伪标签和模态特定对比学习，显著提高了跨模态匹配的效果。这种方法的成功展示了无监督学习在处理复杂数据集时的潜力，尤其是在缺乏标注数据的情况下。

研究中引入的Modality Restitution和Compensation模块有效减小了可见光与红外模态之间的差异。这一创新为未来的多模态学习提供了新的思路，尤其是在特征提取和信息融合方面。

❓

交叉模态神经架构搜索（CM-NAS）是一种基于批量归一化的方法，旨在提升可见光-红外人员再识别的跨模态匹配性能。

通过引入模态统一网络（MUN）和Modality Restitution与Compensation模块，来减小模态间差异并提取重要特征。

无监督匹配学习框架主要包括跨模态簇匹配算法、模态特定对比学习框架和跨模态一致性约束。

实验结果显示，提出的方法在多个数据集上优于现有的无监督和监督方法，特别是在SYSU-MM01和RegDB数据集上表现突出。

模态统一网络通过动态建模模态特定和模态共享表示，提取判别特征，从而解决跨模态差异和类内变异问题。

该方法引入了Modality-Unified Label Transfer模块和Online Cross-memory Label Refinement模块，实现高质量的跨模态标签关联。

🏷️