小红花·文摘

UCFFormer是一种新的多模态融合架构，能够整合不同分布的数据以增强人类动作识别的性能。它使用统一Transformer捕捉嵌入特征在时间和模态领域之间的相互依赖关系，并引入分解的时间-模态注意力来高效执行自注意力。在UTD-MHAD和NTU RGB+D两个数据集上的评估表明，UCFFormer超越了竞争方法，实现了最先进的性能。

多模型行为识别中利用互补信息的模态混合器

BriefGPT - AI 论文速递 ·

UCFFormer是一种新的多模态融合架构，能够增强人类动作识别的性能。它使用统一Transformer来捕捉嵌入特征在时间和模态领域之间的相互依赖关系，并引入了分解的时间-模态注意力来高效执行自注意力。在两个流行数据集上进行的性能评估表明，UCFFormer实现了最先进的性能。

统一的频率辅助变压器框架用于多模态操作的检测和定位

BriefGPT - AI 论文速递 ·

UCFFormer是一种多模态融合架构，能够整合具有不同分布的数据以增强人类动作识别的性能。UCFFormer使用统一Transformer来捕捉嵌入特征在时间和模态领域之间的相互依赖关系，并引入了分解的时间-模态注意力来高效执行自注意力，在各种模态之间减少特征分布上的差异，从而生成在语义上对齐的特征进行信息融合。在两个流行数据集上进行的性能评估表明，UCFFormer实现了最先进的性能。

统一对比融合变压器用于多模态人类动作识别

BriefGPT - AI 论文速递 ·