小红花·文摘

本研究提出了一种半监督学习方法，利用音频源定位引导的混合技术，解决视频动作识别中的高注释成本问题。该方法结合视觉和音频信息，尽管标记数据量少，仍能显著提升在UCF-51、Kinetics-400和VGGSound数据集上的表现，具有重要应用潜力。

Semi-Supervised Audio-Visual Action Recognition with Audio Source Localization Guided Mixup

BriefGPT - AI 论文速递 ·

本研究提出了一种多模态时空适配器（MSTA），旨在解决视频动作识别中的灾难性遗忘问题，提升文本与视觉表示的对齐度，减少学习参数，同时保持模型的泛化能力，展示了提高迁移学习效率的潜力。

Efficient Video-Language Foundation Model Transfer Learning

BriefGPT - AI 论文速递 ·

本文介绍了一种结合手工特征与深度学习的视频动作识别方法，显著提升了识别精度。通过利用未标记视频和多视角伪标记，提出了多种半监督学习技术，增强了在少量标记数据下的识别性能。最新的SAFSAR模型通过3D特征提取和有效的特征融合，进一步改善了动作识别效果。

SITAR：用于动作识别的半监督图像变换器

BriefGPT - AI 论文速递 ·

本文探讨了零样本学习在视频动作识别中的应用，提出了多种提高模型泛化性能的方法，如使用语义词向量、自我训练和数据增强等策略。研究表明，这些方法在多个数据集上显著提升了零样本动作识别的准确性，展示了其在视频理解领域的潜力。

文本增强的零样本动作识别：一种无训练的方法

BriefGPT - AI 论文速递 ·

本文探讨了零样本学习在视频动作识别中的应用，提出了视觉-语义映射、数据加权和渐进式语义引导视觉Transformer（ZSLViT）等新模型和方法，显著提升了多个数据集上的识别性能，解决了领域移位和泛化问题。

ZeroMamba：探索零样本学习的视觉状态空间模型

BriefGPT - AI 论文速递 ·

本文介绍了一种基于深度学习的暴力行为自动识别方法，结合卷积神经网络和长短时记忆网络，识别精度高。研究提出了多模态神经网络和Flow Gated Network模型，建立了包含2000个监控视频的数据集，测试准确率达到87.25%。此外，探讨了深度学习在视频动作识别中的应用及未来研究方向。

比较分析：利用迁移学习的视频暴力识别

BriefGPT - AI 论文速递 ·

本文介绍了一种新的视频动作识别框架TSN，利用时间段网络学习ConvNet模型，在HMDB51和UCF101数据集上表现优异。还提出了记忆增强网络和时空建模机制等改进方法，进一步提升了动作识别的效果和准确性。

时序差分侧网络用于图像到视频的迁移学习

BriefGPT - AI 论文速递 ·

本文探讨了通过引入可解释的时空注意力机制和多任务学习来提升视频动作识别的准确性和模型解释性。研究表明，弱监督方法和运动注意力算法能有效提高视频显著对象检测和动作识别的性能，尤其在多个数据集上取得了先进的结果。

运动与注意力：视频运动提示

BriefGPT - AI 论文速递 ·

本文提出了一种新颖的跨领域少样本视频动作识别方法，结合自监督学习和课程学习，以应对多样性挑战。通过CapFSAR框架和SAFSAR模型，利用预训练的多模态模型提取特征，显著提升了分类性能。此外，研究还提出了动态自适应细化方法和基于元学习的少样本迁移学习方法，验证了其在跨域任务中的有效性。

视频基于少样本行为识别模型的跨领域能力理解

BriefGPT - AI 论文速递 ·

本文探讨了对比学习中的数据增强方法，提出了LEAVES和ECPP新框架，以提高时间序列和视频动作识别的性能。研究表明，这些方法在多个基准测试中表现优异，显著提升了无监督和半监督任务的准确性。

CoViews：利用合作视图进行自适应增强对比学习

BriefGPT - AI 论文速递 ·

本文探讨了不确定性建模在视频动作识别和事故预测中的应用，提出了多种模型和方法，包括基于视频级标签的识别模型、背景帧检测和事故预测模型。研究表明，这些方法在多个数据集上表现出优越的性能，有效提高了预测的准确性和鲁棒性。

不确定性增强的鲁棒视频活动预测

BriefGPT - AI 论文速递 ·

本文介绍了DeepSegmenter框架，旨在识别驾驶员异常行为，取得了0.5426的活动重叠得分。研究结合视频动作识别和2D姿势估计，提升了定位和分类准确性。提出的深度注意力感知特征框架实现厘米级定位精度，适用于自动驾驶，并探讨了交通视频分析的深度学习方法，强调安全性和处理流程。

深度定位：利用变点检测进行时序动作定位

BriefGPT - AI 论文速递 ·

本文提出了一种隐私保护的视频动作识别模型，通过对抗训练实现性能与隐私保护的平衡。构建了新的视频数据集PA-HMDB51，以支持视觉隐私研究。研究表明，面部模糊化对识别准确性影响较小，提出的自监督学习框架能够有效删除隐私信息。实验结果显示，使用DeepObfuscator后，重建图像质量下降，隐私信息分类准确度降低，从而确保隐私安全。

用于行动识别的选择性、可解释性和动作一致的隐私属性混淆

BriefGPT - AI 论文速递 ·

本文综述了视频动作识别在运动分析中的应用，涵盖个人和团队运动，探讨了深度学习在网球和乒乓球分析中的潜力与挑战，并开发了相关工具箱和数据集，以提高运动表现评估的准确性。

VideoBadminton：一个用于羽毛球动作识别的视频数据集

BriefGPT - AI 论文速递 ·

提出了一种名为Slice Shift UNet (SSH-UNet)的新型二维模型，通过移动部分特征图重新融合被2D卷积忽视的第三个维度。验证了该方法在多模态腹部多器官分割和除颅骨外多图谱标记数据集中的有效性，表明SSH-UNet在性能上与最先进的架构相媲美，且更高效。

TCSloT：牙种植位置预测的文本引导三维背景和坡度感知三元网络

BriefGPT - AI 论文速递 ·