本研究提出了一种基于跨模态知识蒸馏的半监督训练框架,显著提升了单目三维检测性能。通过双向LiDAR-Radar融合框架解决了雷达数据稀疏性问题,并在多个数据集上表现优异。此外,研究探讨了雷达与激光雷达数据融合在恶劣天气下的物体检测能力,提出了相机-雷达知识蒸馏框架,进一步提升了检测性能。
本研究探讨了缺失模态对自我中心动作识别的影响,并提出了可学习的跨模态知识蒸馏模型(LCKD),在肿瘤分割中取得了显著的Dice分数提升。此外,研究还提出了一种基于弱监督学习的音视频暴力检测方法,以保持多模态性能并提升检测效果。
EmoDistill是一种新颖的语音情感识别框架,利用跨模态知识蒸馏从语音中学习情感表示。在IEMOCAP基准上的实验证明其优势,实现了77.49%的非加权准确率和78.91%的加权准确率。
完成下面两步后,将自动完成登录并继续当前操作。