小红花·文摘

本文介绍了一种基于CLIP的驾驶员活动识别方法，能够识别驾驶员的分心行为，并具备零样本迁移和微调能力。研究探讨了利用人类驾驶数据改进自动驾驶系统的方法，提出了多种深度学习框架用于疲劳检测和行为识别，展现出优越的性能和可解释性。此外，DriveVLM系统利用视觉-语言模型进行场景理解，增强了自动驾驶的推理能力。

使用来自视觉 - 语言模型的通用表示进行驾驶员活动分类

BriefGPT - AI 论文速递 ·

本文探讨了多模态融合技术在自动驾驶中的应用，特别是通过TransFuser整合图像和LiDAR数据，以提升复杂场景下的感知能力。研究显示，该方法在减少碰撞和提高驾驶员监控准确性方面表现优异，尤其在疲劳检测和分心驾驶识别中，准确率达到96.8%。同时，文中总结了多模态融合的挑战与未来发展方向。

M2DA：多模态融合 Transformer 结合驾驶员注意力用于自动驾驶

BriefGPT - AI 论文速递 ·