DSDFormer:一种创新的变换器-马姆巴框架用于强大高精度的驾驶员分心识别
原文中文,约300字,阅读约需1分钟。发表于: 。本研究解决了驾驶员分心识别中的全球上下文和细粒度特征捕获能力不足的问题。提出的DSDFormer框架结合了变换器和马姆巴架构的优势,通过双状态领域注意力机制平衡长距离依赖性和细节特征提取,同时引入时序推理自信学习来优化噪声标签。研究表明,该模型在多项数据集上表现出色,能够显著提高驾驶员分心检测的准确性和鲁棒性,进而提升道路安全。
该研究介绍了PoseViNet,一种用于检测驾驶员分心的新方法。通过姿态估计和动作推理的视觉变换器框架,该方法能更好地识别关键动作。在SynDD1数据集上,PoseViNet实现了97.55%的验证准确率和90.92%的测试准确率。