暗环境下采用时间编码事件驱动神经网络的注视向量估计
内容提要
本文提出了一种基于预测编码模型的时间注意机制,通过在无法预测时关注视觉事件,减少能耗和计算量。研究表明,该机制可将数据通信量减少46.7%,计算活动减少43.8%。此外,介绍了新颖的神经网络架构和自监督学习方法,提升了视频字幕生成、眼动追踪和光流估计等任务的性能。
关键要点
-
提出了一种基于预测编码模型的时间注意机制,能够在无法预测时关注视觉事件,减少能耗和计算量。
-
该机制可将数据通信量减少46.7%,计算活动减少43.8%。
-
介绍了一种新颖的神经网络架构,利用卷积门控循环单元提取特征图,表现优于现有方法。
-
通过人眼注视追踪信息定义注意力机制,提高视频字幕生成任务的性能,提出了GEAN模型。
-
提出了一种用于眼动追踪的神经形态学方法,结合脉冲神经网络和低功耗处理器,提高系统精确度和效率。
-
介绍了一种改进的3D编码事件数据的方法,提出3D-FlowNet网络进行光流估计,具有更好的性能。
-
提出了一种轻量级、无监督学习的架构ECN,能够从稀疏事件数据中生成密集深度和光流。
-
提出了一种基于动态视觉传感器的跟踪算法,在低光和噪声条件下有效检测和跟踪移动对象。
延伸问答
时间注意机制如何减少能耗和计算量?
时间注意机制通过在无法预测时关注视觉事件,减少了传感器与处理器之间的数据通信量和计算活动,分别减少46.7%和43.8%。
GEAN模型在视频字幕生成中有什么优势?
GEAN模型利用人眼注视追踪数据提供时空注意力,显著提高了视频字幕生成的性能,成为最先进的方法。
3D-FlowNet网络在光流估计中表现如何?
3D-FlowNet网络通过改进的3D编码事件数据方法,采用自监督训练策略,表现出更好的光流估计性能。
ECN架构的特点是什么?
ECN架构是一种轻量级、无监督学习的模型,能够从稀疏事件数据中生成密集深度和光流,且在低光照环境下表现优良。
如何提高眼动追踪系统的精确度和效率?
通过结合脉冲神经网络和低功耗处理器,利用动态视觉传感器捕获的事件数据,可以提高眼动追踪系统的精确度和效率。
在低光和噪声条件下,如何有效跟踪移动对象?
提出的跟踪算法可以在极低光和噪声条件下,无需外部传感器和特征跟踪,直接检测和跟踪移动对象。