BriefGPT - AI 论文速递 ·

暗环境下采用时间编码事件驱动神经网络的注视向量估计

💡 原文中文，约1500字，阅读约需4分钟。

📝

内容提要

本文提出了一种基于预测编码模型的时间注意机制，通过在无法预测时关注视觉事件，减少能耗和计算量。研究表明，该机制可将数据通信量减少46.7%，计算活动减少43.8%。此外，介绍了新颖的神经网络架构和自监督学习方法，提升了视频字幕生成、眼动追踪和光流估计等任务的性能。

🎯

❓

时间注意机制通过在无法预测时关注视觉事件，减少了传感器与处理器之间的数据通信量和计算活动，分别减少46.7%和43.8%。

GEAN模型利用人眼注视追踪数据提供时空注意力，显著提高了视频字幕生成的性能，成为最先进的方法。

3D-FlowNet网络通过改进的3D编码事件数据方法，采用自监督训练策略，表现出更好的光流估计性能。

ECN架构是一种轻量级、无监督学习的模型，能够从稀疏事件数据中生成密集深度和光流，且在低光照环境下表现优良。

通过结合脉冲神经网络和低功耗处理器，利用动态视觉传感器捕获的事件数据，可以提高眼动追踪系统的精确度和效率。

提出的跟踪算法可以在极低光和噪声条件下，无需外部传感器和特征跟踪，直接检测和跟踪移动对象。

🏷️