工业人机协作中的凝视检测与分析

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

通过研究人类注视和深度神经网络注意力机制之间的相互作用,提出了一种新的注视辅助图像字幕模型,能够改善图像字幕性能,并提高语义场景理解的任务。

🎯

关键要点

  • 研究人类注视与深度神经网络注意力机制的相互作用。
  • 提出了一种新的注视辅助图像字幕模型。
  • 将人的注视信息集成到基于注意力的 LSTM 结构中。
  • 算法能够选择性地分配到注视和非注视的图像区域。
  • 通过 COCO / SALICON 数据集评估,显示模型改善了图像字幕性能。
  • 注视信息可以补充机器的注意力,提高语义场景理解的任务。
➡️

继续阅读