工业人机协作中的凝视检测与分析
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
通过研究人类注视和深度神经网络注意力机制之间的相互作用,提出了一种新的注视辅助图像字幕模型,能够改善图像字幕性能,并提高语义场景理解的任务。
🎯
关键要点
- 研究人类注视与深度神经网络注意力机制的相互作用。
- 提出了一种新的注视辅助图像字幕模型。
- 将人的注视信息集成到基于注意力的 LSTM 结构中。
- 算法能够选择性地分配到注视和非注视的图像区域。
- 通过 COCO / SALICON 数据集评估,显示模型改善了图像字幕性能。
- 注视信息可以补充机器的注意力,提高语义场景理解的任务。
➡️