LG-Gaze: Learning Geometric Perception Continuity for Language-Guided Gaze Estimation

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究提出了LG-Gaze框架,将视线估计视为视觉-语言对齐问题,利用视觉-语言模型的先验知识,显著提升了视线估计的准确性和效率。

🎯

关键要点

  • 本研究提出了LG-Gaze框架,旨在解决视线估计模型在有限训练数据集下无法泛化的问题。
  • LG-Gaze框架将视线估计任务重构为视觉-语言对齐问题。
  • 该框架利用视觉-语言模型的丰富先验知识,学习连续且与几何相关的特征。
  • 通过这些方法,LG-Gaze显著提高了视线估计的准确性和效能。
➡️

继续阅读