LG-Gaze: Learning Geometric Perception Continuity for Language-Guided Gaze Estimation
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了LG-Gaze框架,将视线估计视为视觉-语言对齐问题,利用视觉-语言模型的先验知识,显著提升了视线估计的准确性和效率。
🎯
关键要点
- 本研究提出了LG-Gaze框架,旨在解决视线估计模型在有限训练数据集下无法泛化的问题。
- LG-Gaze框架将视线估计任务重构为视觉-语言对齐问题。
- 该框架利用视觉-语言模型的丰富先验知识,学习连续且与几何相关的特征。
- 通过这些方法,LG-Gaze显著提高了视线估计的准确性和效能。
➡️