本研究探讨了视觉语言模型在自动驾驶中对行人动态手势的理解能力,并创建了两个手势数据集。结果表明,现有模型在手势解读方面的准确性不足,强调了进一步研究的必要性。
完成下面两步后,将自动完成登录并继续当前操作。