本研究提出URECA数据集,解决了现有区域级描述方法在多粒度生成独特标题的问题,利用改进的多模态大语言模型生成语义丰富的区域描述。
本研究提出了一种基于检索增强生成(RAG)的手势生成方法RAG-Gesture,旨在解决现有神经系统在生成语义丰富手势方面的不足。该方法结合可解释的语言知识和示例运动库,实现自然且富有语义的手势生成,推动手势合成领域的发展。
完成下面两步后,将自动完成登录并继续当前操作。