本研究提出了体育视频评论生成的新任务及基准SCBench,评估视频大型语言模型的细粒度时序视觉能力。结果显示,InternVL-Chat-2在该基准上表现最佳,为复杂视觉理解任务提供了新视角。
本研究提出了一种新的国际象棋评论生成方法(CCC),结合了专家模型的决策优势与语言模型的流畅性,并开发了评估工具(GCC-Eval),以提高评论的质量和可评估性。实验结果表明,CCC生成的评论准确且信息丰富,对模型的解释性和人类教育具有重要影响。
完成下面两步后,将自动完成登录并继续当前操作。