MatchTime: 自动足球比赛评论生成
原文中文,约300字,阅读约需1分钟。发表于: 。本文通过创建更强大的足球比赛评论生成基准数据集 SN-Caption-test-align,利用多模态时间对齐流程构建出高质量的训练数据集 MatchTime,训练了一个自动评论生成模型 MatchVoice,并通过广泛实验和消融研究证明了对齐流程的有效性和在评论生成任务中带来的显著性能提升。
本研究介绍了SoccerNet-Echoes数据集,利用ASR技术自动生成足球比赛音频解说的文字转录,丰富了视频内容,提升了动作定位、自动字幕生成和比赛摘要等多样化应用领域。SoccerNet-Echoes结合视觉、听觉和文字信息,为算法开发提供全面资源,强调多模态方法在运动分析中的意义,推动该领域的研究和发展。