面向情感的基于 Transformer 的变分自编码网络用于实时视频评论
发表于: 。自动实时视频评论是一个备受关注的领域,本文提出了一种基于情感的 Transformer 变分自编码器网络 (So-TVAE),通过情感导向的多样性编码器模块和批次注意机制,实现多样化的视频评论,包括多种情感和多种语义。在 Livebot 和 VideoIC 数据集上的广泛实验表明,所提出的 So-TVAE 在生成评论的质量和多样性方面优于现有方法。
自动实时视频评论是一个备受关注的领域,本文提出了一种基于情感的 Transformer 变分自编码器网络 (So-TVAE),通过情感导向的多样性编码器模块和批次注意机制,实现多样化的视频评论,包括多种情感和多种语义。在 Livebot 和 VideoIC 数据集上的广泛实验表明,所提出的 So-TVAE 在生成评论的质量和多样性方面优于现有方法。