建立可靠的跨语言视觉问答系统是具有挑战性的问题,缺乏训练样本。最近的研究发现翻译人工痕迹对模型产生显著影响。为了缓解这一影响,提出了简单的数据增强策略。研究还提出了改进策略来提高跨语言问题回答的性能。
我们提出了一种名为TLDNN的混合深度框架,将Transformer和LSTM相结合,通过自注意机制建模信号序列的全局相关性以增强时间依赖性的捕捉,并采用数据增强策略来提高模型对调制相关特征的鲁棒性。实验结果表明,该方法在广泛使用的数据集上取得了最先进的性能并具有显著优势。
该研究提出了一种在文本中包含时间戳的日期前缀文本输入预训练语言模型的框架,通过自标记训练学生模型和数据增强策略提高了性能。在LongEval-Classification评估集上获得了第二名的排名。
本研究提出了一个半监督学习框架,通过自我训练、伪标签选择和数据增强策略,在无类别依赖运动预测中使用较少标记数据的超越自监督方法,并达到了与弱监督和一些全监督方法相当的性能水平。
SCPQ模型通过注意力机制、伪标签和数据增强策略以及难样本挖掘损失函数提高外星行星撞击坑检测的健壮性和跨领域性能。实验结果显示,在DACD数据集上相较于基准,SCPQ模型性能更好,跨领域检测召回率提高了24.04%。
该文介绍了一种通过构建文本到音乐模型来生成新音乐的方法,通过分布式扩散模型和音频广义线性模型进行训练,解决了音乐生成过程中的数据不足、版权和抄袭等问题。通过节拍跟踪和数据增强策略,实现对训练数据的重组,生成多样化且保持风格一致的音乐。通过评估指标证明了该模型和策略能够提高生成音乐的质量、创新性和与输入文本的对应关系。
完成下面两步后,将自动完成登录并继续当前操作。