本文介绍了一种视觉分析工具,用于理解神经序列到序列模型的训练过程及错误检测。研究表明,结合显著性模型与预训练模型可以提升性能。此外,展示了一个多模态交互预测系统,支持机器翻译和图像字幕等任务,并提出了自动提示方法AutoSeq,利用自然语言生成标签序列,展示了序列到序列模型的潜力。
本文介绍了一种名为Imputer的神经序列模型,通过插值迭代生成输出序列。Imputer是一种迭代生成模型,通过动态规划训练算法,可以近似边际化输入和输出序列之间的对齐和生成顺序。在端到端语音识别中,Imputer优于非自回归模型,并与自回归模型取得竞争性结果。在LibriSpeech test-other上,Imputer的成绩为11.1 WER,优于CTC的13.0 WER和seq2seq的12.5 WER。
完成下面两步后,将自动完成登录并继续当前操作。