本文回顾了视觉+语言领域中的多个任务和模型,并提出了将这些任务分为3个类别的思想。研究表明,未来的工作应该专注于交互式游戏,其中自然语言的交流对于解决不确定性是必要的。这些是发展基于神经模型的关键要求。
完成下面两步后,将自动完成登录并继续当前操作。