该论文介绍了为11种印度语言引入神经信息检索资源的工作,包括使用机器翻译创建的数据集和神经信息检索模型集合。实验证明,该资源在多种印度语言上取得了显著改进。
该研究使用深度神经网络同时学习模型和策略,提出使用模型集合来维护模型的不确定性并规范学习过程。通过使用“likelihood ratio”导数,可以获得更加稳定的学习。该方法在连续控制基准任务中,显著减少了比基于模型的深度RL方法所需的样本数量。
完成下面两步后,将自动完成登录并继续当前操作。