本文探讨了中文语法错误纠正系统的改进,提出了基于语言规则的大规模训练语料库和基准模型,以提高模型性能并帮助第二语言学习者理解语法规则。研究表明,新数据集和模型有效提升了纠错准确性,为未来研究提供了重要资源。
nuPlan 提供了首个大规模自动驾驶数据集和评估基准,旨在提升短期规划和长期预测的准确性。该数据集包含来自四个城市的1500小时人类驾驶数据,支持基于机器学习的规划器进行测试。研究指出模仿学习与传统方法的差距,并提出了强大的基准模型 PlanTF,展示了其在复杂场景中的优越性能。
该文章介绍了一种离线学习框架,通过利用大规模离线数据改善大型语言模型的学习性能。该框架引入离线数据驱动的发现和精炼框架,提升大型语言模型的决策能力,并持续优于基准模型。
该文章介绍了一种离线学习框架,通过利用大规模离线数据改善大型语言模型的学习性能。该框架引入离线数据驱动的发现和精炼框架,显著提升大型语言模型的决策能力,并在基于文本和代码的策略下持续优于基准模型。
本文研究了基于图卷积网络的协作过滤方法,提出了基于图滤波的协作过滤作为基准模型,并在实验中证明了其性能优于基于深度学习的方法。
该研究使用宏观模型和多源时空数据准确估计了无法测量的路段的交通流量和行程时间。实验结果显示,该模型在交通行程时间估计方面表现优于基准模型。
本研究提出了一种去噪微小目标检测器(DN-TOD),通过类别感知标签校验和趋势引导学习策略来解决类别偏移和边界框噪声问题。DN-TOD 在各种类型的标签噪声下表现出了鲁棒性,显著改进了基准模型 RFLA 在 40% 混合噪声下的性能。
本研究引入了PCoQA数据集,为会话式问答研究提供了波斯语数据集。该数据集包含9,026个背景驱动的问题,涉及提问者、回答者和维基百科文档。研究还介绍了多种基准模型的性能,并使用预训练模型提升了性能。数据集和基准模型可在Github页面获取。
该研究介绍了一个名为Taskmaster-1的新数据集,包含13,215个基于任务的对话,涵盖六个领域。该数据集使用两种不同的方法进行数据收集,并提供了多个基准模型,为基于任务的对话系统的研究、开发和设计提供了新的前景。
该研究比较了不同数据质量评估方法,发现困惑度方法效果最佳。研究提出了一种新方法,只需使用原始训练数据的30%即可改进基准模型。
该研究使用自动翻译工具将土耳其编程指南的语料库从2,000篇文章扩充到52,000篇,并实施了强大的基准模型。研究发现,针对步骤指令文本的语言专用模型在大多数任务上始终优于多语言模型。
该文章介绍了一种新的鲁棒性测量方法,用于评估图像分类模型的表现。该方法通过与基准模型进行比较,直接评估模型的鲁棒性性能,并使用新样本扩展图像数据集,以揭示模型的行为和评估策略。
完成下面两步后,将自动完成登录并继续当前操作。