本文介绍了一种全卷积循环网络(FCRN)框架,用于手写汉字文本识别。FCRN通过在线数据训练,学习笔尖轨迹与字符序列的关联,并采用优化的波束搜索方法集成语言模型,显著提高识别率。在CASIA-OLHWDB和ICDAR 2013数据集上,分别达到了96.40%和95.00%的正确率。
本文介绍了一种改进的推测解码方法,旨在提高大型语言模型的效率。该方法结合了双模型推测解码和单模型方法Medusa的优势,通过采用轻量级的草稿头和循环依赖设计,结合波束搜索来过滤候选项。实证研究和综合分析验证了该方法的有效性。
本文介绍了使用序列建模解决强化学习问题的方法,使用Transformer架构建模轨迹分布并改造波束搜索作为规划算法。展示了该方法在长时间序列预测、模仿学习、目标条件下的强化学习和离线强化学习方面的灵活性和高效性。同时,与基于模型的算法相结合,在稀疏奖励和长时间序列任务中表现出最先进的计划器。
完成下面两步后,将自动完成登录并继续当前操作。