本研究提出SimulS2S-LLM方法,解决大语言模型在实时语音翻译中的并行推理问题,通过离线训练和策略指导,实现高质量的语音即时翻译。
本研究提出了一种新颖的分层规划框架,旨在解决在系统动态未知的情况下为信号时序逻辑(STL)任务生成可执行规划的问题。该方法通过利用任务无关的数据进行离线训练,实现了对新STL任务的零-shot泛化,仿真结果表明其在多个STL任务中表现有效。
Polyjuice是为单节点多核设置而设计的并发控制算法,使用进化式强化学习和离线训练来搜索细粒度操作的策略空间,以提高吞吐量。Polyjuice在中度竞争和重度竞争工作负载下表现良好,可以提高高争用和中争用下的吞吐量。
该文介绍了一种深度强化学习方法,通过离线训练优化器,最小化神经网络计算图的执行成本。该方法在运行时间和峰值内存使用量上都有显着的改进。
完成下面两步后,将自动完成登录并继续当前操作。