本研究提出了一种“可靠性保障的变换器”(RT)算法,旨在解决离线强化学习中的不可靠轨迹问题。RT算法通过计算轨迹的累计可靠性,生成高回报轨迹,并在多个基准任务中表现出优越性。
本研究提出了一种集体蒙特卡罗树搜索(CoMCTS)方法,以提高多模型大语言模型(MLLM)的推理效率。实验结果显示,基于CoMCTS训练的Mulberry模型在基准任务中表现优异,具有良好的应用前景。
本研究提出了一种新型预训练策略,强调氨基酸残基间的相互作用,提升了从序列数据中提取共演化特征的能力。实验结果表明,该模型在多个基准任务中表现优异,标志着蛋白质序列建模的重大进展。
该论文提出了一种名为“近无限批量大小缩放”(NIBS)的方法,旨在解决对比学习模型的内存限制。通过将损失计算与梯度更新的数据解耦,研究者实现了更大的有效批量大小,从而显著提升了多项基准任务的性能,为处理更大、更复杂的数据集提供了新机遇。
本文介绍了一个基于汽车激光雷达的大型数据集,旨在推动激光语义分割研究。作者提出了三项基准任务,展示了需要更复杂模型来处理这些任务。该数据集为新方法开发和研究方向提供了丰富的数据,促进了语义场景补全技术的进步。
本文介绍了Qwen-Audio模型,旨在提升音频理解能力,覆盖30多项任务和多种音频类型。通过多任务训练框架,Qwen-Audio在多个基准任务中表现优异,且无需特定任务微调。此外,基于此模型开发了Qwen-Audio-Chat,实现多轮对话,支持多种音频场景。
通过使用模型模拟,摊销贝叶斯推理训练神经网络以解决随机推理问题。提出了一种新的摊销推理方法Simformer,克服了当前模拟为基础的摊销推理方法的局限性,且在基准任务上优于当前最先进的摊销推理方法。具有更大的灵活性,可以应用于具有函数值参数的模型,处理具有缺失或非结构化数据的推理场景,并能够采样参数和数据的任意条件联合分布。在生态学、流行病学和神经科学的模拟器上展示了Simformer的性能和灵活性,并证明了它的新的可能性和应用领域。
本研究介绍了一种新的基于图形的分子数据自我监督学习方法MGSSL,通过自生成基元的预训练框架,捕获分子图中的丰富信息,并在下游基准任务中表现优于最先进的基线。
该研究提出了新的评估基准,用于评估 AQG 系统在长文本答案下的性能。变压器模型在长答案方面表现优于其他 AQG 方法,但仍存在性能下降的情况。长答案 QA 是未来研究的具有挑战性的基准任务。
完成下面两步后,将自动完成登录并继续当前操作。