本研究提出了一种“可靠性保障的变换器”(RT)算法,旨在解决离线强化学习中的不可靠轨迹问题。RT算法通过计算轨迹的累计可靠性,生成高回报轨迹,并在多个基准任务中表现出优越性。
本研究提出了一种集体蒙特卡罗树搜索(CoMCTS)方法,以提高多模型大语言模型(MLLM)的推理效率。实验结果显示,基于CoMCTS训练的Mulberry模型在基准任务中表现优异,具有良好的应用前景。
本研究提出了一种新型预训练策略,强调氨基酸残基间的相互作用,提升了从序列数据中提取共演化特征的能力。实验结果表明,该模型在多个基准任务中表现优异,标志着蛋白质序列建模的重大进展。
该论文提出了一种名为“近无限批量大小缩放”(NIBS)的方法,旨在解决对比学习模型的内存限制。通过将损失计算与梯度更新的数据解耦,研究者实现了更大的有效批量大小,从而显著提升了多项基准任务的性能,为处理更大、更复杂的数据集提供了新机遇。
研究发现自监督视觉预训练对像素学习运动控制任务有效。作者提出手工设计的基准任务,包括运动、场景和机器人等方面的变化。实验结果显示,通过视觉编码器和强化学习,成功率高达80%,能与理论最好状态匹敌。野外图像如YouTube和自我中心视频在各操作任务的视觉表现上优于ImageNet图像。
本研究提出了“形象化语言图像识别”数据集,研究了多模态形象化语言的难点,并初步研究了基准任务和基线模型。结果显示,模型在多模态形象化语言理解上不如人类。该数据集和任务将促进模型对形象化语言的理解。
本研究介绍了一种名为MGSSL的基于图形的分子数据自我监督学习方法,通过自生成基元的预训练框架,捕获分子图中的丰富信息,并在不同基准任务上实验,结果显示该方法优于最先进的基线。
通过使用模型模拟,摊销贝叶斯推理训练神经网络以解决随机推理问题。提出了一种新的摊销推理方法Simformer,克服了当前模拟为基础的摊销推理方法的局限性,且在基准任务上优于当前最先进的摊销推理方法。具有更大的灵活性,可以应用于具有函数值参数的模型,处理具有缺失或非结构化数据的推理场景,并能够采样参数和数据的任意条件联合分布。在生态学、流行病学和神经科学的模拟器上展示了Simformer的性能和灵活性,并证明了它的新的可能性和应用领域。
第六届野外情感行为分析竞赛关注情感相关的基准任务,包括估计情感维度、识别表情和动作单元等。竞赛的更多信息可在网站上找到。
本研究介绍了一种新的基于图形的分子数据自我监督学习方法MGSSL,通过自生成基元的预训练框架,捕获分子图中的丰富信息,并在下游基准任务中表现优于最先进的基线。
该研究提出了新的评估基准,用于评估 AQG 系统在长文本答案下的性能。变压器模型在长答案方面表现优于其他 AQG 方法,但仍存在性能下降的情况。长答案 QA 是未来研究的具有挑战性的基准任务。
完成下面两步后,将自动完成登录并继续当前操作。