本研究探讨了预测模型在协变量变化下的训练与测试不匹配问题,提出了一种分析方法,将基础预测器的推广性与加权保型风险控制效率关联。研究揭示了预测集的信息性、协变量变化程度及校准与训练集大小之间的关系,为提高模型预测效率提供理论依据。
该研究提出了一种元学习方法,通过演化可微损失函数优化策略,提升梯度强化学习算法的效率。实验表明,演化策略梯度算法(EPG)在多个随机环境中学习更快,且损失函数在测试任务中表现出良好的推广性,与其他元学习算法不同。
本研究探讨了在有限标注预算下设计下游任务(如估计植被覆盖)时的挑战,特别是在选择基础模型和标注样本的过程中。通过对八个现有基础模型进行大规模消融研究,我们揭示了空间可推广性的局限性和基础模型的有效性,发现不同区域和任务的性能及不确定性表现差异显著,这对实际应用具有重要影响。
大型语言模型(LLMs)在图推理方面有潜力,但对于其是否能够学习可推广的图推理技能还不清楚。研究者提出了NLGift基准测试,评估LLMs在真实世界图任务上的效用。实验结果显示LLMs在简单模式下表现良好,但在推理和真实世界模式下难以推广。研究者探索了三种改进LLM图推理可推广性的策略,发现后训练对齐是最有希望的,但超越模式记忆仍是一个未解决的问题。
本文研究了具有挑战性的物理结构任务和深度强化学习代理的处理方式。结果显示,使用结构化表示和策略的代理表现更好且具有推广性。结构化表示和推理与强大的学习相结合是实现直观物理、场景理解和规划代理的关键路径。
研究发现大型语言模型存在滥用问题,越过道德保障进行破解攻击。研究呈现了不同破解方法和违规类别,强调了对破解方法评估的必要性,并为从业者提供了基准工具。
介绍了OPERA,第一个满足医疗应用需求的开放呼吸声基础模型预训练和基准系统。预训练了三个创新的基础模型,并构建了一个包含19个下游呼吸健康任务的基准。预训练模型在16个任务中表现出优越性能,并具有推广性和泛化能力。突显了呼吸声基础模型的巨大潜力,并鼓励更多使用OPERA进行呼吸音频研究加速的研究。
HG-SCM是一种模拟人类感知和决策过程的模型,具有高预测能力和推广性。与其他模型相比,HG-SCM在实证数据集上表现最好,因果图与领域知识和人类认知相吻合,具有较强的可解释性。在透明度和可信度重要的场景中,HG-SCM是一个有潜力的解决方案。
本文介绍了分离式元强化学习(DCMRL)框架,通过学习和探索任务上下文和技能,获取可推广的先前经验并在元测试阶段适应未见目标任务。实验证明,DCMRL比先前方法具有更具推广性的先前经验,并在导航和机器人操纵任务中更有效。
完成下面两步后,将自动完成登录并继续当前操作。