本研究提出了一种变化适配网络(CANet),旨在解决遥感图像变化检测方法的泛化性能差的问题。CANet结合了共享与特定学习模块,通过轻量级适配器有效应对数据差异,快速适应新任务。实验结果表明,其在多个数据集上表现优异。
本研究探讨了安全大型语言模型(LLMs)训练中的问题,指出拒绝训练方法在应对超出分布攻击时的局限性。提出通过推理监督引导模型利用潜在知识,以提高模型的泛化性能和安全性,实验结果表明该方法有效增强了模型的健壮性。
本研究探讨了深度学习优化中历史迭代对更新的影响,提出了一种新方法识别无记忆算法,并揭示了记忆对优化动态的隐性影响。研究表明,Lion算法缺乏AdamW的反正则化特性,理论上支持Lion算法具有更好的泛化性能。
本研究提出了一种主动的长尾发现过程,通过想象额外数据来解决预测模型部署后的挑战。研究表明,长尾引导生成的训练数据显著提升了图像分类的泛化性能,并有助于发现和解释模型中的概念差距。
本研究探讨了强化学习代理在高维观察中构建元表征的挑战,提出元表征学习能够提升任务的泛化性能,并假设深度互学习有助于代理收敛到元表征。实证结果支持了这一理论,为深度强化学习的泛化提供了新视角。
本研究提出了一种新颖的IKUN初始化方法,旨在改善脉冲神经网络(SNNs)的训练和泛化性能。IKUN通过方差稳定技术和替代梯度函数,显著加速收敛,训练准确率提高至95%,泛化准确率达到91%,训练效率提升50%。
本研究解决了高能物理中监督学习模型对蒙特卡罗模拟的依赖。通过四种白盒对抗攻击,分析方法降低了局部极小值的尖锐度,显著提升了模型的泛化能力,尽管计算复杂性有所增加。
本研究提出了一种新方法,通过引入中间层改善梯度传播,提升动态稀疏训练在大输出空间分类任务中的效率,恢复密集模型的泛化性能,实现高效训练。
我们提出了Adv3D,这是首次将对抗样本建模为神经辐射场(NeRF)。通过最小化3D检测器的置信度,我们训练了具有真实外观和3D准确性的对抗性NeRF。实验表明其在不同场景和检测器中具有良好的泛化性能,并提供了一种数据增强的防御方法。
本研究提出了一种新黑箱优化算法SABO,通过重新参数化目标函数和更新参数化分布,提升模型泛化性能。理论分析证明了其收敛速率和泛化界限,实验结果验证了其有效性。
斯坦福大学李飞飞团队提出“数字表亲”概念,通过ACDC方法将真实数据转化为模拟数据,提升机器人学习的泛化能力。数字表亲保留几何和语义特质,实验显示其在零样本迁移中成功率达90%,优于数字孪生。ACDC自动生成交互场景,降低成本并提高跨域泛化。
本文介绍了一种新方法,使用固定位置编码来确定注意力权重,称为位置注意力。该方法解决了神经网络在算法任务中泛化性能差的问题,提升了超出分布的表现,并保持模型的表现力,使变换器能有效模拟并行算法。
文章利用随机矩阵理论和自由概率工具推导高维岭回归模型的性能,提供公式识别性能的幂律缩放来源。研究发现,$S$变换与训练-测试泛化差距相关,并类比广义交叉验证。通过这些技术,分析随机特征模型的偏差-方差,揭示特征方差和权重结构对性能的限制,扩展对神经缩放定律的理解。
本研究提出SetPINNs方法,通过结合有限元方法和物理约束,解决传统物理信息神经网络在偏微分方程中忽略隐含依赖的问题。实验表明,SetPINNs在多个物理系统中具有更好的泛化性能和准确性。
本文介绍了一种名为Violina的新方法,用于识别线性时间不变非马尔可夫动态模型。该方法通过投影梯度下降优化模型参数,使其预测与多个数据集匹配。实验表明,Violina在识别此类系统时优于现有方法。
本研究提出一种尖锐渐近分析方法,简化高维稀疏回归中的超参数选择。研究表明,忽略部分信息对泛化性能影响小,并在IMDb数据集上验证了理论的实际应用潜力。
该研究提出了一种利用扩散概率模型(DPMs)来减轻简洁性偏见的多样化框架。通过在训练中生成新特征组合的图像,DPMs提高了模型多样性,无需额外监督信号。实验表明,该方法在泛化和多样化性能上优于传统方法。
大型语言模型在交互式规划中表现出色。本文介绍了参数化世界知识模型(WKM),通过自我合成知识和提供任务与状态知识来改进规划。实验显示,该方法在复杂数据集上减少了盲目试错和幻觉行为,增强了对世界的理解。WKM具有良好的泛化性能,弱WKM能指导强代理模型,统一训练WKM有潜力。
本文提出了一种离线策略梯度方法,通过构建可微分的数据驱动模拟器来学习城市驾驶的模仿策略。通过在100小时的专家演示上进行训练,展示其能够学习出高泛化性能和多种驾驶动作的城市驾驶策略,并且无需进行复杂的状态扰动或采集进一步的在线策略数据而在真实世界中优于现有的最新城市驾驶方案。
本文介绍了AAUformer网络,通过平衡外极线的影响,实现了出色的泛化性能。该模型引入了窗口自注意力和多尺度交替注意力骨干网络,解放了像素级单视图的局部语义特征,并在多个数据集上进行了比较和消融研究,证明了其在场景流数据集上达到了最先进的效果。在KITTI 2015数据集上的微调性能也具有竞争力,并在合成和实际数据集上的交叉泛化实验中优于其他方法。
完成下面两步后,将自动完成登录并继续当前操作。