本文介绍了KungfuBot,一种基于物理的人形机器人运动控制方法。该方法通过视频提取运动数据,筛选符合物理约束的动作,并利用自适应机制优化跟踪奖励,以实现机器人模仿人类动作的目标。研究者提出了双层优化框架,提升了机器人在复杂动态环境中的表现。
本研究探讨了神经网络参数重构训练数据的隐私问题,提出了一种双层优化的新公式。实验表明,随机初始化的训练图像能够有效生成重构样本,从而保护训练数据的隐私。
本研究提出了一种新的贝叶斯方法,解决深度学习中的数据点选择问题,克服现有双层优化方法的计算和内存瓶颈,支持大规模语言模型的自动优化。
本研究提出了一种名为AutoAL的主动学习策略,通过两个神经网络在可微分的双层优化框架下优化,解决了不同数据场景下主动学习算法效果差异大的问题。该方法能有效识别最优策略,提高模型准确性,并展示了整合现有主动学习方法的潜力。
本研究解决了多序列随机逼近(MSSA)的理论局限,提出了无需固定点光滑性假设的单时间尺度分析。结果表明,若所有算子强单调,MSSA的收敛速度为$ ilde{ ext{O}}(K^{-1})$;若主算子非单调,速度为$ ext{O}(K^{-rac{1}{2}})$。这一发现简化了双层优化和通信高效分布式学习的算法及性能保证。
本研究提出了两种无须调优的算法D-TFBO和S-TFBO,解决双层优化中步长调节依赖参数的问题。D-TFBO通过“累积梯度范数的逆”自适应调整步长,S-TFBO通过单环结构更新变量。实验表明,这些算法无需调优即可达到现有方法的性能,并且对初始步长选择更具鲁棒性。
本研究提出BiSSL,一种通过双层优化增强自监督学习的训练框架,改善预训练与微调阶段的对齐,提高下游任务的参数初始化。实验显示,BiSSL在多个图像分类数据集上提升了分类精度。
本研究提出了一种数据驱动的双层优化方法,解决分子性质预测中标签稀缺的问题。通过自动获取最佳迁移比率,实现多任务迁移学习,提升了40种分子性质的预测性能,并加快训练速度,克服了手动设计的局限性。
本研究提出了一种多形式攻击策略,利用梯度进化的双层优化框架,提高跨模态对抗攻击的有效性。测试结果表明,该策略在增强对抗攻击的可转移性方面优于现有技术,为理解跨模态系统的安全漏洞提供了新视角。
本文介绍了双层优化的概念,将图学习技术重新解释为双层优化的特殊情况或简化形式,并提出了更灵活的能量函数类,形成图神经网络的消息传递层。同时,探索了与非图神经网络图学习方法的联系,并通过实证结果展示了双层优化方法的多样性。
本文研究了双层优化的一阶算法,通过罚函数方法建立了罚函数与超目标之间的强连接,并提出了一阶算法来优化罚函数,以找到一个 ε- 稳定解。在满足小误差近似条件的情况下,算法以 O (ε^{-3}) 和 O (ε^{-7}) 程度的复杂度达到 ε- 稳定点。
完成下面两步后,将自动完成登录并继续当前操作。