小红花·文摘

检索优化器：贝叶斯优化

Redis Blog ·

通过方向修正解释和改进最优控制问题

Apple Machine Learning Research ·

本文提出了一种新的深度学习目标公式，以提高小训练集下深层网络的泛化能力，并介绍了一种几何感知的深度转换技术，支持鲁棒性分析。研究探讨了生成对抗网络中的模式坍塌问题，提出基于度量空间的方法改进目标函数，并验证了其在真实和合成数据上的有效性。此外，文中介绍了深度度量学习的新方法，强调了神经网络结构对表征的影响，并提出了可解释的几何卷积方法。

度量作为变换：探索超越仿射变换以实现可解释的神经网络

BriefGPT - AI 论文速递 ·

本文探讨了自我监督学习在小型标注数据集上的应用，提出了一种新目标函数以解决表示坍塌问题。研究表明，该方法通过正则化和对比学习提升模型性能，强调鲁棒性的重要性。实验结果显示，该框架在多种下游任务中表现优异。

无对比自监督学习的抗失效方法

BriefGPT - AI 论文速递 ·

这项研究揭示了深度神经网络在学习目标函数之前存在一个早期阶段，即初始模型的响应与目标标签的分布相匹配。研究通过实验证明了这个早期阶段的特征，并在人类学习者中也发现了对这个阶段的依赖。研究表明这是一种普遍存在的学习原则。

神经网络和人类中的最优恒定解的早期学习

BriefGPT - AI 论文速递 ·

该论文提出了一种基于最优传输理论的风险感知强化学习框架，通过修改目标函数平衡风险考虑和传统强化学习目标。

最优传输辅助的风险敏感 Q-Learning

BriefGPT - AI 论文速递 ·

本文研究了知识蒸馏在分布转移方面的机制，提出了一个统一而系统的框架，并对两个常见的分布转移进行了基准测试。实验结果揭示了有趣的教学性能观察结果。

公正中心技术简报：分布偏移的定义和检测

BriefGPT - AI 论文速递 ·

该论文提出了一种基于最优传输理论的风险感知强化学习框架，通过修改目标函数平衡风险考虑和传统强化学习目标。

网络上的模仿正则化最优输运：可证明的鲁棒性与物流规划应用

BriefGPT - AI 论文速递 ·

该论文提出了一种基于最优传输理论的风险感知强化学习框架，通过修改目标函数平衡风险考虑和传统强化学习目标。

通过策略空间中的最优传输测量强化学习中的探索

BriefGPT - AI 论文速递 ·

本文介绍了一种名为Safe Adversarial Trained Actor Critic（SATAC）的算法，用于在数据覆盖有限的情况下进行离线强化学习的训练。SATAC通过一个两个玩家的Stackelberg游戏进行操作，具有一个精细的目标函数。该算法在离线RL设置中可以产生优于行为策略的策略，并具有实际的鲁棒性。在实验中，SATAC在连续控制环境中的任务中表现优于所有基准算法。

离线 CMDPs 的对抗性训练的行动者评论家

BriefGPT - AI 论文速递 ·

该论文提出了一种基于最优传输理论的风险感知强化学习框架，通过修改目标函数，平衡奖励追求和风险意识，确保决策的可靠性。该研究为强化学习提供了一个有前景的方向。

在外科机器人环境中利用最优传输优化离线强化学习

BriefGPT - AI 论文速递 ·

该论文提出了一种用于近似协调优化中的目标函数的参数化凸次级法（PCM）方法。该方法利用参数化的log-sum-exp网络学习目标函数，并通过使用凸优化算法可靠且快速地找到全局最小值。

参数化的凸辅助目标函数逼近在摊还优化中的应用

BriefGPT - AI 论文速递 ·

该研究提出了一种新的目标函数，通过性能约束来最大化预期相关性，以确保学习排序的后验公平性。该方法在LTR框架中构建了一个组内公平的Plackett-Luce模型，并在三个真实数据集上进行了实验证明，相比LTR基线模型，在相关性和公平性方面具有更好的性能。

基于组公平的 Plackett-Luce 排名模型的相关性和事后公平优化

BriefGPT - AI 论文速递 ·