小红花·文摘

针对一般分布属性的交互式证明

Apple Machine Learning Research ·

本文提出了一种新颖的演员-评论者算法，有效解决了策略评估和优化中的样本复杂度问题，能够以较低的样本复杂度实现$ ext{ε}$-最优策略，尤其在离线数据中表现突出。

Actor-Critic Achieves Optimal Sample Efficiency

BriefGPT - AI 论文速递 ·

改进的样本复杂度用于私有非光滑非凸优化

Apple Machine Learning Research ·

如何验证任何（合理的）分布特性：分布的计算上可靠的论证系统

Apple Machine Learning Research ·

本研究分析了对比学习在对抗噪声下的理论限制，揭示了样本复杂度的上下界。通过PAC学习和VC维度分析，提出了基于l2距离函数的数据相关样本复杂度界限，具有重要的理论和实践意义。

Contrastive Learning under Adversarial Noise

BriefGPT - AI 论文速递 ·

本研究解决了多类列表分类中的带约束反馈问题，提出了一种高概率返回$ ext{ε}$-最优假设的算法，并改进了样本复杂度界限，表明在$s=O(1)$的情况下，带约束反馈几乎没有额外成本。

Constrained Problems in Multi-Class List Classification

BriefGPT - AI 论文速递 ·

本研究解决了KL正则化上下文强盗的样本复杂度问题，提出的算法实现了$ ilde{O}(rac{1}{ ext{ε}})$的样本复杂度，展示了算法的近似最优性，并扩展到上下文对抗强盗问题。

Near-optimal Sample Complexity of Offline KL-Regularized Contextual Bandits under Single-Policy Concentration

BriefGPT - AI 论文速递 ·

本研究首次从$( ext{ε}, ext{δ})$-PAC视角解决在线多奖励多策略折扣设置中的政策评估问题，采用改进的MR-NaS探索方案，实现了样本复杂度的联合最小化，实验结果验证了其有效性。

Adaptive Exploration for Multi-Reward Multi-Policy Evaluation

BriefGPT - AI 论文速递 ·

本文提出了一种新颖的度量方法——最大子群差异（MSD），有效解决了经典度量方法在偏见评估中的高样本复杂度问题。MSD以线性样本复杂度评估特征子群的偏差，并提供实用算法和修复路径，实证结果表明其优于其他方法。

Detecting Bias through Maximum Subgroup Difference

BriefGPT - AI 论文速递 ·

指纹编码与几何相遇：私密查询发布和自适应数据分析的改进下界

Apple Machine Learning Research ·

本研究提出了一种具有多重外推动量的随机一阶方法（SFOM），用于高度平滑的无约束随机优化问题。该方法通过多次外推和动量步骤加速优化，实验和理论分析表明其样本复杂度优于现有最佳结果，具有实际应用潜力。

Stochastic First-Order Method with Multiple Momentum for Highly Smooth Unconstrained Optimization

BriefGPT - AI 论文速递 ·

本研究提出了一种新颖的强化学习算法——软分析策略优化（SAPO），旨在解决软体物体仿真中的数据质量和样本复杂度问题，并开发了并行平台Rewarped，以提升强化学习在刚体和可变形体任务中的应用效果。

在可微多物理仿真中稳定强化学习

BriefGPT - AI 论文速递 ·

本研究探讨了学习矢量值线性预测器，重点分析了具有凸和Lipschitz损失函数的情况。我们详细描述了样本复杂度，并展示了随机凸优化与矢量值线性预测之间的关系，具有重要的理论和实践意义。

Complexity of Vector-valued Prediction: From Linear Models to Stochastic Convex Optimization

BriefGPT - AI 论文速递 ·

变换不变学习及其在OOD泛化中的理论保证

Apple Machine Learning Research ·

该研究提出了一种新的下界，以优化差分隐私算法在高维数据库中的样本复杂度，并引入了$f$-差分隐私的概念，改进了隐私保护方法。通过理论和实验，展示了新方法在数据分析和机器学习中的优势，强调了差分隐私的重新定义和应用的重要性。

差分隐私的拉普拉斯变换解释

BriefGPT - AI 论文速递 ·

本研究提出了一种新的样本复杂度，显著降低了在近似差分隐私下学习高斯混合模型的样本需求，尤其在高维情况下。

高效样本私人学习高斯混合模型

BriefGPT - AI 论文速递 ·

本文探讨了无监督学习中的解耦表示，提出了一种基于变分推理的方法，通过引入正则化项和新的分离度量，显著改善了分离效果和数据重建质量。研究表明，增加解耦性并不一定降低样本复杂度，未来应关注归纳偏置和隐式监督的影响。

解开解缠表示：通过扩散模型改善潜在单元

BriefGPT - AI 论文速递 ·

本文比较了传统与量子学习者在PAC框架下的生成模型能力，证明传统算法无法高效学习，而量子学习器表现优越。研究探讨了量子记忆对学习复杂度的影响，提出量子学习协议在样本复杂度上有显著降低，并强调数据隐私在量子机器学习中的重要性，揭示了隐私泄露的潜在风险。

交互证明在验证（量子）学习和测试中的应用

BriefGPT - AI 论文速递 ·

本文探讨了多类分类中的适当性障碍，并提出通过简单适当学习者的聚合来克服这一问题。研究表明，该方法在有限图维度类别中显著改善样本复杂度，优于经验风险最小化（ERM），并揭示单个ERM学习者在某些类别中的样本需求高于理论下界。

Understanding Aggregations of Proper Learners in Multiclass Classification

BriefGPT - AI 论文速递 ·

本研究探讨了无模型深度强化学习在高维复杂操作任务中的应用，提出多种算法，通过少量人工演示显著降低样本复杂度，提升机器人在真实环境中的自主学习和优化能力。实验结果表明，这些方法有效提高了机器人在复杂任务中的成功率。

基于人机协作的精确灵活机器人操控强化学习

BriefGPT - AI 论文速递 ·