小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本文提出了一种新颖的演员-评论者算法,有效解决了策略评估和优化中的样本复杂度问题,能够以较低的样本复杂度实现$ ext{ε}$-最优策略,尤其在离线数据中表现突出。

Actor-Critic Achieves Optimal Sample Efficiency

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-06T00:00:00Z
改进的样本复杂度用于私有非光滑非凸优化

本文研究了针对非光滑和非凸的随机及经验目标的差分隐私优化算法,提出了一种改进的样本复杂度方法,能够返回Goldstein平稳点。我们设计了一种单遍(ϵ, δ)差分隐私算法,其样本复杂度显著低于现有算法,并进一步提出了多遍多项式时间算法,以进一步降低样本复杂度。

改进的样本复杂度用于私有非光滑非凸优化

Apple Machine Learning Research
Apple Machine Learning Research · 2025-05-01T00:00:00Z
如何验证任何(合理的)分布特性:分布的计算上可靠的论证系统

随着统计分析在科学和社会中的重要性日益增加,确保结果的准确性变得尤为关键。本文探讨了一种交互协议,使概率验证者能够在不复制分析的情况下验证未知分布是否接近特定特性。该协议在多项式时间内有效,且在样本复杂度和计算资源方面优于传统的复制分析方法。

如何验证任何(合理的)分布特性:分布的计算上可靠的论证系统

Apple Machine Learning Research
Apple Machine Learning Research · 2025-04-24T00:00:00Z

本研究分析了对比学习在对抗噪声下的理论限制,揭示了样本复杂度的上下界。通过PAC学习和VC维度分析,提出了基于l2距离函数的数据相关样本复杂度界限,具有重要的理论和实践意义。

Contrastive Learning under Adversarial Noise

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-25T00:00:00Z

本研究解决了多类列表分类中的带约束反馈问题,提出了一种高概率返回$ ext{ε}$-最优假设的算法,并改进了样本复杂度界限,表明在$s=O(1)$的情况下,带约束反馈几乎没有额外成本。

Constrained Problems in Multi-Class List Classification

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-13T00:00:00Z

本研究解决了KL正则化上下文强盗的样本复杂度问题,提出的算法实现了$ ilde{O}( rac{1}{ ext{ε}})$的样本复杂度,展示了算法的近似最优性,并扩展到上下文对抗强盗问题。

Near-optimal Sample Complexity of Offline KL-Regularized Contextual Bandits under Single-Policy Concentration

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-09T00:00:00Z

本研究首次从$( ext{ε}, ext{δ})$-PAC视角解决在线多奖励多策略折扣设置中的政策评估问题,采用改进的MR-NaS探索方案,实现了样本复杂度的联合最小化,实验结果验证了其有效性。

Adaptive Exploration for Multi-Reward Multi-Policy Evaluation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-04T00:00:00Z

本文提出了一种新颖的度量方法——最大子群差异(MSD),有效解决了经典度量方法在偏见评估中的高样本复杂度问题。MSD以线性样本复杂度评估特征子群的偏差,并提供实用算法和修复路径,实证结果表明其优于其他方法。

Detecting Bias through Maximum Subgroup Difference

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-04T00:00:00Z
指纹编码与几何相遇:私密查询发布和自适应数据分析的改进下界

指纹编码是证明差分隐私下界的重要工具,适用于低准确度问题。本文提出了一种通用框架,证明了特定查询集下的下界,并展示了准确算法与差分隐私算法所需的样本复杂度,改进了已有结果。

指纹编码与几何相遇:私密查询发布和自适应数据分析的改进下界

Apple Machine Learning Research
Apple Machine Learning Research · 2025-01-10T00:00:00Z

本研究提出了一种具有多重外推动量的随机一阶方法(SFOM),用于高度平滑的无约束随机优化问题。该方法通过多次外推和动量步骤加速优化,实验和理论分析表明其样本复杂度优于现有最佳结果,具有实际应用潜力。

Stochastic First-Order Method with Multiple Momentum for Highly Smooth Unconstrained Optimization

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-19T00:00:00Z

本研究提出了一种新颖的强化学习算法——软分析策略优化(SAPO),旨在解决软体物体仿真中的数据质量和样本复杂度问题,并开发了并行平台Rewarped,以提升强化学习在刚体和可变形体任务中的应用效果。

在可微多物理仿真中稳定强化学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-16T00:00:00Z

本研究探讨了学习矢量值线性预测器,重点分析了具有凸和Lipschitz损失函数的情况。我们详细描述了样本复杂度,并展示了随机凸优化与矢量值线性预测之间的关系,具有重要的理论和实践意义。

Complexity of Vector-valued Prediction: From Linear Models to Stochastic Convex Optimization

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-05T00:00:00Z
变换不变学习及其在OOD泛化中的理论保证

本文研究了在分布变化下的统计学习,重点分析训练和测试分布通过变换映射的关系。我们建立了学习规则和算法简化,提供了学习保证,并讨论了样本复杂度的上界,强调了学习规则的博弈论视角。

变换不变学习及其在OOD泛化中的理论保证

Apple Machine Learning Research
Apple Machine Learning Research · 2024-11-20T00:00:00Z

该研究提出了一种新的下界,以优化差分隐私算法在高维数据库中的样本复杂度,并引入了$f$-差分隐私的概念,改进了隐私保护方法。通过理论和实验,展示了新方法在数据分析和机器学习中的优势,强调了差分隐私的重新定义和应用的重要性。

差分隐私的拉普拉斯变换解释

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-14T00:00:00Z

研究表明,简单架构通过定位和语义机制学习解决方案,并在样本复杂度增加时展现机制转变,证明点乘注意层在数据充足时的优势。

因果注意力掩蔽中的聚类

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-07T00:00:00Z

本研究提出了一种新的样本复杂度,显著降低了在近似差分隐私下学习高斯混合模型的样本需求,尤其在高维情况下。

高效样本私人学习高斯混合模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-04T00:00:00Z

本文探讨无监督学习中的关键变动因素,挑战传统假设。研究发现,无监督模型的解开性难以识别,评估指标存在差异,增加解开性并不一定降低样本复杂度。未来研究应关注诱导偏见和监督作用。

解开解缠表示:通过扩散模型改善潜在单元

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-31T00:00:00Z

本文探讨了高斯稀疏估计在Huber污染模型中的应用,提出了一种高效的鲁棒估计器,确保较小的误差并达到最优性能。在均值估计、主成分分析和线性回归的情况下,算法在污染率为ε>0时,样本复杂度为(k^2/ε^2)·polylog(d/ε),L2误差为O(ε),优于以往算法。

具有非同质设计的稳健稀疏回归

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-31T00:00:00Z

本文探讨了多类分类中的适用性障碍,并提出通过简单适当学习者的聚合来解决这一问题。研究表明,该方法在有限图维度类别中显著降低了样本复杂度,优于经验风险最小化(ERM),并揭示单个ERM学习者的样本需求高于理论下界。

理解多类分类中适当学习者的聚合

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-30T00:00:00Z

本研究提出了一种新算法“物流跟踪与停止”(Log-TS),有效解决了广义线性模型老虎机中的纯探索问题,并能接近样本复杂度下界,展示了其潜在影响。

近似最优的物流老虎机纯探索

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-28T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码