小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
私有KL分布估计的实例最优性

本文研究了在给定独立同分布样本的情况下,如何估计未知离散分布,重点在于最小化真实分布与算法估计之间的KL散度。我们提出了实例最优的算法,能够在有无差分隐私约束的情况下实现最优性能,并利用Good-Turing估计器的变体建立上界。

私有KL分布估计的实例最优性

Apple Machine Learning Research
Apple Machine Learning Research · 2025-09-22T00:00:00Z

清华大学段然团队突破Dijkstra算法速度限制,提出新算法解决“排序障碍”,实现更快的最短路径计算,标志着算法研究的重要里程碑。

本科必学Dijkstra算法被超越!清华段然团队打破图灵奖得主证明的普遍最优性

量子位
量子位 · 2025-08-09T07:04:41Z

本研究提出了一种引导策略优化(GPO)框架,旨在解决部分可观察环境中强化学习的不确定性问题。该方法通过引导者与学习者的共同训练,理论上达到了与直接强化学习相当的最优性,并在多项任务中显著优于现有方法。

Guided Policy Optimization under Partial Observability

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-21T00:00:00Z

本研究针对进化算法中普遍认为的停滞问题进行了深入探讨,指出停滞并不必然妨碍收敛,同时收敛也不一定表示最优。研究首次揭示,个体的停滞可以促进整个种群的收敛,且收敛不足以保障进化算法的有效性。这些发现对进化算法的理解与应用具有重要影响。

进化算法中的停滞:收敛不等于最优性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-02T00:00:00Z

本研究解决了推理时间计算对语言模型性能扩展的影响,特别是最佳之N采样可能导致的性能下降问题。通过引入新的算法“推理时间悲观主义”,该研究展示了如何在不确定性面前通过拒绝采样来减轻奖励劫持的影响,从而实现理想的性能扩展。实验结果表明,该算法在多种任务和模型中具有显著的优势。

最佳之N是它们中最好的选择吗?推理时间对齐中的覆盖、扩展和最优性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-27T00:00:00Z

本文解决了学习增强的一次性最大搜索中现有方法缺乏平滑性或未能实现最佳最坏情况保证的问题。提出的算法首次同时满足一致性和鲁棒性的最佳权衡,且利用获得的平滑性对包含随机性的学习增强环境中的一次性最大搜索进行了分析。该研究的主要发现为算法在不确定环境下的有效性提供了新的保证。

学习增强的一次性最大搜索中的帕累托最优性、平滑性和随机性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-08T00:00:00Z
重尾下的差分隐私随机凸优化:基于简单约简的近最优性

我们研究了重尾梯度下的差分隐私随机凸优化问题,提出了一种新的约简方法,首次在重尾环境中实现最优速率,满足(ε,δ)近似差分隐私。

重尾下的差分隐私随机凸优化:基于简单约简的近最优性

Apple Machine Learning Research
Apple Machine Learning Research · 2024-11-20T00:00:00Z

Dijkstra算法经过近70年的发展,已被证明具备普遍最优性,并能在最坏情况下实现最佳性能。多所顶尖高校的合作研究提升了该算法的效率,广泛应用于地图和网络路由等领域。

本科经典算法Dijkstra,被证明是普遍最优了:最坏情况性能也最优!

量子位
量子位 · 2024-10-27T04:54:19Z

对数据驱动的新闻供应商问题应用样本平均逼近(SAA)的后悔性能进行研究,通过分析 SAA 后悔的界限,证明了其性能受到 α 而不是 β 的长期影响,同时提出了新的梯度逼近技术和具有独立利益的难题实例。

闭合差距:基于样本均值近似的数据驱动新闻供应商问题的最优性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-06T00:00:00Z

该研究提出了有限时间全局收敛分析方法,针对无限时间平均奖励马尔可夫决策过程中的策略梯度方法。研究表明,策略梯度迭代以 O(log(T)) 的速率收敛到最优策略,并获得了 O(log(T)) 的后悔度保证。研究还重新审视和改进了折扣奖励马尔可夫决策过程的性能界限,并通过模拟评估了平均奖励策略梯度算法的性能。

通过多层级演员 - 评论家算法在平均奖励强化学习中实现全局最优性无需混合时间预言机

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-18T00:00:00Z

人流移动模拟是模拟人员移动的技术,可应用于游戏、城市规划、建筑设计和交通组织等领域。清华大学研究人员提出了一种新的条件去噪扩散模型,通过社会力引导的扩散过程来模拟人群行为。该模型集成了等变性的强归纳偏差,并开发了适用于扩散模型的长程训练算法。实验证明该模型相对于基线方法有显著性能提升。

仅需 5% 训练样本达到最优性能,清华大学研究团队发布条件去噪扩散模型 SPDiff,实现长程人流移动模拟

HyperAI超神经
HyperAI超神经 · 2024-03-12T04:19:43Z

本文研究了在对抗性和随机的 K 臂赌博机中,随机扰动策略(Follow-the-Perturbed-Leader)的最优性。我们建立了对于扰动实现 O (√KT) 遗憾的充分条件,并展示了随机扰动策略在具有特定尾部分布的情况下实现的最佳两者能力。

带有弗雷歇特 - 类型尾部分布的跟随扰动领导者:对抗性赌博机中的最优性和最佳选择之间的折衷

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-08T00:00:00Z

扩散概率模型(DPM)是一种有前途的生成模型技术,基于时间反转的马尔科夫扩散过程和得分匹配。为了解决得分匹配问题,提出了一种新的设计准则,即反向采样的压缩,构建了一类新型的压缩DPMs(CDPMs)。实验证实CDPMs在错误源方面具有鲁棒性。在CIFAR-10数据集上,压缩子变差保持(sub-VP)表现最好。

扩散概率模型的渐进均方误差最优性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-05T00:00:00Z

本研究探讨了多头softmax注意力模型在上下文学习多任务线性回归中的渐变流动动力学,并发现了有趣的“任务分配”现象。研究证明了梯度流在优化上的最佳性,为多头softmax注意力模型提供了第一个收敛结果。

多头 Softmax 注意力的上下文学习训练动态:出现、收敛和最优性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-29T00:00:00Z

本论文提出了一种验证自动驾驶系统安全特性的实用方法,通过建立代理模型描述交通场景下的行为,并评估多个模拟交通场景的安全特性。

通过形态测试评估自动驾驶的决策最优性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-28T00:00:00Z

存在一种函数或度量,可以最小化给定的凸泛函或风险,并满足一种由可靠的变换组指定的对称性质。通过利用 Stein 和 Le Cam 的旧思想以及出现在可靠的定理中的近似群平均,我们得出了结果。在凸分析中被称为 orbitopes 的一类凸集变得至关重要,并且我们在非参数设定中建立了这些 orbitopes 的属性。我们还展示了一个称为 cocycle 的简单装置,可用于将不同形式的对称性化简为一个问题。作为应用,我们在对称性约束下获得了关于不变核均值嵌入和 Monge-Kantorovich 定理的结果。我们还解释了与关于不变测试的 Hunt-Stein 定理的关联。

可接受的对称约束下的全局最优性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-12T00:00:00Z

研究了离散时间无限远平均回报的不安静赌博机问题,提出了一种新的策略类别,证明了在 N 臂问题中,如果单臂松弛问题是单连通和非周期的,我们的策略是渐近最优的,具有 O (1/√N) 的最优性差距。与目前大多数关注索引或优先级策略,依靠统一全球吸引子属性(UGAP)以保证收敛到最优解的已有工作,或者最近开发的基于模拟的策略不同,我们的方法不需要同步假设(SA)。

Unichain 和非周期性对于渐近最优性的平均奖励厌恶赌博机是充分条件

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-08T00:00:00Z

本篇论文研究了核分类器的统计性能,考虑了核回归理论的最新进展,在一些条件概率的基础上得出了核分类器分类超额风险的上界,并获得了对 Sobolev 空间的极小下界,表明所提出的分类器的最优性,同时将理论结果推广到超参数化神经网络分类器的泛化误差,并提出了一种估计插值平滑性的简单方法并应用于真实数据集。

Sobolev 空间中核分类器的最优性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-02T00:00:00Z

研究人员探讨了均值估计的问题,发现没有合理的估计器能够在渐近情况下超过次高斯的误差率。他们引入了一个新的定义框架来分析算法的最优性,称之为'邻域最优性'。文章提供了解决重尾均值估计问题的方法,并介绍了相关的研究成果。

均值估计的最优性:超越最糟情况、超越子高斯、超越 $1+α$ 矩

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-21T00:00:00Z

这篇文章将机器人行为问题转化为监督学习问题,并发现监督信号的质量依赖于逃避者行为的多样性与最优性的平衡以及完全可观测策略中的建模假设的强度。在野外实验中,使用带有RGB-D相机的四足机器人部署了这个策略,机器人在不确定时努力收集信息,预测意图,并提前预判以拦截。

基于视觉的追逐 - 逃避机器人策略学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-08-30T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码