小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究提出了一种“可信声誉游戏”模型,旨在解决去中心化区块链声誉系统的操控问题。该模型确保用户真实信念为最佳策略,并通过纳什均衡有效评估服务器的可信度,具有应用潜力。

Trustworthy Reputation Games and Their Applications in Reputation-Proof Blockchains

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-20T00:00:00Z

本研究提出了一种新的自动出价问题表述——纳什均衡约束出价(NCB),旨在最大化广告商的社会福利并满足$ ext{ε}$-纳什均衡约束。通过双层策略梯度框架,成功克服了NCB问题的复杂性,实验结果验证了其有效性。

Auto-Bidding with Nash Equilibrium Constraints and Bi-Level Reinforcement Learning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-13T00:00:00Z

本研究提出了一种基于合作自适应马尔可夫决策过程的方法,旨在解决机器人辅助康复中的人机界面设计问题。研究表明,在特定条件下,系统能够收敛至独特的纳什均衡,为自适应系统设计提供理论指导。

人机共同适应模型及其收敛分析

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-10T00:00:00Z

本文提出了一种将对齐问题建模为马尔可夫游戏的方法,解决了人类反馈下的强化学习在多轮对话中的应用限制。新方法Multi-step Preference Optimization (MPO)基于乐观在线梯度下降算法,理论分析表明其能有效收敛到近似纳什均衡,并在实验中验证了其有效性。

Multi-Step Alignment as Markov Games: An Optimistic Online Gradient Descent Method with Convergence Guarantees

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-18T00:00:00Z
探索人工智能与博弈论的交汇:策略天国中的完美结合

人工智能(AI)与博弈论结合,能够深入分析决策与策略。博弈论关注理性决策者的互动,核心概念包括纳什均衡和囚徒困境。AI通过博弈论优化多智能体系统、强化学习和资源分配,广泛应用于自动驾驶、电子商务和医疗等领域。然而,需关注公平性、透明度及潜在的伦理问题。

探索人工智能与博弈论的交汇:策略天国中的完美结合

DEV Community
DEV Community · 2025-02-09T09:32:25Z

本研究提出了一种改进的政策空间响应oracle(PSRO)方法,通过引入可扩展的经验博弈树和细化的纳什均衡,提升了策略探索的效率。实验结果表明,该方法在生成新策略和博弈收敛速度方面优于传统方法。

树利用的政策抽象与纳什精炼

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-05T00:00:00Z

本研究探讨了多智能体系统中的对称性及其在纳什均衡计算中的应用,指出识别对称性能够简化战略互动分析,并与布劳尔不动点问题的复杂性相当。

计算游戏对称性及其尊重的均衡

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-15T00:00:00Z

本文探讨了联邦学习中客户端如何基于理性自利选择训练努力,提出了潜在博弈框架,并建立了纳什均衡的存在性。研究表明,在特定奖励因子下,客户端的训练效果显著提升,为服务器选择最优奖励因素提供了新见解。

A Potential Game Perspective in Federated Learning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-18T00:00:00Z

本研究解决了微分博弈中的学习动态复杂性问题,提出了两种博弈分解方法,发现标量势博弈与潜在博弈的一致性,并通过梯度下降有效找到纳什均衡,为动态与战略的关系提供了新视角。

关于微分博弈的分解

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-06T00:00:00Z

本研究提出了一种新技术,解决有限正常形式博弈中的纳什均衡逼近问题。通过将问题重构为多元多项式系统,并采用随机迭代求解,实验结果表明该方法有效。

通过随机特征分解求解纳什均衡

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-04T00:00:00Z

本文介绍了一种新的战略分类问题,关注代理特征操控的外部性。通过Stackelberg博弈模型,证明在特定条件下,代理操控博弈的纯纳什均衡是唯一且易于计算的,并为学习者提供了PAC学习保证,支持构建更稳健的分类器。

具有外部性的战略分类

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-10T00:00:00Z

本研究提出了一种利用强化学习实现团队合作与跨团队竞争的方法,并证明了其能够达到纳什均衡。实验证实了该方法的优点。

MF-OML: 大规模群体博弈中的在线均场强化学习与职业测量

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-01T00:00:00Z

我们提出了一种深度强化学习算法,通过设计额外的内循环重放缓冲区,代理可以有效地学习如何从任何分布实现纳什均衡,从而在大规模多智能体系统中实现依赖于人口的纳什均衡。数值实验结果表明,我们的算法具有比现有技术的算法更好的收敛性质,特别是对于依赖于人口的策略的虚拟游戏的深度强化学习版本。

基于深度强化学习的面向人口的在线镜像下降法求解均场博弈

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-06T00:00:00Z

ABCs算法结合了BQL和CFR算法,实现了在单一智能体和多智能体领域的自适应分支。该算法通过测量环境奖励和转移动力学的稳定性,在马尔可夫决策过程中收敛到最佳策略。ABCs在两人零和游戏中保证收敛到纳什均衡,且在OpenSpiel游戏库和OpenAI Gym中表现出强大性能。

ABC 轻松统一玻尔兹曼 Q 学习与反事实遗憾最小化

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-19T00:00:00Z

该文提出了一种新的复杂度度量,用于多智能体强化学习在一般和马尔可夫博弈下的情况。通过算法框架,可以在低复杂度下保证在模型为基础和模型无关的MARL问题中学习纳什均衡、粗粒度相关均衡和相关均衡的样本效率性。算法结合了一个均衡求解器和一个单一目标优化次程序,更适合于实证实现。

高效的样本有效的多智能体强化学习:优化视角

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-10T00:00:00Z

本文通过分析超过10,000条人类象棋比赛记录,研究了象棋游戏中的传递性与非传递性元素,并引入了JiangJun算法,该算法是蒙特卡洛树搜索和策略空间响应神谕的创新组合,旨在近似纳什均衡。经过微信小程序的评估,算法在与人类玩家的比赛中取得了99.41%的胜率,达到了大师级水平。量化指标和可视化结果证实了该算法在克服非传递性方面的有效性。

江郡:通过解决两人零和博弈中的不可传递性来掌握象棋

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-08-09T00:00:00Z
EC Final

给定一个长为n的字符串,求从每个位置开始的后缀,要求n≤2×10^5。使用lcp和纳什均衡做法。

EC Final

某岛
某岛 · 2023-05-27T23:18:17Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码