小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究提出了一种新方法DetMCVI,旨在解决确定性部分可观测马尔可夫决策过程的规划问题。该方法在大型问题中表现优异,成功率高,并在移动机器人森林映射中得到了验证。

Offline Solver for Deterministic Partially Observable Markov Decision Processes Based on Finite State Controllers

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-01T00:00:00Z

本研究探讨了多目标马尔可夫决策过程中的期望收益向量实现问题,指出传统纯策略无法满足需求。提出通过混合有限纯策略来逼近任意期望收益向量,并在所有策略下期望收益有限的情况下实现。这一发现对随机策略设计具有重要影响。

Mixing Any Cocktail with Limited Ingredients: The Structure of Payoff Sets in Multi-Objective Markov Decision Processes and Its Impact on Randomized Strategies

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-25T00:00:00Z

本研究探讨了用户目标与隐性需求之间的差距,提出了一种在马尔可夫决策过程中识别瓶颈状态的查询策略,以推断潜在目标所需的最小查询数。实证评估表明,该方法在不同任务中有效推断未明确说明的目标。

Inferring Implicit Goals Across Different Task Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-29T00:00:00Z

本文介绍了NS-Gym,一个针对非平稳马尔可夫决策过程的仿真工具包,旨在应对传统决策模型在动态环境中的挑战。NS-Gym提供标准化接口和基准问题,帮助研究者评估算法的适应性与鲁棒性。

NS-Gym: An Open Source Simulation Environment and Benchmark for Non-Stationary Markov Decision Processes

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-16T00:00:00Z

本文提出了一种新颖的依赖感知任务调度策略,结合马尔可夫决策过程和基于扩散的强化学习算法,实时调度无人机辅助的自主车辆任务,有效缩短任务完成时间。

Dependency-Aware Task Scheduling for CAVs Based on Diffusion Reinforcement Learning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-27T00:00:00Z

研究了离散折扣马尔可夫决策过程中的熵正则化误差,证明其在逆正则强度下以指数级别减小,并提供了梯度流与最优策略的关系,显示整体误差随迭代次数的平方根呈指数衰减。

基于Csiszár类型Tsallis熵的神经网络优化线性化势函数设计

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-06T00:00:00Z

本研究提出了一种通用的策略梯度方法DRPMD,旨在解决强健马尔可夫决策过程中的模型不确定性问题,确保全局最优性,并在复杂场景中验证其强健性和全局收敛性。

强健马尔可夫决策过程的策略梯度

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-29T00:00:00Z

本研究解决了马尔可夫决策过程中的价值函数有限样本有效性问题,确保了强化学习的可靠性,提出了高维概率收敛保证及边界,建立了更快的收敛速率,并设计了在线计算的渐近协方差矩阵估计器。

具有线性函数逼近的时间差学习的统计推断

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-21T00:00:00Z

本研究探讨多智能体马尔可夫决策中解释反事实结果的挑战。通过新的因果解释公式,将代理行动对结果的反事实效应分解为各代理和状态变量的贡献,帮助理解多智能体互动的潜在影响。

Counterfactual Effect Decomposition in Multi-Agent Sequential Decision Making

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-16T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码