小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
强化学习在电网分解中的突破提升效率

这篇文章介绍了一种名为“状态和动作分解”的方法,用于提高强化学习代理在电网控制任务中的性能。通过将复杂的电网状态和动作空间分解为更易管理的因素,强化学习代理可以更高效地学习和做出更有效的决策,以维持电网的稳定性和效率。实验结果表明,这种分解方法相比传统的强化学习方法具有明显的优势。这一概念为将先进的人工智能应用于关键基础设施如电网的进一步发展提供了有希望的框架。

强化学习在电网分解中的突破提升效率

DEV Community
DEV Community · 2024-09-12T08:30:41Z

我们使用强化学习代理在模拟中训练大量离线学习数据,以实现真实世界机器人任务。我们评估了开源离线强化学习算法,并提供了可重现的实验设置。

改进带有不准确模拟器的离线强化学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-07T00:00:00Z

本研究报告探讨了停车场景中强化学习代理的多模态分布程度和机器人车辆在复杂交通环境中的导航与协作。通过分析队列长度、流量和编队大小分布,研究了影响队列长度的因素。该报告为混合交通的交通管理和协调提供了宝贵的见解。

基于强化学习的基于排队的环形交叉口节能驾驶

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-01T00:00:00Z

我们使用强化学习代理在模拟中训练的两个任务的离线学习数据,提出了一个基准,以实现真实世界机器人任务。我们评估了开源离线强化学习算法,并提供了可重现的实验设置。

AD4RL:用基于价值的数据集进行离线强化学习的自动驾驶基准

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-03T00:00:00Z

本研究提出了一个用于分析强化学习代理性能的框架,通过结合两个算法并提出一种新算法,比较了它们的收敛速度。实验结果显示,新算法的收敛速度显著快于以往方法。

逐渐演变环境中的行为强化学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-15T00:00:00Z

该研究使用认知模型作为人类模拟器,与人工智能交互并收集反馈,提高训练效率。实践中,该方法在道德决策制定方面取得了成功,对人工智能的发展具有重要贡献。其中,强化学习代理与认知模型交互学习公平性,并能理性调整行为。

走向信任的机器:AI 代理在信任博弈中学会信任

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-12-20T00:00:00Z

本文介绍了使用回归模型学习QoS和资源分配关系的方法,利用强化学习代理进行动态缩放截片资源以维持所需的QoS水平和提高资源效率。该方法具有鲁棒性和在不同流量模式下推广的性质。结果表明,该方法能够在未见的流量上保持QoS降级在10%以下,同时最小化资源分配,并展示了对不同网络条件和不准确流量预测的鲁棒性。

预测对 O-RAN 切片中 DRL 技术收敛的影响是如何的?

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-01T00:00:00Z

从先前记录的数据中学习策略是实现真实世界机器人任务的有前景方向。提出了一个基准,包括:使用强化学习代理在模拟中训练的两个任务的大量离线学习数据的收集,以及在真实世界机器人系统和模拟中执行学习策略的选项。评估了开源离线强化学习算法,并提供了可重现的实验设置。

2022 年真实机器人挑战赛:在真实环境中从离线数据中学习熟练操纵

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-08-15T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码