小红花·文摘

强化学习在电网分解中的突破提升效率

DEV Community ·

本研究提出了一个用于分析强化学习代理性能的框架，通过结合两个算法并提出一种新算法，比较了它们的收敛速度。实验结果显示，新算法的收敛速度显著快于以往方法。

逐渐演变环境中的行为强化学习

BriefGPT - AI 论文速递 ·

该研究使用认知模型作为人类模拟器，与人工智能交互并收集反馈，提高训练效率。实践中，该方法在道德决策制定方面取得了成功，对人工智能的发展具有重要贡献。其中，强化学习代理与认知模型交互学习公平性，并能理性调整行为。

走向信任的机器：AI 代理在信任博弈中学会信任

BriefGPT - AI 论文速递 ·

本文介绍了使用回归模型学习QoS和资源分配关系的方法，利用强化学习代理进行动态缩放截片资源以维持所需的QoS水平和提高资源效率。该方法具有鲁棒性和在不同流量模式下推广的性质。结果表明，该方法能够在未见的流量上保持QoS降级在10％以下，同时最小化资源分配，并展示了对不同网络条件和不准确流量预测的鲁棒性。

预测对 O-RAN 切片中 DRL 技术收敛的影响是如何的？

BriefGPT - AI 论文速递 ·

从先前记录的数据中学习策略是实现真实世界机器人任务的有前景方向。提出了一个基准，包括：使用强化学习代理在模拟中训练的两个任务的大量离线学习数据的收集，以及在真实世界机器人系统和模拟中执行学习策略的选项。评估了开源离线强化学习算法，并提供了可重现的实验设置。

2022 年真实机器人挑战赛：在真实环境中从离线数据中学习熟练操纵

BriefGPT - AI 论文速递 ·