小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究基于视觉SLAM进行机器人路径规划的研究,主要工作包括构建基于ORB-SLAM3系统的密集点云地图、转换成适用于二维路径规划的格网地图、以及基于强化学习的路径规划算法研究。实验验证了设计的视觉SLAM系统的可行性和有效性,并对三种强化学习算法进行了比较验证,得到了最优算法。

基于强化学习的机器人路径规划研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-22T00:00:00Z

该研究提出了一种基于结构信息原则的决策框架,利用无监督划分方法生成状态和动作的抽象表示,提高了单一和多智能体强化学习算法的性能。

基于结构信息原则的有效强化学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-15T00:00:00Z

本研究介绍了“Box o Flows”系统,用于评估强化学习算法在动态实际环境中的应用,并演示了无模型强化学习算法合成复杂行为的能力。同时探讨了离线强化学习在数据高效假设测试中的作用,这些见解将支持开发可应用于复杂动态系统的系统化强化学习算法。

Beacon 轻量级深度强化学习流量控制基准库

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-27T00:00:00Z

本文介绍了一种基于偏好的强化学习算法RIME,通过使用人类偏好作为奖励信号,避免了对奖励设计的需求。该算法结合了基于样本选择的鉴别器和动态过滤去噪偏好,提高了当前最先进的PbRL方法的鲁棒性。实验证明了热启动对于有限反馈情况下的鲁棒性和反馈效率都至关重要。

RIME:基于噪声偏好的鲁棒化基于优先级的强化学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-27T00:00:00Z

本文研究了通过在计算机视觉系统中使用记忆来改进视频流中的物体检测的精度和减少计算时间的问题。通过交替使用传统的特征提取器和轻量级的提取器,展示了在存在时间记忆的情况下,进行准确检测所需的计算量很小。同时,展示了记忆可以应用于强化学习算法来学习自适应推断策略。该模型在 Imaget VID 2015 数据集上实现了最先进的性能,并在 Pixel 3 手机上以 70+ FPS 的速度运行。

从全局表示内存中读取相关特征进行视觉目标跟踪

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-22T00:00:00Z

该研究提出了一种利用强化学习算法改善分布式过滤电路(DFCs)设计的自动化方法。实验结果显示该方法在设计效率和质量上有明显改进,尤其在设计复杂或快速演化的DFCs时表现出卓越性能。该方法展现出更高的设计效率,突显了强化学习在电路设计自动化中的潜力。

分布式滤波电路的自动设计和优化采用强化学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-22T00:00:00Z

本文介绍了两种新的强化学习算法:期望延迟深度确定性策略梯度(ExpD3)和偏差利用 - 双延迟深度确定性策略梯度(BE-TD3)。这些算法在连续控制任务中表现出有效性,并超越了现有方法。

深度双 Q 学习在演员评论方法中的估计偏差利用

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-14T00:00:00Z

本文介绍了一种名为ECORD的新型强化学习算法,通过限制图神经网络的使用,提升了在最大割问题上的表现和可扩展性。ECORD在500个节点的图上优化效果比竞争者提升了最多73%,在具有多达10000个节点的图上也表现强有力。

利用强化学习进行 IR 感知的 ECO 时序优化

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-12T00:00:00Z

本文研究了基于进化博弈论思想的路径规划方法,解决了同质自主代理在未知随机环境中的问题。实验证明该方法在大空间中最小化路径长度方面胜过现有强化学习算法近30%,比深度强化学习方法快一个数量级,扩展性更好。同时证明了学到的政策在演化上是稳定的。

演化算法优化使用通用门的有限状态机的综合

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-02T00:00:00Z

本文介绍了使用最新的强化学习算法进行端到端驾驶研究的方法,通过使用前置摄像头的RGB图像,在真实赛车游戏中学习车辆控制,并在不同的道路结构、图形和物理特性下进行评估。结果表明该方法可以快速收敛和更稳健的驾驶,并在看不见的赛道上和法定车速下进行了广义化证明,同时显示出一定的领域适应能力。

自动驾驶中对模型误差鲁棒性的部分端到端强化学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-12-11T00:00:00Z

controlgym是一个包含36个工业控制设置和10个控制问题的库,集成在OpenAI Gym/Gymnasium框架中,可应用强化学习算法。该项目旨在为学习动态和控制社区提供服务,并探索强化学习算法在学习控制策略、控制器稳定性和鲁棒性问题上的应用,以及在高维度和潜在无穷维度系统上的可扩展性。

Controlgym:用于基准化强化学习算法的大规模安全关键控制环境

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-30T00:00:00Z

本文研究了在预算下动作建议的转移学习模型,发现变异系数 (CV) 对选择生成建议策略具有重要意义。提出了一种新的强化学习算法,能够学习何时提供建议,适应于学生和任务。认为在预算下学习建议是一个更通用的学习问题的例子。

深度强化学习中面向智能体无关行动指导的智能体感知训练

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-28T00:00:00Z

本文提出了一种强化学习算法来解决多智能体马尔可夫决策过程(MMDP),通过黑韦尔的可接近性定理,目标是将每个智能体的时间平均成本降低到预先指定的特定界限以下。该算法在Q-learning算法中结合了每个智能体成本的加权组合,并使用了多个时间尺度的算法。实证结果表明,在具有联合控制的每个阶段成本的更一般的MMDP设置中,该算法表现良好。

基于分布式 Q 学习的多智能体马尔可夫决策过程和满足性准则

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-21T00:00:00Z

本文研究了信息不对称对话中生成信息丰富问题的策略,并提出了一种基于启发式思考的提问策略。使用强化学习算法优化问题的信息丰富程度和特定性,结果显示此策略比其他模型更有效。

迈向实用性问题回答中的认知意识:基于母婴健康的案例研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-16T00:00:00Z

该研究使用“Sushi Go Party!”游戏建立了强化学习算法和学习记忆能力的基本标准,并量化了算法在不同纸牌组合上的普适性。同时,通过拟合决策规则对模型策略进行了解释和与人类选手的排名偏好进行了比较,发现了共同规则和新策略。

挑选和通过” 作为基于第一原理记忆、泛化性和可解释性评估的三重分类

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-31T00:00:00Z

该研究提出了一种基于谱的方法,用于高效恢复矩阵的奇异子空间并实现最小逐项误差。同时,设计了两种充分利用低秩结构的强化学习算法,包括低秩赌博机问题的最小遗憾算法和低秩马尔可夫决策过程中的无奖励 RL 的最佳策略识别算法,两种算法均具有最先进的性能保证。

低秩强化学习光谱逐项矩阵估计

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-10T00:00:00Z

该文介绍了一种针对多人普遍和马尔可夫博弈中追随者为短视情况的强化学习算法,通过最小二乘值迭代来求得 Stackelberg-Nash 均衡。该算法在大状态空间的函数逼近工具中简单应用,并在具有线性函数逼近的情况下分别在在线和离线设置下证明了亚线性遗憾和亚最优性,为解决追随者为短视的普遍和马尔可夫博弈的 SNE 建立了第一个可以被证明高效的强化学习算法。

斯塔克伯格批量策略学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-28T00:00:00Z

该文介绍了置信度条件价值函数的学习方法,能够在训练时学习不同的保守程度,并在评估时动态地选择其中一种。实验结果表明该方法在多个离散控制领域中的性能优于现有的保守离线强化学习算法。

离线多智能体强化学习的反事实保守 Q 学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-22T00:00:00Z

本文介绍了使用最新的强化学习算法进行端到端驾驶研究的方法,通过使用前置摄像头的RGB图像,采用异步演员-评论家(A3C)框架,在真实的赛车游戏中学习车辆控制,并在不同的道路结构、图形和物理特性下进行评估。结果显示该方法能够快速收敛和更稳健地驾驶,并在看不见的赛道上和法定车速下进行了广义化证明,同时展示了一定的领域适应能力。

基于激光雷达的端到端强化学习自主赛车

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-01T00:00:00Z

本文介绍了使用最新的强化学习算法进行端到端驾驶研究的方法,通过使用前置摄像头的RGB图像,在真实的赛车游戏中学习车辆控制,并在不同的道路结构、图形和物理特性下进行评估。结果表明该方法可以快速收敛和更稳健的驾驶,并在看不见的赛道上和法定车速下进行了广义化证明,同时显示出一定的领域适应能力。

朝向最优头对头自主赛车的课程加强学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-08-25T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码