小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

地理空间优化在城市建设中至关重要,传统方法存在局限。梁浩健博士在学术年会上介绍了基于分层深度强化学习的城市应急消防设施配置优化研究,提出了动态覆盖注意力模型和自适应交互注意力模型,提升了布局效率和风险评估精度。未来将结合地理信息系统与深度学习,探索更复杂的优化问题。

深度强化学习赋能城市消防优化,中科院团队提出DRL新方法破解设施配置难题

HyperAI超神经
HyperAI超神经 · 2025-06-03T05:07:34Z

本研究提出了一种双层代理系统(TTA),旨在提升《街头霸王 II》游戏的玩家体验。实验结果显示,该系统在多样性和技能水平方面显著改善了玩家的乐趣,反馈证实了其有效性。

A Dual-Layer DRL and LLM-Based Fighting Game Agent System to Enhance Player Enjoyment

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-10T00:00:00Z

深度强化学习(DRL)在AI中快速发展,应用于自动驾驶、游戏和金融等领域。它结合深度学习和强化学习,通过试错法优化决策。学习DRL需掌握AI和机器学习基础,并使用工具如TensorFlow、PyTorch和OpenAI Gym。DRL在Web5中也有潜力,值得探索。

如何入门深度强化学习 (DRL)

DEV Community
DEV Community · 2024-10-06T19:38:19Z

本研究解决了形态变换四旋翼飞行控制设计的复杂性问题,因其难以建立准确的数学模型。论文提出了一种新的凸组合深度强化学习(cc-DRL)算法,结合了无模型控制和凸组合技术,能够有效优化四旋翼的飞行控制。仿真结果表明,该算法在提升飞行性能方面具有显著潜力。

cc-DRL:一种用于形态变换四旋翼的凸组合深度强化学习飞行控制设计

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-23T00:00:00Z
Entropy | PBQ 增强的 QUIC:具有深度强化学习拥塞控制机制的 QUIC

该团队提出了一种高效的拥塞控制机制PBQ-Enhanced QUIC,结合了PPO和BBR算法,实验结果显示其在吞吐量和RTT方面优于现有的QUIC版本。该机制利用DRL的环境感知和决策优势,提高拥塞控制算法的效率。

Entropy | PBQ 增强的 QUIC:具有深度强化学习拥塞控制机制的 QUIC

实时互动网
实时互动网 · 2024-08-22T03:28:18Z

该研究使用深度强化学习对美式期权进行对冲,并研究了超参数对对冲表现的影响。研究发现每周重新训练的DRL代理性能更好,且在交易成本为1%和3%时,DRL代理优于Black-Scholes Delta方法。

EX-DRL:利用极端分布强化学习对抗重大损失

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-22T00:00:00Z

DreamSmooth是一种奖励平滑方法,通过学习预测时间上平滑的奖励来提高基于模型的强化学习的性能。实证结果表明,DreamSmooth在长时间范围的稀疏奖励任务上表现出最先进的性能,并在常见的基准测试中也表现良好。

突破障碍:平滑 DRL 代理程序中的增强效用和鲁棒性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-26T00:00:00Z

该研究提出了一种基于深度强化学习的集中式动态调度器,用于解决工业物联网用户设备根据服务质量和随机流量的问题。调度器通过简化方案实现快速收敛和更好的学习策略,有效保证用户期望意图,并具有比传统调度方案和竞争方案更好的性能。

面向意图感知的基于 DRL 的 5G-NR 上行动态调度器

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-27T00:00:00Z

本文介绍了一种使用深度强化学习的先进技术,用于监测有交通的桥梁的结构健康。该技术利用边缘检测技术对裂缝进行检测和定位,并评估了边缘检测和卷积神经网络在损伤检测方面的优劣。实验结果表明该方法有效。

SHM-Traffic: 基于 DRL 和迁移学习的无人机控制,用于道路上的桥梁结构健康监测

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-22T00:00:00Z

研究人员成功将现代AI模型与几何形式系统整合,建立了一个完整且兼容的平面几何形式系统。他们提出了几何形式化理论(GFT),构建了包含88个几何谓词和196个定理的形式系统,并开发了形式几何问题解决器(FGPS)。实验证明GFT的正确性和实用性。

FGeo-DRL:通过深度增强学习进行几何问题的演绎推理

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-14T00:00:00Z

本文提出了一种基于反射模式调制的RIS增强的多输入单输出系统,通过优化问题和交替优化技术提出了一种高质量的子优化解决方案。研究表明该方案在可达速率性能方面优于传统的无信息传输的RIS协助系统。

一种基于 DRL 的用于 RIS 辅助多接收机通信的反射增强方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-11T00:00:00Z

本文介绍了使用回归模型学习QoS和资源分配关系的方法,利用强化学习代理进行动态缩放截片资源以维持所需的QoS水平和提高资源效率。该方法具有鲁棒性和在不同流量模式下推广的性质。结果表明,该方法能够在未见的流量上保持QoS降级在10%以下,同时最小化资源分配,并展示了对不同网络条件和不准确流量预测的鲁棒性。

预测对 O-RAN 切片中 DRL 技术收敛的影响是如何的?

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-01T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码