小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
入职Meta的吴翼,清华叉院官网已撤其教职信息

吴翼已正式加盟Meta MSL,成为AI领域的热门人物。他在多智能体系统和深度强化学习方面有显著贡献,发表论文40余篇。加入Meta后,他将参与超级智能系统的研究。

入职Meta的吴翼,清华叉院官网已撤其教职信息

量子位
量子位 · 2026-04-13T09:09:18Z
人工智能系统学习保持仓库机器人交通顺畅

麻省理工学院与Symbotic的研究人员开发了一种新方法,利用深度强化学习协调仓库机器人,避免拥堵并提升效率。该系统实时调整优先级,实现25%的吞吐量提升,适应不同环境,未来计划扩展至更大仓库。

人工智能系统学习保持仓库机器人交通顺畅

MIT News - Artificial intelligence
MIT News - Artificial intelligence · 2026-03-26T04:00:00Z
Hugging Face 的 5 门免费 AI 课程

Hugging Face 提供多种免费的社区课程,涵盖 AI 代理、大型语言模型、扩散模型和深度强化学习等主题,帮助学习者提升 AI 知识与技能。

Hugging Face 的 5 门免费 AI 课程

KDnuggets
KDnuggets · 2025-09-09T12:00:41Z
自然语言理解中的深度强化学习

自然语言理解(NLU)是人工智能的重要领域,旨在帮助机器理解人类语言。深度强化学习(DRL)通过试错和反馈不断改进模型,提升语言理解能力。DRL在对话系统、文本摘要和响应生成等方面展现出良好潜力,使NLU系统更具适应性和响应性。

自然语言理解中的深度强化学习

freeCodeCamp.org
freeCodeCamp.org · 2025-08-15T15:00:27Z

机器之心数据服务现已上线,提供高效稳定的数据获取服务,简化数据爬取流程。

图灵奖得主Sutton再突破:强化学习在控制问题上媲美深度强化学习?

机器之心
机器之心 · 2025-08-03T06:32:49Z

RL_Matrix是一个为.NET开发者设计的强化学习框架,基于TorchSharp,支持多种算法(如DQN、PPO),具备高性能和类型安全,适合游戏和工业应用,能有效减少实验迭代次数,提高开发效率。

C# 的深度强化学习框架RL_Matrix

dotNET跨平台
dotNET跨平台 · 2025-07-05T00:01:39Z

RL_Matrix 是一个为 .NET 开发者设计的强化学习框架,基于 TorchSharp,支持多种算法(如 DQN、PPO),具备高性能和类型安全,适合游戏开发和机器人控制,优化了开发效率和实时决策。

C# 的深度强化学习框架RL_Matrix - 张善友

张善友
张善友 · 2025-07-03T09:53:00Z

本文介绍了DeepMimic和MaskMimic的研究,利用深度强化学习和动作跟踪技术,构建能够模仿人类动作的虚拟角色。DeepMimic通过统一奖励机制简化技能训练,而MaskMimic提升了模型的泛化能力,支持多任务和动态用户指令的交互,推动虚拟角色在复杂场景中的应用。

从RoboMimic、DeepMimic到带物理约束的MaskMimic——人形全身运控的通用控制器:自此打通人类-动画-人形的训练路径

结构之法 算法之道
结构之法 算法之道 · 2025-06-30T15:40:55Z

地理空间优化在城市建设中至关重要,传统方法存在局限。梁浩健博士在学术年会上介绍了基于分层深度强化学习的城市应急消防设施配置优化研究,提出了动态覆盖注意力模型和自适应交互注意力模型,提升了布局效率和风险评估精度。未来将结合地理信息系统与深度学习,探索更复杂的优化问题。

深度强化学习赋能城市消防优化,中科院团队提出DRL新方法破解设施配置难题

HyperAI超神经
HyperAI超神经 · 2025-06-03T05:07:34Z

本研究解决了在动态环境和经济条件下优化注塑过程参数以平衡产品质量与盈利性的问题。提出了一种基于深度强化学习的实时过程优化框架,将产品质量和盈利性融入控制目标,并通过建立利润函数及替代模型,实现了高效的离线训练和快速推理。实验结果表明,该框架能够动态适应季节和运营变化,保持产品质量的同时最大化利润,显示了其在现代制造中智能决策的潜力。

基于深度强化学习的注塑过程参数优化以实现适应性和盈利性生产

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-16T00:00:00Z

本研究提出了一种基于深度强化学习的信号交叉口自动驾驶车辆纵向控制策略,旨在解决复杂决策问题。通过设计全面的奖励函数并结合不同的DRL算法,该策略在多种安全关键场景中提高了车辆的效率与安全性。

Deep Reinforcement Learning-Based Longitudinal Control Strategy for Automated Vehicles at Signalized Intersections

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-13T00:00:00Z

本文为深度强化学习(DRL)初学者提供实用入门,重点介绍Proximal Policy Optimization(PPO)算法,通过通用策略迭代框架整合多种算法,帮助读者快速掌握高级DRL技术。

A Practical Introduction to Deep Reinforcement Learning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-13T00:00:00Z

本研究探讨了时间序列、随机森林和深度强化学习在超市库存管理中的有效性,强调数据可视化和统计指标对降低库存成本和提升客户满意度的重要性。

基于数据的方法在库存优化中的研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-13T00:00:00Z

本研究提出了一种基于深度强化学习的在线学习框架,旨在解决6G网络中自适应波束切换的高频率、移动性和阻塞问题。该方法在信噪比、吞吐量和准确性方面显著优于传统方法。

基于在线学习的6G网络自适应波束切换:提高效率与韧性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-12T00:00:00Z

本研究解决了智能交通场景中车辆具身智能网络(VEANs)中智能体迁移存在的计算延迟和资源限制问题。提出了一种Tiny Multi-Agent Bidirectional LSTM Proximal Policy...

基于双向长短期记忆网络的多智能体深度强化学习及计算感知剪枝用于车辆具身智能网络中的智能体双胞胎迁移

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-09T00:00:00Z

本研究提出了一种新颖的状态建模框架,旨在解决多智能体深度强化学习中的合作学习挑战。该框架通过推断非可观察状态的信念表征,优化智能体的探索和合作策略。实验结果表明,MARL SMPE算法在复杂合作任务中表现优于现有算法。

Enhancing Cooperative Multi-Agent Reinforcement Learning with State Modelling and Adversarial Exploration

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-08T00:00:00Z
新工具评估强化学习的进展

城市驾驶常面临频繁停车和起步,导致高污染。麻省理工学院的研究者开发了“IntersectionZoo”基准系统,以解决多因素优化问题,评估生态驾驶对减排的影响,促进深度强化学习算法的进步。

新工具评估强化学习的进展

MIT News - Artificial intelligence
MIT News - Artificial intelligence · 2025-05-05T20:00:00Z

本文研究了深度Q网络在连续时间框架下的逼近特性,发现其能够以任意精度逼近最优Q函数,为深度强化学习与随机控制的结合提供了新见解。

深度Q网络的通用逼近定理

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-04T00:00:00Z

本研究提出了一种深度强化学习框架,优化空气净化亭在德里的放置,以改善空气质量指数(AQI)。该方法利用近端策略优化算法识别关键位置,实现空气质量改善与设施覆盖率的最佳平衡,推动智能城市建设。

Deep Reinforcement Learning for Urban Air Quality Management: Multi-Objective Optimization of Pollution Mitigation Booth Placement in Metropolitan Environments

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-01T00:00:00Z

本研究探讨了利用深度强化学习优化混合现实中的3D用户界面布局的方法。研究表明,强化学习能够根据用户姿势和环境动态调整内容布局,从而提升用户体验和满意度。

Adaptive 3D User Interface Layout in Mixed Reality Based on Deep Reinforcement Learning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-30T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码