小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

该研究提出了一种新策略,针对在线社交网络中有限信任对影响力传播的影响。通过控制理论优化多代理目标选择,实验证明该方法在改善舆论和减少极化方面优于传统方法。

Optimizing Influence Propagation: Promotion Under Limited Trust

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-24T00:00:00Z
从扭秧歌到单脚跳,HugWBC让人形机器人运动天赋觉醒了

机器之心的AIxiv专栏促进了学术交流,报道了2000多篇文章。上海交通大学与上海AI Lab的研究团队开发了HugWBC控制器,使人形机器人掌握多种步态,实现精细运动控制。该研究结合控制理论与强化学习,提升了机器人的运动能力和鲁棒性。

从扭秧歌到单脚跳,HugWBC让人形机器人运动天赋觉醒了

机器之心
机器之心 · 2025-02-08T02:44:30Z

本研究解决了传统神经网络在模仿学习中缺乏输出错误补偿的问题。通过引入反馈机制和分层神经网络结构,提高了未训练字符的书写准确性,验证了神经网络与控制理论结合的潜力。

Output Correction Error Feedback Model in Imitation Learning Based on Bidirectional Control

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-19T00:00:00Z
TPAMI | 安全强化学习方法、理论与应用综述,慕工大、同济、伯克利等深度解析

本文综述了安全强化学习的现状和未来方向。安全强化学习在传统强化学习中加入安全约束,应用于自动驾驶和机器人等领域。研究方法分为基于模型和无模型,涉及策略优化和控制理论。理论分析关注算法安全性、样本复杂度和收敛性。基准测试环境如AI Safety Gridworlds和Safety Gym用于评估算法性能。未来挑战包括算法扩展性和实时性能。

TPAMI | 安全强化学习方法、理论与应用综述,慕工大、同济、伯克利等深度解析

机器之心
机器之心 · 2024-10-08T06:15:22Z

本文提出了多种基于机器学习和控制理论的方法,以提高电力系统的安全性和性能。研究内容包括基于屏障证明的Simplex算法、图神经网络在电网动态稳定性分析中的应用,以及无模型负荷频率控制方法,旨在应对可再生能源带来的挑战,优化电网管理,确保系统的稳定性和安全性。

带有可变惯性的电网频率控制的在线事件触发切换

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-27T00:00:00Z
如何构建火箭控制系统:结合Python的基础控制理论

本文介绍了使用控制理论和Python创建火箭控制系统的方法,包括选择控制策略、理解火箭特性和轨迹、设置初始参数、调整系统以及优化控制系统。文章还介绍了PID控制器的工作原理和稳定性分析方法,以及非线性控制系统的优化方法和实际应用。

如何构建火箭控制系统:结合Python的基础控制理论

freeCodeCamp.org
freeCodeCamp.org · 2024-08-06T14:26:44Z

本文介绍了使用控制理论的思想,引入了PID TD学习和PID Q-Learning算法来加速RL环境的收敛。同时,提出了一种适应PID增益的方法,并通过理论和实证分析证明了其有效性。

通缩的动态价值迭代

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-15T00:00:00Z

本研究提出了一种基于符合性预测和控制理论的算法,用于时间序列预测的不确定性量化问题。该算法能够模拟符合性得分,并适应系统误差。实验结果显示,在COVID-19死亡人数预测中,与官方方法相比,覆盖范围有所改善。同时,还对电力需求、市场回报和温度进行了实验预测。提供了可扩展的代码库。

单轨迹形式预测

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-03T00:00:00Z

本文综述了机器学习在实现安全决策方面的最新进展,重点介绍了控制理论和强化学习研究中使用的语言和框架。讨论了学习控制方法、强化学习方法和证明学习控制策略安全性的方法。强调了近距离与人类操作时的安全性重要性,以及未来机器人学习研究中需要解决的挑战和基于物理的基准测试。

降低支持强化学习策略的风险与扩散模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-13T00:00:00Z

本研究通过使用通用的原始对偶框架,将经典优化和控制理论与强化学习方法结合,旨在统一和整合现有技术,并为学习的策略施加附加约束。实验证明了该方法的有效性,并为系统设计者提供了多种策略约束的工具箱。

强化学习的双重视角对政策约束的施加

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-25T00:00:00Z

该文章综述了强化学习的优化和控制方法,重点关注连续控制应用。通过一个线性二次调节器(LQR)的案例研究,描述了学习理论和控制理论的融合可以提供非渐进特征,并表明这些特征趋向于匹配实验行为。同时,讨论了学习系统在不确定环境中的挑战以及强化学习和控制领域提供的工具如何应对这些挑战。

连续时间控制中积分增强学习的计算影响

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-27T00:00:00Z

本文提出了一种替代经验风险最小化的方法,通过处理输入扰动来实现可靠结果。利用控制理论的工具来开发和理解机器学习,将深度神经网络解释为控制系统离散化。文章提供了鲁棒训练的新解释,并在低维分类任务上进行了测试。

一个极小极大优化控制方法用于稳健神经 ODE

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-26T00:00:00Z

该文介绍了一种基于符合性预测和控制理论的算法,用于时间序列预测的不确定性量化问题。该算法能够在在线环境中前瞻性地模拟符合性得分,并能适应由季节性、趋势性和一般分布变化引起的系统误差。作者在美国州级 COVID-19 死亡人数提前四周预测的实验中,与官方 CDC 通讯中使用的集合预测方法相比,覆盖范围有所改善。作者还使用自回归、Theta、Prophet 和 Transformer 模型对电力需求、市场回报和温度进行了实验预测,并提供了一个可扩展的代码库。

分叉不确定性:利用序列模型进行可靠预测和模型预测控制的符合风险控制

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-16T00:00:00Z

该研究提出了一种基于符合性预测和控制理论的算法,用于时间序列预测的不确定性量化问题。该算法能够在在线环境中前瞻性地模拟符合性得分,并能适应由季节性、趋势性和一般分布变化引起的系统误差。实验结果表明,该算法在美国州级 COVID-19 死亡人数提前四周预测中的覆盖范围有所改善。同时,该研究还使用自回归、Theta、Prophet 和 Transformer 模型对电力需求、市场回报和温度进行了实验预测,并提供了一个可扩展的代码库。

一致决策理论:从不完美预测中获得安全的自主决策

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-09T00:00:00Z

该论文提出了一种基于控制理论的强化方法,使用反馈控制构建了神经网络架构,增强对抗攻击的防御能力。实验结果显示该方法比现有技术更有效。

利用反馈循环进行对抗训练

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-08-23T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码