小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

最新一期的Google AI播客讨论了Genie 3,一个实时互动的世界模型。主持人Logan Kilpatrick与项目团队成员探讨了从被动视频生成到可玩模拟环境的演变过程。

在我们最新的播客中了解更多关于互动世界模型的信息。

The Keyword
The Keyword · 2026-01-29T15:00:00Z

该研究提出了一种新方法来应对电网中的多阶段级联故障。通过将故障视为强化学习任务,作者创建了新的模拟环境,并利用确定性策略梯度算法训练代理,以实现有效的故障缓解。该方法在IEEE 14条和118条总线系统上进行了验证。

Deep Reinforcement Learning for Mitigating Multi-Stage Cascading Failures in Power Grids

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-13T00:00:00Z

Jim Fan在Nvidia的演讲中提出了“物理图灵测试”,探讨了机器人在日常任务中的表现。他强调通过模拟环境训练机器人,以提升其能力,并展望未来更高效的物理API将推动机器人技术的发展。

物理图灵测试:Jim Fan谈Nvidia的具身人工智能发展路线图

Josherich的博客
Josherich的博客 · 2025-05-11T00:00:01Z
AI团队征服竞争:均场学习的规模化

该研究论文探讨了训练大型AI团队竞争的方法,采用均场理论分析多个代理的互动,专注于零和竞争场景,并引入新算法以训练大规模竞争行为,成功应用于模拟环境。

AI团队征服竞争:均场学习的规模化

DEV Community
DEV Community · 2025-05-05T23:49:02Z

本研究探讨自我博弈在模拟环境中提升自主驾驶能力。通过Gigaflow模拟器进行的1.6亿公里模拟驾驶中,该政策在三项自动驾驶基准测试中表现优异,超越真实场景中的最佳表现,展现出卓越的鲁棒性和自然性。

Self-Play Enhances Robust Autonomous Driving Capabilities

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-05T00:00:00Z

本研究探讨了视觉语言模型(VLMs)在空间任务中的应用,提出将VLM与模拟环境和机器人系统结合的方法。研究表明,VLM能够处理视觉和文本数据,生成操作决策,并在模拟任务中表现出与传统方法的竞争力,显示出实际应用的潜力。

Visual Language Models as Operator Agents in the Space Domain

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-14T00:00:00Z

本研究使用自然对抗场景生成解决方案和强化学习技术,构建了模拟环境以模拟自然交通互动场景,并生成现实且多样的大规模测试场景,为自动驾驶汽车的开发提供基石。

基于自然人类驾驶先验的对抗性安全关键场景生成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-06T00:00:00Z

Foosball是一个多功能平台,用于推动科学研究,特别是在机器人学习领域。研究人员展示了一个自动化的Foosball桌以及对应的模拟环境,通过例子任务展示了Foosball环境中的多样化挑战。他们认为Foosball是一个有潜力的学习环境,在人工智能和机器学习领域进行尖端研究,并可以扩展到工业机器人和自动化设置。他们的实验表明,逼真的模拟对于掌握复杂的机器人任务至关重要,但将这些成就转化到真实系统仍具有挑战性。因此,他们将自动化Foosball桌视为一个宝贵的工具,可以推动机器人和自动化研究的发展。

学习玩桌上足球:系统与基准

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-23T00:00:00Z

NaVid是一个基于视频的大型视觉语言模型,通过动态的视频流输入,实现了最先进水平的导航性能。它解决了里程计噪声和模拟环境到真实环境之间的缺陷,并有效地利用机器人的历史观察作为决策和指令遵循的时空背景。

NavGPT-2:发掘大型视觉语言模型的导航推理能力

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-17T00:00:00Z

AucArena是一个评估LLMs的新型模拟环境,通过简单的提示,LLMs展示了参与竞拍所需的技能。LLM代理模拟复杂社交动态的潜力在竞争环境中表现出来。模拟环境在测试和改进代理体系结构中起重要作用。

大型语言模型评估顺序决策能力的 UNO 竞技场

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-24T00:00:00Z

本文介绍了一种可持续的多智能体深度强化学习框架,能够将训练策略从模拟环境转移到真实环境中。通过实验,展示了该框架在交叉路口问题和对抗自主赛车问题上的实验结果,并讨论了加速多智能体强化学习训练的技术。最后,使用该框架展示了从模拟环境到真实环境中训练策略的过渡。

通过数字孪生实现增强式强化学习资源管理:机遇、应用和挑战

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-12T00:00:00Z

该研究使用Q-learning方法在机器人倒立摆平衡问题中进行了实验,并通过模拟环境中的学习阶段和真实系统数据的曲线拟合验证了该方法的可行性。研究强调了在模拟中准确表示物理世界的重要性,以提高强化学习算法在真实环境中的效果。

如何在 Q 学习中对连续状态 - 动作空间进行离散化:一种符号控制方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-03T00:00:00Z

TRANSIC提出了一种通过人机协作的数据驱动方法,成功实现了从模拟环境到真实世界的转换。该方法通过人类观察和干预机器人在真实世界中的执行来缩小模拟与现实之间的差距,成功实现了复杂操作任务的模拟到现实的转换。

通过在线纠正学习进行模拟到现实策略迁移

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-16T00:00:00Z

机器人学中的评估与模拟环境之间的控制和视觉差异是模拟评估的关键挑战。通过创建适用于真实机器人设置的SIMPLER模拟环境,研究者证明了在这些环境中的政策表现与真实世界中的表现之间的强相关性,并准确反映了真实世界的政策行为模式。该研究促进了通用操作策略和模拟评估框架的研究。

在仿真环境中评估实际机器人操纵策略

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-09T00:00:00Z

联邦学习是一种新的机器学习训练范式,通过在模拟环境中进行迭代实验快速生成想法。Pfl-research是一个快速、模块化和用户友好的Python框架,支持TensorFlow、PyTorch和非神经网络模型。它与最先进的隐私算法紧密集成,显示出比其他开源框架快7-72倍的速度,极大提高了联邦学习研究社区的生产力,使之前资源密集型的任务成为可能。

pfl-research:用于加速私有联邦学习研究的仿真框架

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-09T00:00:00Z

研究了无监督机器人操作中多模态变分自编码器的应用和模型不变训练方法,提高了模型性能并评估了个体任务的挑战。揭示了多模态变分自编码器在基于视觉和语言的无监督机器人运动轨迹学习中的优势和限制。

跨越语言、视觉和行动:多模态 VAEs 在机器人操作任务中的应用

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-02T00:00:00Z

NaVid是一个基于视频的大型视觉语言模型,通过动态的视频流输入,实现了最先进水平的导航性能。它解决了里程计噪声和模拟环境到真实环境之间的缺陷,并有效地利用机器人的历史观察作为决策和指令遵循的时空背景。

IVLMap: 消费级机器人导航的实例感知视觉语言定位

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-28T00:00:00Z

NaVid是一个基于视频的大型视觉语言模型,通过动态的视频流输入,实现了最先进水平的导航性能。它解决了里程计噪声和模拟环境到真实环境之间的缺陷,并有效地利用机器人的历史观察作为决策和指令遵循的时空背景。

自然 VLM:利用细粒度自然语言进行支配引导的视觉操作

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-13T00:00:00Z

研究介绍了AucArena模拟环境,用于评估大型语言模型在竞争环境中的表现。LLMs展示了参与竞拍所需的技能,但个体能力存在变异性。文章强调了LLM代理设计的进一步提高和模拟环境在测试和改进代理体系结构中的重要作用。

ALYMPICS:语言智能与博弈论相遇

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-06T00:00:00Z
机器人研究的要素

我们发布了八个模拟机器人环境和Hindsight Experience Replay的基线实现,以支持过去一年的研究。这些环境用于训练物理机器人模型,并发布了一系列研究请求。

机器人研究的要素

OpenAI
OpenAI · 2018-02-26T08:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码