小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
ViVa——基于视频生成模型的机器人RL价值估计:比原先基于VLM的价值函数,能更好的在动态交互环境中对当前进度和未来走势下所带来的回报做估计

本文探讨了觉-语言-动作(VLA)模型在机器人学习中的应用,提出了一种视频生成式价值模型(ViVa),通过预测未来状态来改进价值估计。ViVa结合预训练的视频生成模型、当前观测和本体感知,评估任务进展,提升机器人在复杂环境中的操作能力。研究表明,该方法在真实世界任务中表现优越,能够有效跟踪任务进度并处理新颖物体。

ViVa——基于视频生成模型的机器人RL价值估计:比原先基于VLM的价值函数,能更好的在动态交互环境中对当前进度和未来走势下所带来的回报做估计

结构之法 算法之道
结构之法 算法之道 · 2026-04-16T05:50:55Z
在线教程丨低门槛部署英伟达最新Physical AI模型,覆盖人形机器人/人体运动生成/扩散模型微调等

在GTC 2026上,NVIDIA推出了Physical AI概念,强调AI与现实世界的深度结合。发布了Isaac GR00T、Kimodo和SOMA-X等开源项目,旨在提升机器人在复杂环境中的执行能力,使其更自然、高效地完成任务。

在线教程丨低门槛部署英伟达最新Physical AI模型,覆盖人形机器人/人体运动生成/扩散模型微调等

HyperAI超神经
HyperAI超神经 · 2026-03-25T05:49:56Z
2026年2月19日

文章讨论了AI可能取代知识工作者的观点。作者指出,尽管AI能力显著提升,但与COVID-19的类比存在误导。AI的应用过程复杂且耗时,虽然在某些任务上表现出色,但在复杂环境中替代知识工作者仍面临挑战。整体上,文章提醒关注AI工具的学习,但对时间表应保持谨慎。

2026年2月19日

Haoxiang's Blog
Haoxiang's Blog · 2026-02-20T06:32:13Z
我们是否有错误的人工智能梦想?

在2025年NeurIPS大会上,Zeynep Tufekci指出,AI的智能与人类智能存在本质差异。尽管大型语言模型在某些任务上表现出色,但在适应复杂环境和解决新问题方面仍显不足。未来,软件开发环境将因大型语言模型的独特智能而改变,需重新设计流程以充分利用AI。

我们是否有错误的人工智能梦想?

The JetBrains Blog
The JetBrains Blog · 2026-02-12T11:33:40Z
Agent设计模式——第 21 章:探索和发现

本章探讨智能代理在复杂环境中主动探索新信息和未知因素的重要性。通过多代理框架,代理能够生成假设、设计实验并推动创新,从而提高科学研究的效率。

Agent设计模式——第 21 章:探索和发现

XINDOO的博客
XINDOO的博客 · 2025-10-04T16:00:09Z
评估专家通才

作者回顾了在软件行业的经历,强调了“专家通才”的重要性。这类人才具备广泛知识和深厚技能,能够迅速学习新领域并有效合作。他们的好奇心、客户导向和对基础知识的重视使其在复杂环境中表现出色。文章呼吁行业重视这一技能,改变狭隘的专业化趋势。

评估专家通才

Martin Fowler
Martin Fowler · 2025-06-24T13:45:00Z

HOMIE是一种人形外骨骼驾驶舱,结合全身控制与远程操作,通过强化学习提升机器人行走和操作能力。系统包括外骨骼手臂、运动感应手套和踏板,支持高效精准控制,扩展机器人的操作空间。实验表明,HOMIE在复杂环境中表现优异,能够自主执行多样化任务。

HOMIE——遥操类似ALOHA主从臂的外骨骼驾驶舱收集数据:通过上肢模仿学习和全身控制RL训练自主策略

结构之法 算法之道
结构之法 算法之道 · 2025-05-28T15:50:39Z

本研究提出了一种以认识性人工智能为核心的新方法,旨在增强AI在复杂环境中的鲁棒性,解决其在处理不确定性和超越训练数据方面的不足。

Position: Epistemic Artificial Intelligence is Crucial for Machine Learning Models to Understand When They are Ignorant

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-08T00:00:00Z

该研究系统总结了图形用户界面(GUI)代理的最新进展,特别关注基于强化学习的架构,以及多模态感知和自适应动作生成在复杂环境中的应用。

A Summary of GUI Agents Enhanced by Reinforcement Learning-Based Foundation Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-29T00:00:00Z

本研究提出了一种通用基础设施和工作流,旨在解决在非结构化户外环境中应用深度强化学习于四旋翼的问题。该平台实现了训练到现实部署的无缝转移,显著提升了四旋翼在复杂环境中的飞行性能和适应性,并通过实证验证了其效率和鲁棒性。

A General Infrastructure and Workflow for Quadrotor Deep Reinforcement Learning and Real-World Deployment

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-21T00:00:00Z

本研究分析了反事实推理在复杂环境中的局限性,特别是在高模型不确定性和混沌动态下的影响,强调谨慎使用反事实推理的重要性。

When Counterfactual Reasoning Fails: Chaos and the Complexity of the Real World

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-31T00:00:00Z

本研究提出了一种神经符号方法,旨在解决机器人在复杂环境中与人类互动时的不确定性问题,从而提升社交导航能力,具有重要的应用潜力。

Neuro-Symbolic World Model with Perspective Shift: A Framework for Socially Aware Robot Navigation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-26T00:00:00Z

本研究设计了一个强化学习环境,利用《龙与地下城》第五版战斗场景,通过与大型语言模型控制的对手互动,挑战小型强化学习智能体。研究结果表明,大型语言模型提升了AI在复杂环境中的表现,为后续研究和教育应用提供了重要见解。

基于大型语言模型控制的对手的强化学习环境在《龙与地下城》第五版战斗中的应用

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-19T00:00:00Z
上周人工智能动态 #303 - Gemini Robotics、Gemma 3、CSM-1B

谷歌DeepMind推出了两个新AI模型,Gemini Robotics和Gemini Robotics-ER,旨在提升机器人在现实任务中的能力。Gemini Robotics基于Gemini 2.0,增强了机器人的互动性和灵活性,能够理解和适应新情况。Gemini Robotics-ER则帮助机器人在复杂环境中执行任务,如打包午餐。此外,谷歌还推出了Gemma 3,支持多平台开发,优化文本和图像分析。

上周人工智能动态 #303 - Gemini Robotics、Gemma 3、CSM-1B

Last Week in AI
Last Week in AI · 2025-03-17T18:52:04Z

本研究提出了一种新的显著性不变性持续政策学习(SCPL)算法,旨在提升视觉强化学习中代理在未见场景中的泛化能力。通过引入价值一致性模块和动态模块,该算法在各种基准测试中显著提高了泛化性能,尤其在复杂环境中表现突出。

Salience-Invariant Consistent Policy Learning for Generalization in Visual Reinforcement Learning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-12T00:00:00Z

本研究提出了一种新方法,旨在提高在复杂环境中学习关系模型的样本效率和模型推广能力,解决了随机探索效率低的问题。

引导探索以高效学习关系模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-10T00:00:00Z

本研究提出了一种基于逆强化学习的无人机视觉导航框架,旨在克服现有学习方法的局限性。该框架能够在复杂环境中快速生成无碰撞航点,实现灵活飞行,且无需额外训练,适用于真实场景。

RAPID: A Robust and Agile Planner Using Inverse Reinforcement Learning for Vision-Based Drone Navigation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-04T00:00:00Z

本研究提出了一种离散层次规划(DHP)方法,有效解决了长时间视觉规划任务中的挑战,显著提升了复杂环境中的规划效率和成功率。

离散层次规划:用于层次强化学习代理的研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-04T00:00:00Z

该研究提出了一种新型频率驱动特征分解网络FD2-Net,旨在改善红外-可见物体检测。该方法有效捕捉互补信息,提升了模型在复杂环境下的检测性能,并在多个基准测试中超越了现有模型。

FD2-Net: A Frequency-Driven Feature Decomposition Network for Infrared-Visible Object Detection

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-12T00:00:00Z
NeurIPS 2024 | 哈工深提出新型智能体Optimus-1,横扫Minecraft长序列任务

哈尔滨工业大学研究团队提出了智能体框架Optimus-1,旨在提升Minecraft中智能体执行长序列任务的能力。该框架结合结构化知识与多模态经验,显著提高了任务成功率,展示了在复杂环境中的应用潜力。

NeurIPS 2024 | 哈工深提出新型智能体Optimus-1,横扫Minecraft长序列任务

机器之心
机器之心 · 2024-12-06T09:22:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码