小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究提出了一种多层融合与推理架构(MFRA),旨在解决视觉与语言导航中的复杂多模态交互问题。MFRA通过层次化机制显著提高了代理在导航场景中的决策准确性,优于现有方法。

Hierarchical Thinking and Dynamic Action: Hierarchical Multi-modal Fusion and Reasoning for Vision-and-Language Navigation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-23T00:00:00Z

本研究提出了一种新颖的水下图像增强算法UIE-SNN,基于脉冲神经网络,能耗降低85%,同时保持图像清晰度,为海洋自主视觉导航提供技术支持。

基于卷积脉冲神经网络的水下图像增强

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-26T00:00:00Z

本研究提出了一种新方法,通过指令中的隐含子目标的视觉表征,提升视觉与语言导航代理在未知环境中的导航性能,显著提高成功率和成功比例。

视觉想象是否能提升视觉与语言导航代理的性能?

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-20T00:00:00Z

本研究提出HA-VLN基准,旨在解决传统视觉与语言导航系统在动态多人体互动环境中的局限性。研究强调人类意识的整合,提出平衡离散与连续导航的标准化任务,并指出社会背景对提高导航成功率和减少碰撞的重要性。

HA-VLN: A Benchmark for Human-Aware Navigation in Discrete-Continuous Environments with Dynamic Multi-Human Interactions, Real-World Validation, and an Open Leaderboard

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-18T00:00:00Z

本研究提出了一种基于逆强化学习的无人机视觉导航框架,旨在克服现有学习方法的局限性。该框架能够在复杂环境中快速生成无碰撞航点,实现灵活飞行,且无需额外训练,适用于真实场景。

RAPID: A Robust and Agile Planner Using Inverse Reinforcement Learning for Vision-Based Drone Navigation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-04T00:00:00Z

本研究提出GSA-VLN任务,旨在提高视觉与语言导航的适应性。通过开发GSA-R2R数据集,增加环境和指令的多样性,并设计基于大语言模型的指令调整流程,以提升机器人在特定场景中的导航性能。

General Scene Adaptation for Vision-and-Language Navigation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-29T00:00:00Z
NASA认为已找出火星直升机坠毁的原因

NASA工程师揭示,2024年1月18日火星直升机Ingenuity坠毁原因是视觉导航系统无法识别光滑沙地,导致速度估计错误,最终发生硬着陆。坠毁时,旋翼因快速姿态变化超出设计极限而断裂。尽管失去通讯,Ingenuity仍能每周向探测车发送气象和航空电子数据。

NASA认为已找出火星直升机坠毁的原因

The Verge
The Verge · 2024-12-13T14:41:56Z

NASA复盘机智号火星直升机失事,因视觉导航系统无法准确判断陨石坑环境,导致硬着陆和旋翼断裂。机智号已完成任务,未来将改进探测器设计。

NASA复盘机智号火星直升机失事:无法正确判断陨石坑周围环境导致硬着陆和翻滚

蓝点网
蓝点网 · 2024-12-13T04:36:14Z

本研究提出全球一致性数据生成框架(WCGEN),旨在解决视觉与语言导航中的数据稀缺问题,提升代理在新环境中的泛化能力。实验结果表明,该方法在导航任务中取得了显著成果。

Global Consistency Data Generation for Vision-and-Language Navigation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-09T00:00:00Z
LeCun团队新作:在世界模型中导航

LeCun团队的导航世界模型NWM能够在已知和未知环境中生成视频,具备出色的导航能力。尽管在单图生成视频方面略逊于DeepMind的Genie-2,但在场景理解和路径规划上表现优异。NWM通过条件扩散Transformer实现高效导航,展现了先进的视觉导航性能。

LeCun团队新作:在世界模型中导航

机器之心
机器之心 · 2024-12-07T09:04:07Z

本文提出了一种声音-视觉导航的模拟到真实处理方法,包含声学场预测和路标导航。通过在SoundSpaces模拟器上验证设计并收集真实世界数据,测量模拟与现实的频谱差异,提出频率自适应策略以提升真实数据性能。最终,构建真实机器人平台,成功导航至声音对象,展示了智能代理从模拟到现实的潜力。

ANAVI:利用室内环境视觉实现音频噪声感知用于导航

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-24T00:00:00Z

介绍了一种新颖的自主、基于视觉的无人机竞速系统,成功应用于2019年AlphaPilot挑战赛。系统利用数据抽象、非线性滤波和最优时间轨迹规划,通过补偿状态估计中的漂移和构建全局地图来导航无人机。系统成功指导无人机穿越狭窄的比赛赛道,达到每秒8米的速度,并在2019年AlphaPilot挑战赛中排名第二。

自主赛车快速模块化智能驾驶软件

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-27T00:00:00Z

该文章介绍了一个地标感知的视觉导航(LAVN)数据集,用于人类中心探索策略和地图构建的监督学习。该数据集包括了人类点击配对、不同地标示例和广泛的场景。

CityNav: 具备地理信息的语言目标空中导航数据集

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-20T00:00:00Z

本文提出了一种基于视觉的室内微型飞行器导航解决方案,主要应用于自动化仓库。使用单个相机进行检测、定位和路径规划等任务。通过HSV颜色检测和霍夫线变换实现线检测。通过在Gazebo 11平台上进行测试,证明系统能够成功导航室内空间。该系统有潜力降低劳动成本并增强仓储操作的生产力。对自动化仓库中微型飞行器应用领域的发展具有重要意义。

智能仓库中的动态 AGV 任务分配

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-12-26T00:00:00Z

本文介绍了一种新的视觉导航方法,使用图神经网络和卷积/循环神经网络实现原始行为分解,并在Gibson模拟器中验证了其在已知和未知环境中导航的性能优于相关基准线。

利用拓扑地图进行多目标导航的深度强化学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-16T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码