小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究提出了OSUniverse基准,旨在评估AI代理在复杂多模态桌面任务中的导航能力。通过逐步增加任务复杂性,确保代理的表现不超过现有最先进水平,为GUI导航AI的进展提供可靠依据。

OSUniverse:多模态GUI导航AI代理基准

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-06T00:00:00Z

本研究提出了一种新方法,通过图形表示与多维缩放技术,解决自动驾驶中的泛化能力不足问题。该方法通过嵌入图节点简化学习过程,实现降维,提高车辆在复杂环境中的导航能力。

使用多维缩放学习道路网络的等距嵌入

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-24T00:00:00Z

本研究提出了适应性视觉语言导航(AdaVLN),旨在提升机器人在动态环境中的导航能力。通过引入AdaVLN模拟器和AdaR2R数据集,评估了该方法在实际环境中缩小模拟与现实之间差距的潜力。

AdaVLN: Visual Language Navigation for Human Movement in Dynamic Environments

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-27T00:00:00Z

本研究提出了一种新颖的计算模型,通过动态扩展认知地图,增强自主体在复杂环境中的导航能力。该模型借鉴动物导航策略,能够快速学习环境结构,并在没有先验知识的情况下进行有效导航。

Learning Dynamic Cognitive Maps for Autonomous Navigation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-13T00:00:00Z

本文介绍了一种新型光谱学习算法,旨在解决SLAM(同时定位与制图)中的距离数据处理问题。该算法在统计一致性、计算要求低和跟踪表现方面表现优异。同时,研究提出了结合LiDAR和视觉的几何特征融合框架,提升了移动机器人在复杂环境中的导航能力。此外,多个新数据集和方法的引入显著提高了SLAM算法的性能和准确性。

RaNDT SLAM:基于强度增强法线分布变换的雷达SLAM

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-21T00:00:00Z

本文介绍了一种基于深度神经网络的算法,能够将点云、自然语言和操作轨迹数据嵌入共享空间,从而提升机器人操作的精度和推理效率。研究开发了多种模型,使机器人能够根据自然语言指令和图像进行物体识别和操作,成功率达到80%。通过结合视觉-语言模型和大型语言模型,增强了机器人在复杂环境中的导航和任务执行能力。

DM2RM:基于开放词汇指令的双模式多模态排名用于目标物体和容器

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-15T00:00:00Z

本文综述了视觉-语言导航(VLN)的研究进展,分析了任务、评价指标和方法,强调了当前的局限性和未来机遇。研究探讨了如何通过自然语言进行有效导航,并提出了新的框架和方法,以提高导航能力和可解释性,特别是在不同环境中的应用。

视觉与语言导航的现状和未来:基于基础模型时代的调查

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-09T00:00:00Z

本文介绍了一种基于卷积神经网络的创新方法,用于提高道路交通的安全性和导航能力。该方法实现了接近96%的准确率,并强调了高级定位技术对交通标志识别技术的持续发展和对道路安全和自动驾驶的未来的关键性影响。

基于卷积神经网络的 GTRSB 交通标志检测和分类优化

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-13T00:00:00Z

当前的视觉说明模型假设图像是完整呈现场景的完美捕捉,但在真实世界中,图像可能没有提供良好的视角,限制了对细粒度场景的理解。为了克服这一限制,提出了一项名为“实体说明”的新任务,将视觉说明模型与导航能力相结合,主动探索场景并减少视觉模糊。构建了一个包含10K个混乱物体的3D场景和每个场景三个注释段落的ET-Cap数据集,用于支持该任务。提出了一个级联实体说明模型(CaBOT),由导航器和说明器组成,用于处理这个任务。广泛的实验证明该模型优于其他基线模型。数据集、代码和模型可在链接中获得。

在 3D 环境中探索与描述:基于身体感知的视觉字幕生成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-08-21T00:00:00Z
飞鸟从窗前掠过,我看到了另一种人生

鸟类具有复杂的认知能力和导航能力,通过观察多种线索来辨识方向并绘制地图。它们还展示了创造力、社会性学习和工具使用的能力。鸟类的繁殖行为、羽毛的演化和颜色的作用也被提及。适应力是生物存活的关键,不同特质都有利有弊。

飞鸟从窗前掠过,我看到了另一种人生

子虚栈
子虚栈 · 2023-05-31T13:44:14Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码