小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

TrackVLA是一种集成目标识别与轨迹规划的视觉-语言-动作模型,旨在解决具身视觉跟踪任务。通过联合训练,该模型在动态环境中展现出优越的识别与规划能力,提升了智能体在复杂场景中的跟踪效果。

TrackVLA——开放世界下的四足具身视觉跟踪EVT(智能跟随):集目标识别与轨迹规划为一体的VLA,不怕高动态与遮挡

结构之法 算法之道
结构之法 算法之道 · 2025-08-05T10:58:25Z

本文介绍了一种音视频“位置时间标记”模型,结合多人视觉跟踪与多重语音源定位,解决了多人语音辨别问题。研究提出了新方法和数据集,显著提高了说话人分离的准确性和效率。

整合音频、视觉和语义信息以增强多模态说话者区分

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-22T00:00:00Z

该研究提出了一种新的框架,结合了视觉基础模型和离线强化学习,用于赋予具有体内视觉的智能体进行视觉跟踪任务。通过使用蒙版重定向机制和多级数据收集策略,进一步提高了跟踪结果的稳健性和泛化性。评估结果表明,该方法在样本效率、对干扰物的稳健性和对未见情况和目标的泛化能力方面优于现有方法,并证明了学习到的跟踪器在虚拟世界和真实场景中的可迁移性。

通过视觉基础模型和离线强化学习增强体感视觉跟踪

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-15T00:00:00Z

HPFormer是一种基于Transformer的新方法,利用其强大的表示学习能力来提高视觉跟踪性能。通过HHA模块实现特征提取和融合,通过TBM从高光谱输入中选择性地聚合空间细节和光谱特征来注入目标表示。实验证明,HPFormer在NIR和VIS跟踪数据集上具有最先进的性能,提供了改进鲁棒目标跟踪的新见解。

Hy-Tracker:一种提升高光谱视频物体跟踪效率和准确性的新框架

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-30T00:00:00Z

CiteTracker是一种通过连接图像和文本来增强视觉跟踪的方法。它包括文本生成模块和动态描述模块,能够将目标图像转换为包含类别和属性信息的描述性文本,并适应目标变化以获得更有效的目标表示。通过基于注意力的相关模块将目标描述和搜索图像关联起来,生成用于目标状态参考的相关特征。实验证明,该方法在五个不同数据集上具有较好的性能。

CiteTracker:用于视觉跟踪的图像和文本相关联

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-08-22T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码