小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究提出了一种语言引导的少样本3D重建方法,解决了传统6D物体姿态估计对大数据集和高计算成本的依赖。该方法通过处理少量图像和语言查询,实现了高质量的3D网格重建,显著提高了准确性和效率。

Multi-Modal 3D Mesh Reconstruction from Images and Text

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-10T00:00:00Z

本研究提出了一种名为语言引导视觉令牌修剪(LVPruning)的方法,旨在减少多模态大型语言模型的计算负担。该方法通过评估视觉令牌的重要性,能够将视觉令牌数量减少至多90%,仅导致约0.45%的性能损失,显示出良好的应用潜力。

LV Pruning: An Effective and Simple Language-Guided Vision Token Pruning Method for Multi-Modal Large Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-23T00:00:00Z

本文探讨了语言引导的视觉导航(VLN)任务,提出了多种新方法和模型以提升智能体在连续环境中的导航表现。研究表明,结合大语言模型(LLMs)和持续学习机制,智能体的成功率可达80%。引入导航思维链和双循环场景回放,增强了导航策略的多样性和可解释性。

Cog-GA:基于大型语言模型的生成代理,用于连续环境中的视觉语言导航

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-04T00:00:00Z

研究开发了一种名为语言引导的世界模型(LWMs),通过阅读语言描述来捕捉环境动态,提高了代理的通信效率。该模型使代理能够在执行前生成和讨论计划,增强了代理的可解释性和安全性,并提高了在真实环境中的性能。

迈向自主代理:语言模型中的自适应规划、推理与行动

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-12T00:00:00Z

DEF-oriCORN是一个面向语言引导的操控任务的框架,通过利用新颖的场景表示和状态估计算法,实现高效且稳健的操控规划。DEF-oriCORN在稀疏的RGB图像上表现出优越的估计和运动规划性能,并能够零样本推广到现实场景。

DEF-oriCORN:无演示的鲁棒性语言引导操控的高效三维场景理解

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-31T00:00:00Z

HazeCLIP是一种语言引导的适应框架,通过区域特定去雾技术和定制提示集,提高了预训练去雾网络在真实世界中的性能。实验证明HazeCLIP在真实世界图像去雾方面达到了最先进的性能。

HazeCLIP:面向文本指导的现实世界图像去雾

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-18T00:00:00Z

该研究开发了一个语言引导的导航任务,通过执行低级动作来遵循自然语言导航方向,消除了以前关于环境的假设。研究发现,在连续环境中的性能较低,表明以前的“导航-图形”设定中的性能可能被过高评价了。

基础视觉导航算法:间接顺序,偏向扩散和直接路径

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-18T00:00:00Z

LMDrive是一种语言引导的闭环自动驾驶框架,能处理多模态传感器数据和自然语言指令,实现与人类和导航软件的交互。作者发布了包含64K个指令跟踪数据片段的数据集和测试系统,以促进基于语言的闭环自动驾驶的研究。作者进行了广泛的闭环实验以证明LMDrive的有效性。

GenFollower:利用大型语言模型增强车辆跟随预测

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-08T00:00:00Z

本文介绍了PolarNet策略,使用3D点云进行语言引导的操纵任务。PolarNet通过点云输入、编码器和多模态变换器学习3D点云表示,并与语言指令集成以进行行动预测。在RLBench基准测试中,PolarNet在单任务和多任务学习中优于最先进的2D和3D方法,表现出高效和数据高效性。实际机器人上也取得了令人期待的结果。

点云模型提升机器学习机器人的视觉鲁棒性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-29T00:00:00Z

研究开发了语言引导的世界模型(LWMs),通过阅读语言描述捕捉环境动态,提高代理的通信效率。该模型使代理能够生成和讨论计划,增强可解释性和安全性,并在真实环境中性能提高三倍。

组合:基于组件的世界模型用于实体多主体协作

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-16T00:00:00Z

研究开发了语言引导的世界模型(LWMs),通过阅读语言描述捕捉环境动态,提高代理的通信效率。该模型使代理能够生成和讨论计划,增强可解释性和安全性,并提高在真实环境中的性能。

面向设备上的虚拟助手的世界英语语言模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-27T00:00:00Z

研究开发了一种名为语言引导的世界模型(LWMs),通过阅读语言描述来捕捉环境动态,提高了代理的通信效率。该模型使代理能够在执行前生成和讨论计划,增强了代理的可解释性和安全性,并使其在真实环境中的性能提高了三倍。

文本环境中的强化学习智能体的语言引导探索

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-05T00:00:00Z

研究开发了一种名为语言引导的世界模型(LWMs),通过阅读语言描述来捕捉环境动态,提高了代理的通信效率。该模型使代理能够在执行前生成和讨论计划,增强了代理的可解释性和安全性,并使其在真实环境中的性能提高了三倍。

语言化仿真引擎

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-26T00:00:00Z

研究人员提出了一种名为Instruct2Attack(I2A)的基于语言引导的语义攻击方法,利用潜态扩散模型生成对抗性潜态编码,生成更自然和多样的对抗性样本。通过GPT-4自动化攻击过程,生成多样的图像特定文本指令。研究表明,I2A能够成功破解深度神经网络,并具有强大的迁移能力。

Instruct2Attack: 语言引导的语义对抗攻击

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-27T00:00:00Z

该研究开发了一个语言引导的导航任务,消除了以前关于环境的假设。通过模拟以前的工作并进行单模态基线测试,发现在连续环境中的性能明显较低,表明以前的“导航-图形”设定中的性能可能被过高评价。

SayNav: 动态规划中基于大型语言模型的导航

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-08T00:00:00Z

本文介绍了一种名为LANCE的算法,用于自动化模型应力测试。该算法利用语言引导和文本编辑技术,增加了IID测试集的多样性和挑战性,而不改变模型权重。作者对多个预训练模型进行了测试,发现它们在性能上有显著且一致的下降。此外,作者还分析了不同类型编辑对模型的敏感性,并展示了其在揭示ImageNet中未知类别级别模型偏差方面的应用。

医学图像分类中的鲁棒性压力测试

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-08-14T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码