小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

蚂蚁灵波科技开源了LingBot-Depth模型,提升机器人和自动驾驶的三维视觉能力。该模型利用“掩码深度建模”技术,解决透明和反光物体的深度感知问题,显著提高深度图的完整性和清晰度。

让机器人“看清”三维世界,蚂蚁灵波开源LingBot-Depth模型

量子位
量子位 · 2026-01-27T12:00:19Z
MM-Spatial:探索多模态大语言模型中的3D空间理解

多模态大语言模型(MLLMs)在2D视觉理解方面表现优异,但在3D空间推理上仍存在局限。本文提出了新的监督微调数据集CA-VQA及评估基准,专注于室内场景,展示了其在训练MM-Spatial模型方面的有效性,显著提升了3D空间理解能力,并与专用单目深度估计模型的深度感知能力相当。

MM-Spatial:探索多模态大语言模型中的3D空间理解

Apple Machine Learning Research
Apple Machine Learning Research · 2025-09-23T00:00:00Z

本研究提出了Splatter-360框架,解决了实时合成宽基线全景图像新视图的挑战,显著提升了深度感知和几何估计能力,实验结果优于现有方法。

Splatter-360: A Generalizable 360° Gaussian Splatter Algorithm for Wide-Baseline Panoramic Images

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-09T00:00:00Z

本研究针对家庭场景中操控关节物体的挑战,构建了大规模数据集,提升了深度感知和交互姿势预测的性能,推动了关节物体操控的研究进展。

GAPartManip: A Large-Scale Part-Centric Dataset for Material-Independent Manipulation of Articulated Objects

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-27T00:00:00Z

本文提出了StereoCrafter-Zero框架,通过噪声重启和迭代优化,显著改善了立体视频生成中的深度感知和时序一致性问题。

StereoCrafter-Zero: Zero-Shot Stereo Video Generation Without Paired Training Data

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-21T00:00:00Z

本文介绍了一个用于6自由度姿态估计的新数据集,包含玩具物品的3D模型和RGBD图像,旨在提升机器人抓取和操控能力。同时,研究提出了新的姿态评估指标ADD-H,并探讨了基于视觉的机器人操作学习和透明物体深度感知的解决方案。

基于6D位姿估计的实验室设备自主操控机器人框架

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-10T00:00:00Z

本文介绍了多种基于视觉的手术器械分割和追踪方法,强调深度学习在器械分割中的优势及其临床应用潜力。同时,提出了一种创新的单目视觉SLAM方法,解决了内窥镜手术中的深度感知问题,显著提升了手术的准确性和效率。

基于SLAM的腹腔镜手术三维追踪系统

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-18T00:00:00Z

该研究提出了一种统一的深度感知无监督域自适应框架,利用源领域的深度信息来提升目标领域的语义分割性能。文章涵盖了无监督领域适应的最新进展,展示了在自动驾驶等场景中的应用效果。

MICDrop:通过互补丢弃对图像和深度特征进行掩蔽以实现领域自适应语义分割

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-29T00:00:00Z

本文研究视频中的重复性问题,采用小波变换处理动态视频,提出三种基本运动类型和18种周期性运动情况。通过QUVA Repetition数据集验证理论,结果优于深度学习方法。同时探讨事件相机技术在深度感知、极化成像和3D动作捕捉中的应用,提出多种新方法和工具,显示出高效性和准确性。

EE3P3D:基于事件的周期现象频率估计方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-13T00:00:00Z

本文提出了一种新颖的深度感知注意力融合网络,通过特定编码器提取色彩和深度信息,并引入深度加权交叉注意力融合模块,动态调整特征图融合权重。实验结果表明,该方法在伪装物体检测中显著优于其他方法,验证了深度信息的重要性。

深入探索!基于深度感知的分割模型用于伪装物体检测

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-17T00:00:00Z

本研究提出了一种深度感知的单目视觉楼梯建模方法,通过深度传感器获取楼梯表面点云,显著提升了楼梯几何特征的学习效果。同时,利用深度学习模型优化复杂地面的人机行走效果。

城市环境下自主探索的楼梯定位

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-26T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码