小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
GigaBrain-0——通过世界模型GigaWorld增强VLA的泛化能力:基于RGBD输入建模,及通过具身CoT增强推理能力

GigaBrain-0是一种新型视觉-语言-动作(VLA)模型,旨在通过整合视觉输入、自然语言指令和运动控制,提升机器人在多样环境中的操作能力。该模型利用生成的数据,降低对真实世界数据的依赖,提高泛化能力和数据效率。GigaBrain-0采用混合架构,增强空间感知能力,并通过生成中间推理步骤,模拟人类问题解决过程,实现更精确的操作和决策。

GigaBrain-0——通过世界模型GigaWorld增强VLA的泛化能力:基于RGBD输入建模,及通过具身CoT增强推理能力

结构之法 算法之道
结构之法 算法之道 · 2026-02-14T12:16:31Z

本文提出了GeoFlow-SLAM,一种针对动态环境的RGBD-惯性SLAM方法。通过结合几何一致性和四足里程计约束,显著提升了特征匹配效果,改善了传统SLAM在纹理稀缺环境中的表现,并在多个公开数据集上取得最佳结果。

GeoFlow-SLAM: A Robust Tight-Coupled RGBD-Inertial Fusion SLAM for Dynamic Quadrupedal Robots

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-18T00:00:00Z

本研究提出了SurgSora框架,旨在解决现有医疗视频生成模型在可控性和真实性方面的不足。该框架通过三个模块实现手术视频的精确控制,实验结果表明其优于现有方法,具有推动医疗教育和研究的潜力。

SurgSora: A Decoupled RGBD-Flow Diffusion Model for Controllable Surgical Video Generation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-18T00:00:00Z

本研究提出了FloorNet算法,利用深度神经网络技术重建室内地图,通过RGBD流图像数据提取特征,提升室内平面图重建的准确性,并探讨了多种方法解决房间布局重建问题,显著提高了重建质量和性能。

FRI-Net:基于房间级隐式表示的楼层规划重建

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-15T00:00:00Z

使用单个低成本 RGBD 摄像头的生物力学方法,可提供高精度的上肢运动学重建和全面上肢生物力学研究的潜力。

使用单个 RGBD 相机的实时、准确及开源的上肢肌肉骨骼分析

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-14T00:00:00Z

本文介绍了一种新型点云配准算法,通过多尺度双向融合实现更准确的对应估计,显著提升了在ScanNet和3DMatch数据集上的性能,尤其在室内外场景中表现优异。

RGBD-Glue: 强鲁棒性 RGB-D 点云配准的通用特征融合

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-13T00:00:00Z

本文介绍了一种名为GS-SLAM的算法,该算法首次在SLAM系统中应用3D高斯表示,提升了效率与准确性。GS-SLAM通过自适应扩张策略重构场景几何并优化相机姿态,在多个数据集上表现出竞争力,实现了高质量的3D重建和语义分割,具备实时渲染能力,推动了SLAM技术的发展。

RGBD GS-ICP SLAM

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-19T00:00:00Z

本文介绍了基于去噪扩散概率模型的深度估计技术,如MonoDiffusion和RenderDiffusion。这些模型通过自监督学习和合成数据,提高了深度估计的准确性和鲁棒性,尤其在KITTI和Make3D数据集上表现突出。此外,研究还探讨了其在虚拟现实和增强现实中的应用潜力。

D4D: 一种提升单目深度估计的 RGBD 扩散模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-12T00:00:00Z

本文介绍了一种从野外拍摄的单目RGB视频学习高质量隐式三维头像的方法,通过参数化人脸模型驱动头像,实现用户控制的面部表情和头部姿态。该方法结合几何先验、3DMM的动态跟踪和神经辐射场,实现细粒度控制和光线真实感。实验结果表明,该方法能够重建高质量的头像,具有更准确的表情依赖细节,并在训练之外的表情和数量上具有优秀的渲染效果。

多功能人脸动画师:在 RGBD 空间中驱动任意的 3D 人脸形象

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-08-11T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码