小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

浙大团队提出了一种新方法——体素对齐的前馈3D高斯泼溅,解决了二维特征在三维空间对齐及高斯密度受限的问题,提升了多视角渲染的质量与效率。该方法通过将2D特征聚合到3D体素网格中,增强了几何一致性和跨视图稳定性,适用于机器人、自动驾驶及AR/VR等领域。

前馈3D高斯泼溅新方法,浙大团队提出“体素对齐”,直接在三维空间融合多视角2D信息

量子位
量子位 · 2025-09-29T08:45:42Z

本研究提出了MetaSpatial,这是首个基于强化学习的框架,旨在提升视觉语言模型的三维空间推理能力,实现实时三维场景生成。通过多轮强化学习优化,MetaSpatial提高了布局的一致性和美观性,验证了其在元宇宙、AR/VR及游戏开发中的有效性。

MetaSpatial:增强元宇宙中视觉语言模型的三维空间推理

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-24T00:00:00Z
杜比全景声 (Dolby Atmos) 如何提升流媒体音频质量

流媒体服务改变了媒体消费方式,杜比全景声(Dolby Atmos)通过身临其境的音频体验提升了电影、音乐和游戏的音质。它采用对象音频技术,允许声音在三维空间中动态移动,增强用户沉浸感。随着技术进步,杜比全景声将继续影响流媒体音频的未来。

杜比全景声 (Dolby Atmos) 如何提升流媒体音频质量

实时互动网
实时互动网 · 2025-02-12T08:33:00Z
TinyRenderer笔记3:移动摄像机

在三维空间中,坐标系的变换通过矩阵实现。给定原点和基底,可以将一个坐标系的点转换到另一个坐标系。模型视图矩阵和视口矩阵用于将场景渲染到屏幕上。法向量的变换需使用模型变换矩阵的逆转置。

TinyRenderer笔记3:移动摄像机

kirito的博客
kirito的博客 · 2024-12-28T09:14:40Z

该研究针对多模态大语言模型在复杂三维环境中的本地化和对象消歧义问题,提出了有效技术,提升了句子相似性评价和三维空间理解能力,对协作机器人系统的整合具有重要意义。

多模态大语言模型中的三维空间理解:消歧义与评估

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-09T00:00:00Z
李飞飞创业之后首个专访:视觉空间智能与语言一样根本

李飞飞与Justin Johnson讨论了AI的新前沿:空间智能。李飞飞强调视觉空间智能的重要性,回顾了ImageNet对计算机视觉的影响,并指出AI的发展依赖计算和数据。她介绍了World Labs的研究,专注于解锁空间智能,涉及机器在三维空间中的感知、推理和行动能力,未来应用于生成三维世界和教育等领域。两人认为空间智能将推动AI在现实世界中的广泛应用。

李飞飞创业之后首个专访:视觉空间智能与语言一样根本

机器之心
机器之心 · 2024-09-23T06:49:48Z
如何在 C 语言中使用浮点数计算三维空间的几何模型?

本文介绍了在C语言中计算三维空间几何模型的方法,包括基本概念和浮点数计算操作。还给出了计算几何模型的例子和高级应用,如空间变换和性能优化。通过掌握这些技巧,可以提高三维图形和模型开发的效率和性能。

如何在 C 语言中使用浮点数计算三维空间的几何模型?

龙鲲博客
龙鲲博客 · 2024-07-26T02:46:36Z

本文讲述了作者在装修房子时遇到的问题和经验,选择装修公司后遇到设计师变更和案例不符合预期等困难。作者提到了选择设计师和签订合同等装修注意事项,并总结了自己的平面图规划。此外,还提到了水电施工前需要确定的事项。

在二维世界里踩三维空间的坑:我的装修平面图诞生记

少数派
少数派 · 2024-07-12T03:58:23Z

我们引入了一个新的基准TAPVid-3D,用于评估长距离三维点追踪任务。该基准包含4000多个真实世界视频,涵盖了不同的数据源、对象类型、运动模式和室内外环境。我们提出了一系列度量方法来衡量任务性能,并使用现有的追踪模型构建了竞争性基线。这个基准将帮助我们更好地理解从单眼视频中获取三维运动和表面变形的能力。

TAPVid-3D:一个用于追踪三维空间中任意点的基准测试

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-08T00:00:00Z

清华大学化工系与美国加州大学河滨分校合作研究了一种名为Uni-MOF的机器学习模型,用于预测纳米多孔材料的吸附性能。该模型通过预训练识别和恢复纳米多孔材料的三维结构,并考虑了操作条件。研究结果表明,Uni-MOF在预测气体吸附中表现出高精度,并具有广泛的应用潜力。

有效识别 63 万个三维空间构型,清华大学牵头发布 Uni-MOF 模型,预测 MOF 吸附能力

HyperAI超神经
HyperAI超神经 · 2024-04-08T04:55:42Z

我们提出了一种轻量级的解决方案,用于从单个 RGB 图像估计室内灯光的空间一致性。我们引入了一个统一的、基于体素八叉树的光照估计框架,以生成 3D 空间一致的照明。此外,我们提出了一个可微的体素八叉树锥追踪渲染层,用于消除整个过程中的常规体积表示,并确保在不同频域之间保持特征。实验结果表明,与先前的方法相比,我们的方法在极小的成本下实现了高质量的一致估计。

LightOctree:轻量级三维空间一致性室内照明估计

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-05T00:00:00Z

通过使用一种名为 3DAxiesPrompts(3DAP)的新型视觉提示方法,我们解放了 GPT-4V 在执行 3D 空间任务方面的能力。我们的研究发现,尽管 GPT-4V 在通过现有的视觉提示技术识别 2D 实体的位置和相互关系方面表现出熟练度,但其在处理 3D 空间任务方面的能力尚待探索。我们的方法是创建一个适用于 3D 图像的 3D 坐标系统,并带有注释的比例信息。通过将注入了...

3DAxiesPrompts:释放 GPT-4V 的三维空间任务能力

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-12-15T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码