小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
3D基础模型时代开启?Meta与牛津大学推出VGGT,一站式Transformer开创高效3D视觉新范式

VGGT(视觉几何基础变换器)是牛津大学与Meta AI联合研发的3D视觉模型,能够快速推理相机参数和深度图,性能超越传统方法。该模型采用纯前馈设计,显著提升推理速度和精度,展现出强大的泛化能力,标志着3D视觉领域的重要突破。

3D基础模型时代开启?Meta与牛津大学推出VGGT,一站式Transformer开创高效3D视觉新范式

机器之心
机器之心 · 2025-03-28T02:16:10Z

该研究提出了一种高效通用的解决方案,解决了文本到图像生成中相机控制不精确的问题。通过四个相机参数,研究展示了一个包含57,000多幅图像及其文本提示和相机参数的新数据集,并证明了该方法在生成图像时实现了更精准的相机控制。

PreciseCam: Precise Camera Control for Text-to-Image Generation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-22T00:00:00Z

本研究提出了FreeSplatter框架,解决了稀疏视图重建中相机姿态不足的问题。该框架通过无标定稀疏视图生成高质量三维表示,并快速恢复相机参数,优于现有方法。

FreeSplatter: Unconstrained Gaussian Splatter for Sparse View 3D Reconstruction

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-12T00:00:00Z

OpenIllumination是一个包含108k多个真实世界图像的数据集,可用于评估反渲染和材料分解方法。数据集提供了每个图像的相机参数、光照真值和前景分割掩码。

斯坦福 - ORB: 三维物体逆向渲染实际世界基准

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-24T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码