小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
5秒完成3D场景编辑,北大&港中文&上海AI Lab搞出VGGT-Edit,120倍加速太炸了

VGGT-Edit是一种新型3D编辑框架,旨在直接在3D空间中进行编辑,避免传统2D方法的不稳定性。该模型通过残差场预测和深度同步文本注入,实现快速、稳定的3D场景修改,单次编辑约需5秒,速度提升可达120倍。研究团队构建了DeltaScene数据集,以确保多视角下的几何一致性,推动3D编辑技术的发展。

5秒完成3D场景编辑,北大&港中文&上海AI Lab搞出VGGT-Edit,120倍加速太炸了

量子位
量子位 · 2026-05-27T09:01:54Z
交互式世界建模新方案!腾讯混元发布世界模型WorldPlay,兼顾实时生成与长期几何一致性;5万条样本!Med-Banana-50K支持增删病灶双向编辑

腾讯混元团队推出的WorldPlay是一个实时交互的世界模型,解决了生成速度与内存占用之间的平衡。该模型通过双重动作表示法、重构上下文记忆机制和情境强迫蒸馏方法,实现了长期几何一致性,能够以24 FPS生成720p高清流媒体视频,展现出优秀的泛化能力。

交互式世界建模新方案!腾讯混元发布世界模型WorldPlay,兼顾实时生成与长期几何一致性;5万条样本!Med-Banana-50K支持增删病灶双向编辑

HyperAI超神经
HyperAI超神经 · 2026-01-06T13:04:18Z

浙大团队提出了一种新方法——体素对齐的前馈3D高斯泼溅,解决了二维特征在三维空间对齐及高斯密度受限的问题,提升了多视角渲染的质量与效率。该方法通过将2D特征聚合到3D体素网格中,增强了几何一致性和跨视图稳定性,适用于机器人、自动驾驶及AR/VR等领域。

前馈3D高斯泼溅新方法,浙大团队提出“体素对齐”,直接在三维空间融合多视角2D信息

量子位
量子位 · 2025-09-29T08:45:42Z

本研究提出了GC MVSNet++模型,解决了传统多视角立体视觉方法在几何一致性检查中的不足。实验结果表明,该方法加快了学习过程,并在多个数据集上取得了最佳性能,展示了监督学习在多视角和多尺度几何一致性中的潜力。

Combining 3D Geometry and Machine Learning for Multi-View Stereo Vision

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-06T00:00:00Z

本研究提出了一种自监督方法,能够从无姿势的互联网照片生成3D一致性视频。该方法利用视频一致性和多视角照片的可变性,训练可扩展的3D感知视频模型,无需3D注释。实验结果表明,该方法在几何和外观一致性方面优于现有基线,适用于需要摄像机控制的应用。

Generating 3D-Consistent Videos from Unposed Internet Photos

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-20T00:00:00Z

本研究提出M3D框架,旨在解决从单个RGB图像重建3D对象的挑战。该框架采用双流特征提取策略,显著提升了场景理解和重建精度,实验结果表明其在几何一致性和重建保真度方面表现优异。

M3D: Dual-Stream Selective State Spaces and Depth-Driven Framework for High-Fidelity Single-View 3D Reconstruction

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-19T00:00:00Z

本研究提出了一种新颖的高斯点云方法,解决了传统高分辨率图像在实时交互中的局限,尤其在稀疏视角下。该方法显著提高了渲染速度并保持几何一致性,实验结果表明其优于现有技术,具有广泛应用潜力。

GPS-Gaussian+: A Generalizable Pixel-wise 3D Gaussian Splatting Technique for Fast Rendering of Human-Scene Interactions

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-18T00:00:00Z

本研究提出了一种新方法INTEGER,旨在解决无监督点云配准中的优化目标不足问题。通过特征几何一致性挖掘模块,结合上下文信息和几何线索,动态适应教师网络,生成可靠的伪标签。实验结果表明,INTEGER在准确性和普遍性方面表现优异。

Feature Geometric Consistency Mining and Transfer in Unsupervised Point Cloud Registration

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-04T00:00:00Z

本研究提出了一种3D适配器模块,解决了多视角图像扩散模型在3D几何一致性方面的不足。通过注入3D几何意识,显著提升了几何质量,支持多种任务,展现了广泛的应用潜力。

3D Adapter: Geometry-Consistent Multi-View Diffusion for High-Quality 3D Generation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-24T00:00:00Z

本文介绍了一系列新方法,如LucidDreaming、MIG和Direct3D,旨在提高3D生成的控制能力和质量。这些技术解决了几何不一致性和属性泄漏问题,提升了生成结果的视觉质量和一致性,为用户提供了更大的创作自由度,推动了3D内容创作的进步。

3DIS:基于深度驱动的解耦实例合成用于文本到图像生成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-16T00:00:00Z

本研究提出多种神经网络方法用于高质量3D表面重建,利用多视角图像、几何一致性和隐式神经渲染等技术,显著提高了重建精度和细节表现,尤其在复杂几何和反射物体的处理上取得了优异成果。

重新思考神经隐式表面重建中的方向参数化

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-11T00:00:00Z

本文介绍了一系列基于多模型匹配和优化算法的视觉重建方法,重点在于提高匹配数量和精度。研究涵盖了从宽基线匹配到无检测器SfM框架的进展,强调了在复杂场景中处理几何一致性和点云匹配的创新,展示了显著的性能提升和应用潜力。

面向几何的特征匹配用于大规模运动重建

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-03T00:00:00Z

本文介绍了多种三维生成技术,包括基于分数蒸馏的NeRF模型、DragD3D局部网格编辑方法和PolyDiff三维多边形网格生成方法。这些技术通过结合草图风格引导、二维扩散先验和合理性保持,显著提升了三维对象生成的质量和控制能力,解决了几何不一致性问题。

MeshUp:通过混合评分蒸馏实现多目标网格变形

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-27T00:00:00Z

该研究提出了多种神经隐式表面重建方法,利用几何一致性和多视角约束,显著提升室内场景的重建质量。通过引入不确定性建模和深度先验技术,解决了纹理缺乏的问题,实验结果表明其在3D重建中表现优越。

ND-SDF:用于高保真室内重建的法向偏移场学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-22T00:00:00Z

本文介绍了一种新颖的三维生成方法“Consistent3D”,通过GSD框架和姿态相关性蒸馏采样(PCDS),显著提高了文本到三维生成的几何一致性和质量。研究还提出了分类器分数蒸馏(CSD)和稳定评分蒸馏(SSD)等新方法,优化了生成模型的性能,解决了3D模型准确性与文本提示之间的错位问题。实验结果表明,这些方法在生成高保真度和多样性的三维物体方面表现优异。

连接一致性蒸馏与分数蒸馏用于文本到 3D 生成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-18T00:00:00Z

本文介绍了多种基于扩散模型的三维图像生成方法,如ConsistNet、SyncDreamer和MVDream。这些模型能够从单张图像生成多视角一致的三维图像,解决几何和颜色一致性问题,适用于新视点合成和个性化三维生成。结合文本提示和大规模数据集,这些方法显著提高了生成效果和稳定性。

ConsistDreamer: 高保真场景编辑的三维一致的二维扩散

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-13T00:00:00Z

该论文提出了一种几何一致的神经隐式表面重建方法,结合多视角几何约束和稀疏结构信息,优化有符号距离函数以实现高质量重建。实验结果表明,该方法在速度、泛化性能和灵活性方面表现优越。

GenS:多视角图像的通用神经表面重建

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-04T00:00:00Z

本文介绍了通过DreamControl的两阶段2D-lifting框架解决3D生成中的几何不一致性问题,提升了文本到3D生成的可控性。研究提出了Control3D方法,结合手绘草图和文本提示,生成高质量的3D场景,并探讨了人脸合成、3D模型生成及样式编辑等技术,展示了在几何和纹理一致性方面的显著进展。

基于文本引导的可控网格精细化方法用于交互式三维建模

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-03T00:00:00Z

该研究介绍了多种基于视频扩散模型的3D生成方法,如One-2-3-45++和Envision3D,能够从单张图像快速生成高质量的3D纹理网格和多视图图像。这些方法通过新算法和框架显著提高了生成效率和几何一致性,适用于个性化3D生成和新视角合成。

CAT3D: 利用多视角扩散模型创建三维任何物体

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-16T00:00:00Z

本文介绍了一种新方法GC-MVSNet,通过鼓励多源视图的几何一致性,加速多视角立体(MVS)学习过程,达到了DTU和BlendedMVS数据集的最新技术水平,并在Tanks and Temples基准上取得了竞争力结果。该方法结合了匹配不确定性估计和几何一致性,显著提高了深度估计的准确性。

GoMVS:多视角立体匹配的几何一致成本聚合

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-11T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码