小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
基于多视角捕获的大规模高质量3D高斯头部重建

我们提出了一种名为HeadsUp的方法,用于从大规模多摄像头捕获中重建高质量的3D高斯头部。该方法采用高效的编码-解码架构,将输入视图压缩为紧凑的潜在表示,并解码为与中性头模板锚定的UV参数化3D高斯。我们在超过10,000个受试者的内部数据集上训练和评估模型,取得了最先进的重建质量,并能在没有测试时优化的情况下推广到新身份。

基于多视角捕获的大规模高质量3D高斯头部重建

Apple Machine Learning Research
Apple Machine Learning Research · 2026-05-08T00:00:00Z

本研究提出了一种基于隐式神经表示的切片到体积重建方法,能够从多张运动干扰的低分辨率2D切片中快速准确地重建高分辨率MRI图像。实验结果表明,该方法在重建质量上显著优于现有技术,并能减少多达50%的重建时间。

Meta-learning Slice-to-Volume Reconstruction in Fetal Brain MRI using Implicit Neural Representations

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-14T00:00:00Z

本文研究了传统体素方法在高比特深度点云处理中的局限性,提出了一种分阶段的空间到通道(S2C)上下文模型,改进了数据压缩效果并降低了计算复杂性。通过几何残差编码(GRC)和球坐标系统,该方法提高了重建质量,节省了数据位数,展示了在稠密和低级稀疏点云上的应用潜力。

Voxel-based Point Cloud Geometry Compression and Space-to-Channel Model

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-24T00:00:00Z
One-D-Piece:图像Tokenizer满足质量可控压缩

本文介绍了一种名为One-D-Piece的可变长度离散图像分词器,采用“Tail Token Drop”技术,优化了图像压缩和重建质量。该方法在保持高重建质量的同时,支持灵活的令牌数量,显著优于传统压缩方法,如JPEG和WebP,适用于多种计算机视觉任务。

One-D-Piece:图像Tokenizer满足质量可控压缩

实时互动网
实时互动网 · 2025-02-19T03:42:13Z
用于多视角视频压缩的显隐混合表达

随着3D显示和虚拟现实技术的发展,多视角视频的压缩面临挑战。本文提出了一种隐式-显式集成的压缩方法,结合2D编解码器与隐式神经表示,显著提升了压缩性能和重建质量。实验结果表明,该方法在视角压缩方面优于现有标准。

用于多视角视频压缩的显隐混合表达

实时互动网
实时互动网 · 2025-02-13T06:20:45Z
用基础扩散模型实现有损图像压缩 | ECCV 2024

本文提出了一种新型有损图像压缩编解码器,利用潜在扩散模型在低比特率下生成高质量图像重建。该方法通过结合去噪和量化噪声,优化去噪步骤,显著提升了重建质量和速度,优于传统生成式编解码器。

用基础扩散模型实现有损图像压缩 | ECCV 2024

实时互动网
实时互动网 · 2025-02-12T06:20:36Z

本研究提出了一种新模型,通过渐进训练高压缩块,实现视频分词器在不增加通道容量的情况下,时间压缩比超过4倍,显著提升重建质量和效率,对视频生成具有重要影响。

视频分词器的渐进式生长用于高压缩潜在空间

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-09T00:00:00Z

本研究提出FLowHigh方法,针对音频超分辨率中的病态问题,应用高效生成模型流匹配技术,显著提升重建质量。实验结果表明,FLowHigh在VCTK基准数据集上表现优异,仅需单步采样,降低计算延迟。

FLowHigh: A Single-Step Flow Matching Method Towards Efficient and High-Quality Audio Super-Resolution

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-09T00:00:00Z

微软开源了新的视频Tokenizer VidTok,其性能显著优于Cosmos Tokenizer和Open-Sora。VidTok支持多种设置,适用于不同场景,并可在自定义数据集上微调。其创新架构和量化技术提升了重建质量和训练效率,为视频生成和世界模型研究提供了强大工具。

微软开源视频Tokenizer新SOTA!显著优于Cosmos Tokenizer和Open-Sora

量子位
量子位 · 2024-12-26T04:00:18Z

本研究提出了TexTok框架,解决了现有图像标记化方法在高分辨率生成中的低压缩率问题。TexTok结合文本描述,显著提高了重建质量和生成速度,推动了图像生成技术的发展。

Language-Guided Image Tokenization Generation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-08T00:00:00Z

本研究提出了一种新的分组球面量化(GSQ)方法,解决了图像标记器在可扩展性和分析全面性上的不足。GSQ-GAN在较少的训练迭代中实现了优越的重建质量,展现了高维隐空间的有效压缩与重构能力。

Expanding Image Taggers Using Group Spherical Quantization

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-03T00:00:00Z

本文介绍了基于3D高斯模型的技术进展,如pixelSplat和MVSplat。这些模型在重建3D辐射场时表现出高效性和准确性,尤其在处理稀疏视角和细节丰富的场景时。研究通过新方法和框架提升了重建质量和速度,并展示了良好的跨数据集泛化能力。

SmileSplat:适用于无约束稀疏图像的通用高斯点云

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-27T00:00:00Z

本研究提出小波流变分自编码器(WF-VAE),旨在解决视频变分自编码器在生成高分辨率和长时长视频时的编码成本问题。WF-VAE通过小波变换增强潜在表示的低频能量流,并采用因果缓存方法以确保潜在空间的完整性。实验结果表明,WF-VAE在PSNR和LPIPS指标上优于现有方法,吞吐量提高2倍,内存消耗降低4倍,同时保持重建质量。

WF-VAE:通过小波驱动能量流增强视频变分自编码器以用于潜在视频扩散模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-26T00:00:00Z

本研究提出了一种稀疏先验引导的方法,有效解决点云压缩中的表示冗余问题,显著提升高压缩比下的重建质量,优于现有技术。

Decoupled Sparse Prior Guided Point Cloud Diffusion Compression Model

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-21T00:00:00Z

本研究提出了TimeFormer模块,旨在解决动态场景重建中的复杂运动建模问题。该方法有效学习可变形3D高斯体的时间关系,显著提升了重建质量和速度。

时间变换器:捕捉可变形3D高斯的时间关系以实现稳健重建

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-18T00:00:00Z

本研究提出了一种新颖的视觉-触觉框架ViTaM-D,通过分布式触觉传感器提升手物体交互的重建质量,实验结果表明其在刚性和可变形物体重建的准确性上显著优于现有技术。

Dynamic Reconstruction of Hand-Object Interaction Based on Distributed Force Sensing Contact Representation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-14T00:00:00Z

本研究提出了一种新颖的LLV-FSR框架,旨在解决现有人脸超分辨率方法在视觉信息不足时的局限性。该方法结合大型视觉-语言模型与高阶视觉先验,在MMCelebA-HQ数据集上显著提高了重建质量,PSNR超越当前最优方法0.43dB。

LLV-FSR: Exploiting Large Language-Vision Priors for Face Super-Resolution

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-14T00:00:00Z

本研究提出了一种新颖的子空间扩散模型(Sub-DM),旨在提高MRI重建的效率和质量。通过正交分解策略,Sub-DM显著提升了k空间数据的学习效率,实验结果表明其在重建速度和质量上优于现有方法,具有广泛应用潜力。

Sub-DM: A Subspace Diffusion Model with Orthogonal Decomposition for MRI Reconstruction

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-06T00:00:00Z
基于Bits-Back深度编码的高效3D点云压缩

该研究提出了一种新型点云压缩方法,结合了“bits-back编码”和深度学习技术,显著提升了压缩效率和重建质量。实验结果表明,该方法在多个基准数据集上优于现有技术,具有广泛的应用潜力。

基于Bits-Back深度编码的高效3D点云压缩

DEV Community
DEV Community · 2024-10-25T09:27:51Z

本文提出了PixelGaussian框架,解决了现有三维高斯重建方法在任意视角下的局限性。该框架通过动态调整高斯分布和数量,显著提高了重建质量,尤其在复杂区域的处理上表现出更高的准确性,并有效减少了高斯冗余。

PixelGaussian: Generalizable 3D Gaussian Reconstruction from Arbitrary Views

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-24T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码