BriefGPT - AI 论文速递 ·

人类-VDM：从视频扩散模型学习单图像3D人类高斯点云

💡 原文中文，约400字，阅读约需1分钟。

📝

内容提要

该研究提出了一种新方法，通过结合U-Nets和扩散变换器的优势，从单个图像生成高质量、时空连贯的人类视频。注入人类身份、相机参数和时间信号，实现了精确的条件设定。该方法能够合成逼真、连贯和自由观察的人类视频，为虚拟现实和动画等领域的应用提供了新的可能性。

🎯

关键要点

提出了一种新颖的方法，从单个图像生成高质量、时空连贯的人类视频。
框架结合了U-Nets的精确条件注入和扩散变换器的全局相关性捕捉优势。
核心是一个级联的4D变换器架构，实现对4D空间的高效建模。
通过注入人类身份、相机参数和时间信号，实现精确的条件设定。
训练模型使用了跨图像、视频、多视角数据和3D/4D扫描的多维数据集。
克服了以GAN或基于UNet的扩散模型为基础的先前方法的局限性。
方法能够合成逼真、连贯和自由观察的人类视频，推动虚拟现实和动画等领域的应用。

🏷️

继续阅读

Vizrt AI Keyer 可消除 XR 和 VR 场景中的绿幕抠像
Vizrt推出了AI原生视觉叙事平台Vizrt AI Keyer，旨在提升虚拟现实和扩展现实应用。该平台通过识别人体形状，无需绿幕和复杂灯光设置，允许演员...
爱奇艺宣布转向哔哩哔哩模式鼓励个人创作者发布视频并通过广告获得收益
爱奇艺宣布转向去中心化视频发行模式，鼓励个人创作者发布视频并通过广告获利。首席执行官龚宇表示，AI技术将降低内容制作成本，创作者和作品数量可能大幅增加。爱...
Insta360将在其下一款无线麦克风上配备屏幕，以显示标志或图像
Insta360推出的新款无线麦克风Mic Pro，配备可定制的E Ink彩色屏幕，具备三麦克风阵列和AI处理器，支持降噪功能，并可直接与多款相机连接，确...
Deezer表示AI歌曲上传量几乎超过人类音乐
Deezer表示，每天接收近75,000首AI生成歌曲，占所有上传的44%。尽管上传量激增，AI歌曲的播放量仅占1%至3%。Deezer已开始标记AI曲目...
谷歌照片图像编辑器中的新修饰工具让您快速进行细微调整。
谷歌照片推出新的修饰工具，帮助用户快速改善照片效果，包括细化肤质、去除瑕疵、提亮眼睛和美白牙齿。用户只需选择面部并调整效果强度。这些工具正在全球范围内逐步...
阿里发布Wan2.7-Image，人类偏好盲测评分国内第一
阿里巴巴发布了图像生成与编辑模型Wan2.7-Image，解决了AI生图的审美疲劳和色彩控制问题。该模型支持文生图、图生组图及交互式编辑，适用于影视、自媒...

人类-VDM：从视频扩散模型学习单图像3D人类高斯点云

内容提要

关键要点

标签

继续阅读