2D存量视频变3D金矿，来看京东3D空间视频生成技术探索与应用 | ICME 2025

实时互动网 ·

2D存量视频变3D金矿，来看京东3D空间视频生成技术探索与应用 | ICME 2025

💡 原文中文，约11200字，阅读约需27分钟。

📝

内容提要

随着社交媒体和XR设备的发展，3D空间视频需求激增。京东团队创新性地将2D视频转化为3D视频，降低了制作成本。该技术已被国际多媒体会议接收，并创建了高质量的StereoV1K数据集，推动了行业发展。

🎯

关键要点

社交媒体和XR设备的发展推动了3D空间视频的需求增长。
京东团队创新性地将2D视频转化为3D视频，降低了制作成本。
该技术已被国际多媒体会议ICME 2025接收，并创建了StereoV1K数据集。
StereoV1K数据集包含1000个视频，分辨率为1180×1180，总帧数超过50万帧。
单目深度估计是计算机视觉中的基础问题，关键在于推断物体的深度信息。
新视角合成技术在虚拟现实和增强现实中应用广泛，面临多种挑战。
MV-HEVC编码方法显著提升了3D视频的压缩效率和编码速度。
京东.Vision视频频道利用该技术提升用户的沉浸式观看体验。
未来3D领域将集中在AIGC 3D/4D和世界模型生成等方向。
3D/4D领域的AIGC发展迅速，关注生成过程的可控性与可编辑性。

❓

延伸问答

京东的3D空间视频生成技术有什么创新之处？

京东团队创新性地将2D视频转化为3D视频，显著降低了制作成本，提升了内容供给能力。

StereoV1K数据集的特点是什么？

StereoV1K数据集包含1000个视频，分辨率为1180×1180，总帧数超过50万帧，是高质量的立体视频数据集。

MV-HEVC编码方法的优势是什么？

MV-HEVC编码方法通过利用左右眼画面之间的相似性，显著提升了3D视频的压缩效率和编码速度。

3D空间视频生成技术在实际应用中有哪些场景？

该技术已在京东.Vision视频频道等业务场景落地，提升了用户的沉浸式观看体验。

单目深度估计在3D视频生成中有什么重要性？

单目深度估计是推断物体深度信息的基础，对增强现实和虚拟现实等应用至关重要。

未来3D领域的发展方向是什么？

未来3D领域将集中在AIGC 3D/4D和世界模型生成等方向，关注生成过程的可控性与可编辑性。

🏷️

继续阅读

标准智能：在像素空间中训练通用智能
标准智能公司正在探索通过视频数据训练通用智能代理的可能性。他们的模型分析计算机使用的原始视频数据，以预测鼠标移动和点击等操作。创始人Galen Mead和...
代理现在可以创建Cloudflare账户、购买域名并部署应用
代理现在可以代表用户创建Cloudflare账户、购买域名并部署应用，整个过程无需人工干预。通过与Stripe合作的新协议，代理能够快速完成这些任务，简化...
洪绘视频整理发布！快速整理视频文件名、移动文件夹工具
该应用主要用于个人视频整理，支持通过标签命名和快速修改文件名。用户可以将下载的视频集中到一个文件夹，方便管理和搜索。软件界面简洁，支持视频预览和文件操作，...
生数科技认领神秘登顶模型：AI视频公司拿出工业级Demo，跨本体跑通复杂长程任务
生数科技推出的MotuBrain是一款具身智能机器人通用大脑，具备世界模型的预测和行动能力，展现出卓越的物理理解和行动能力。MotuBrain通过统一建模...
基于模式：苏珊·张的经济计量学根基如何推动安全领域的机器学习及其极简工作空间
苏珊·张的职业生涯始于经济学，专注于经济系统中的统计模型。作为Elastic的首席数据科学家，她利用机器学习技术帮助组织检测安全数据中的异常行为，并开发评...
你的.NET应用为什么越来越慢？问题从来不在代码
系统变慢的原因通常不是代码本身，而是由于分配和无效工作导致的开销增加。优化应减少不必要的对象创建和抽象，简化执行路径，控制GC压力。整体成本的累积是主要问...