研究显示,在被动虚拟现实环境中,用户的运动感知可以被操控而不会感到不适。格拉斯哥大学的研究发现,虚拟转弯使用户误以为自己在进行更剧烈的运动,这种感知操控可用于游戏和模拟器,增强沉浸感。
本研究探讨计算机视觉模型与生物视觉系统在运动感知,特别是人类对二阶运动的感知差异。通过模仿皮层V1-MT通路,结合可训练的运动能量传感器和循环图网络,模型在自然视频训练下成功再现一阶和二阶运动,展现出与生物系统一致的特性,证明其潜在实用价值。
本研究提出了MotionCom,一种基于大语言模型和视频扩散先验的自动化运动感知图像合成方法。该方法解决了传统图像合成中物体位置手动规划和运动真实感不足的问题,实现了目标物体的无缝集成,并在规划效率和运动表现上优于现有方法。
ControlVideo是一种无需训练的文本到视频生成模型,能够快速生成高质量视频。Video-ControlNet通过控制信号生成视频,DragNUWA提供精细控制,MoVideo考虑运动感知,TrackDiffusion改善多目标跟踪,Motion-I2V和Direct-a-Video允许用户控制对象和相机运动。这些新方法整合语义和动作线索,提升视频质量和连贯性。
本文提出了一种新的运动感知增强框架,改进动态场景重建,提升3D高斯喷溅性能。通过灵活变形建模方案,开发了Deform3DGS框架,实现内窥镜手术中可变形组织的实时重建。此外,提出FSGS方法以高效合成视角,提升渲染质量与效率。GS-SLAM算法首次应用3D高斯表示,优化SLAM系统的效率与准确性,并探讨了3D高斯喷洒中的误差源,提出增强鲁棒性的解决方案。
该研究提出了一种运动感知视频帧插值网络(MA-VFI),通过分层金字塔模块直接估计中间光流,有效解决复杂场景中的模糊和伪影问题。实验结果显示,该方法在多个数据集上超越了现有插值技术,提升了效率和准确性。
本文提出了一种新的运动感知增强框架,通过光流中的运动线索改进动态场景重建,提升3D高斯喷溅性能。研究还介绍了基于优化4D基元的方法,有效捕捉复杂动态场景,并在多个基准数据集上展现出优异的视觉质量和效率。
本文提出了一种新的运动感知增强框架,利用光流中的运动线索改进动态场景重建,提升3D高斯喷溅性能。通过GS-SLAM算法,实现高效准确的同时定位与地图构建,优化相机姿态,增强重建质量。4D高斯喷洒方法在动态场景中表现出色,支持实时渲染和高分辨率效果。
完成下面两步后,将自动完成登录并继续当前操作。