小红花·文摘

研究：被动式 VR 体验更容易被操纵

实时互动网 ·

本研究探讨计算机视觉模型与生物视觉系统在运动感知，特别是人类对二阶运动的感知差异。通过模仿皮层V1-MT通路，结合可训练的运动能量传感器和循环图网络，模型在自然视频训练下成功再现一阶和二阶运动，展现出与生物系统一致的特性，证明其潜在实用价值。

多阶人类视觉运动处理的机器学习建模

BriefGPT - AI 论文速递 ·

本研究提出了MotionCom，一种基于大语言模型和视频扩散先验的自动化运动感知图像合成方法。该方法解决了传统图像合成中物体位置手动规划和运动真实感不足的问题，实现了目标物体的无缝集成，并在规划效率和运动表现上优于现有方法。

MotionCom: Automated Motion-Aware Image Composition Based on Large Language Models and Video Diffusion Priors

BriefGPT - AI 论文速递 ·

ControlVideo是一种无需训练的文本到视频生成模型，能够快速生成高质量视频。Video-ControlNet通过控制信号生成视频，DragNUWA提供精细控制，MoVideo考虑运动感知，TrackDiffusion改善多目标跟踪，Motion-I2V和Direct-a-Video允许用户控制对象和相机运动。这些新方法整合语义和动作线索，提升视频质量和连贯性。

TrackGo：一种灵活高效的可控视频生成方法

BriefGPT - AI 论文速递 ·

本文提出了一种新的运动感知增强框架，改进动态场景重建，提升3D高斯喷溅性能。通过灵活变形建模方案，开发了Deform3DGS框架，实现内窥镜手术中可变形组织的实时重建。此外，提出FSGS方法以高效合成视角，提升渲染质量与效率。GS-SLAM算法首次应用3D高斯表示，优化SLAM系统的效率与准确性，并探讨了3D高斯喷洒中的误差源，提出增强鲁棒性的解决方案。

Free-SurGS：无 SFPM 的手术场景重建中的三维高斯散点法

BriefGPT - AI 论文速递 ·

该研究提出了一种运动感知视频帧插值网络（MA-VFI），通过分层金字塔模块直接估计中间光流，有效解决复杂场景中的模糊和伪影问题。实验结果显示，该方法在多个数据集上超越了现有插值技术，提升了效率和准确性。

视频帧插值的分离式运动建模

BriefGPT - AI 论文速递 ·

本文提出了一种新的运动感知增强框架，通过光流中的运动线索改进动态场景重建，提升3D高斯喷溅性能。研究还介绍了基于优化4D基元的方法，有效捕捉复杂动态场景，并在多个基准数据集上展现出优异的视觉质量和效率。

猜测未见之物：从部分二维闪烁中动态三维场景重建

BriefGPT - AI 论文速递 ·

本文提出了一种新的运动感知增强框架，利用光流中的运动线索改进动态场景重建，提升3D高斯喷溅性能。通过GS-SLAM算法，实现高效准确的同时定位与地图构建，优化相机姿态，增强重建质量。4D高斯喷洒方法在动态场景中表现出色，支持实时渲染和高分辨率效果。

高斯喷洒移动：针对自然相机运动的模糊和快门滚动补偿

BriefGPT - AI 论文速递 ·