机器之心 ·

NeurIPS 2024 Oral | 还原所见！揭秘从脑信号重建高保真流畅视频

💡 原文中文，约3800字，阅读约需9分钟。

📝

内容提要

同济大学等机构的研究提出了NeuroClips框架，利用fMRI数据重建高保真视频。该方法有效解决了fMRI低时间分辨率和视频重建控制不足的问题，显著提升了重建效果，增强了神经科学的可解释性。

🎯

🔎

NeuroClips框架通过引入感知重建器和语义重建器，解决了以往fMRI视频重建中存在的低级视觉感知控制不足的问题。这种创新方法不仅提高了重建视频的质量，还增强了对大脑活动的理解，推动了神经科学与计算机科学的交叉研究。

fMRI的低时间分辨率（通常为0.5fps）是视频重建的一大挑战。NeuroClips通过多fMRI融合策略，首次实现了长达6秒的连续视频重建，展示了在高时间分辨率需求下的潜力。这一突破为未来的脑信号解码研究提供了新的方向。

NeuroClips在多个指标上超越了以往方法，尤其是在SSIM和视频平滑度方面的表现显著提升。这表明该框架在像素级控制和语义对齐方面的优势，为视频重建技术的进一步发展奠定了基础。

❓

NeuroClips框架用于从fMRI数据中重建高保真和流畅的视频，解决了fMRI低时间分辨率和视频重建控制不足的问题。

主要挑战包括fMRI的低时间分辨率（通常为0.5fps）和对视频低级视觉感知缺乏控制。

NeuroClips通过引入感知重建器和语义重建器，分别重建低级感知流和语义关键帧，从而提高视频的保真度和平滑度。

NeuroClips在多个指标上显著优于先前的方法，尤其在SSIM和视频平滑度方面表现突出。

通过多fMRI融合策略，NeuroClips考虑相邻fMRI样本的语义相似性，实现了长达6秒的连续视频重建。

NeuroClips通过可视化体素级别的权重，观察到视觉皮层的重要性，增强了神经科学的可解释性。

🏷️