跨视觉数据集中静态图像的 BOLD fMRI 时间序列编码:人类视觉的初步研究
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文介绍了一个两阶段的fMRI表示学习框架,通过降噪和调整特征学习者来生成高分辨率和语义准确的图像。实验结果表明,该模型在生成图像方面的准确率比先前最先进的方法提高了39.34%。
🎯
关键要点
- 介绍了一个两阶段的 fMRI 表示学习框架。
- 预处理阶段使用 Double-contrastive Mask Auto-encoder 进行降噪。
- 第二阶段利用图像自动编码器的指导调整特征学习者。
- 优化后的 fMRI 特征学习者用于潜在扩散模型重构图像刺激。
- 实验结果显示该模型在生成高分辨率和语义准确的图像方面优越。
- 在 50 种不同目标的情境下,top-1 语义分类的准确率提高了 39.34%。
➡️