DREAM:从逆向人类视觉系统实现视觉解码
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
该文介绍了一个两阶段的fMRI表示学习框架,通过使用Double-contrastive Mask Auto-encoder降噪和图像自动编码器的指导来调整特征学习者,生成高分辨率和语义准确的图像。实验结果表明,该模型在50种不同目标的情境下,top-1语义分类的准确率比先前最先进的方法提高了39.34%。
🎯
关键要点
-
介绍了一个两阶段的fMRI表示学习框架。
-
预处理阶段使用Double-contrastive Mask Auto-encoder进行降噪。
-
第二阶段利用图像自动编码器的指导调整特征学习者。
-
该框架关注于视觉重建中最有信息的神经激活模式。
-
优化后的fMRI特征学习者用于潜在扩散模型重构图像刺激。
-
实验结果显示该模型生成高分辨率和语义准确的图像。
-
在50种不同目标的情境下,top-1语义分类准确率提高了39.34%。
➡️