MindGPT:使用非侵入性脑记录解读所见
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
研究团队开发了一种非侵入性神经解码器MindGPT,可以将视觉刺激解释为自然语言。该模型建立在具有交叉注意机制的视觉引导神经编码器上,并通过大型语言模型GPT的协同使用来将潜在的神经表示引导到期望的语义方向。实验证明,该模型的神经表示具有可解释性,可以用来评估视觉属性对语义的贡献。
🎯
关键要点
- 研究团队开发了一种非侵入性神经解码器MindGPT,能够将视觉刺激解释为自然语言。
- MindGPT模型基于具有交叉注意机制的视觉引导神经编码器,并结合大型语言模型GPT使用。
- 该模型能够将潜在的神经表示引导到期望的语义方向,具有可解释性。
- 实验证明生成的词序列真实地代表了感知刺激中的视觉信息,包含关键细节。
- 结果显示,高级视觉皮层(HVC)在语言解码任务中比低级视觉皮层(LVC)更具语义信息,仅使用HVC即可恢复大部分语义信息。
- MindGPT模型的代码将公开发布。
➡️