Unlocking the Potential of Large Language Models as Multimodal Encoders for Text and Graph-Structured Data
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
研究提出了Janus框架,通过大型语言模型整合图和文本数据,利用对比学习对齐模态空间,在问答任务中性能提升最高达11.4%。
🎯
关键要点
- 研究提出了Janus框架,解决了现有方法在整合图和文本嵌入方面的局限性。
- Janus框架利用大型语言模型共同编码文本和图数据。
- 通过对比学习有效对齐图和文本的模态空间。
- 在问答任务中,性能提升最高达11.4%。
- 这项工作对文本和图数据的集成具有重要影响。
➡️