小红花·文摘 - 小红花技术领袖俱乐部

本研究提出了一种新颖的A-MESS框架，旨在改善多模态意图识别中的模态间联系和意图语义表示。通过引入基于锚点的多模态嵌入和语义同步策略，该框架优化了多模态表示，并在实验中显示出显著效果。

Anchor-based Multimodal Embedding and Semantic Synchronization for Multimodal Intent Recognition

BriefGPT - AI 论文速递 ·

本研究提出了一种常识知识提取的文本增强方法（TECO），旨在提升多模态意图识别的性能。该方法通过提取知识关系，丰富文本上下文信息，有效融合语言与非语言模态，解决了语义信息提取和模态融合的挑战。

TECO: Enhancing Text for Multimodal Intent Recognition through Commonsense Knowledge Extraction

BriefGPT - AI 论文速递 ·