本研究提出了一种新颖的A-MESS框架,旨在改善多模态意图识别中的模态间联系和意图语义表示。通过引入基于锚点的多模态嵌入和语义同步策略,该框架优化了多模态表示,并在实验中显示出显著效果。
本研究提出了一种常识知识提取的文本增强方法(TECO),旨在提升多模态意图识别的性能。该方法通过提取知识关系,丰富文本上下文信息,有效融合语言与非语言模态,解决了语义信息提取和模态融合的挑战。
完成下面两步后,将自动完成登录并继续当前操作。