小红花·文摘

通过结构化文本知识，提出了一个系统且统一的框架(RmLR)来提高人物-物体交互检测。通过分析相互作用信息的损失并生成更全面的视觉表示，设计了更精细的句子-词级对齐和知识传递策略，有效解决多个交互和多个文本之间的匹配问题，提高了对交互的理解。实验结果表明该方法在公共基准测试上实现了最先进的性能，并进一步分析了各个组成部分对效果的影响，为其功效提供了洞察。