小红花·文摘

本文介绍了RmLR系统框架，通过分析相互作用信息的损失生成全面的视觉表示，提高人物-物体交互检测性能。通过句子-词级对齐和知识传递策略解决多个交互和多个文本匹配问题，进一步提高交互理解。实验结果表明该方法在公共基准测试上表现出最先进的性能，并分析了各个组成部分对效果的影响。