ENTER:基于事件图的可解释视频问答推理

📝

内容提要

本研究解决了现有可解释视频问答系统在推理过程中忽视低层次视觉信息的问题。通过引入事件图,提出了一种新的推理方法,不仅提高了系统的可解释性,还在多个基准测试中表现优异。最显著的发现是,ENTER在提供高竞争性能的同时,显著提升了推理过程的解释性和可解释性。

➡️

继续阅读