IQViC:适应性问题的上下文视觉压缩器用于长期视频理解的LMMs

📝

内容提要

本研究针对现有长期视频理解方法在处理复杂视频数据时性能不足的问题,提出了一种新的框架IQViC,利用上下文和问题适应的视觉压缩技术。该方法通过选择性提取相关信息,显著降低了内存要求,并在长期视频问答方面表现出卓越的准确性和效率。

➡️

继续阅读