VSAS-Bench是一个新框架和基准,用于评估实时视觉流助手模型。与传统离线评估不同,VSAS-Bench关注模型的响应及时性和一致性,提供超过18,000个注释,涵盖多种输入领域和任务类型。该框架引入标准化评估协议,分析视频流模型的准确性与延迟之间的权衡,展示传统模型在流媒体设置中的适应性和优越性。
完成下面两步后,将自动完成登录并继续当前操作。