小红花·文摘

本研究提出了一种时间标记器，解决了视频语言模型在时间定位上的不足。通过引入时间分隔符和AnyLength机制，适应不同长度的视频，评估结果显示其在视频理解中的优异表现。