小红花·文摘

原生JS实现无缝滚动功能：你知道如何让网页元素无缝滚动吗？

龙鲲博客 ·

本文提出了一个统一的视频任务评估方法，包括字幕、问答、检索和行动识别。基于 GPT 的评估方法在多个方面与人类表现相似，同时展示了一种优于现有方法的基准方法 Video-LLaVA。通过实际驾驶场景的评估，证明了视频 LLMs 的有效性和令人鼓舞的识别和推理能力。希望为视频 LLMs 提供统一的评估方法，并扩展实际应用场景。

VLM-Eval: 视频大型语言模型的通用评估

BriefGPT - AI 论文速递 ·