小红花·文摘 - 小红花技术领袖俱乐部

本文介绍了VideoLLM框架，利用自然语言处理预训练LLMs的序列推理能力进行视频序列理解。作者通过实验评估了VideoLLM在多个任务上的表现，证明了LLMs的理解和推理能力可以有效地转移到视频理解任务中。

通过分层事件记忆增强长视频理解

BriefGPT - AI 论文速递 ·

本文介绍了一种名为VideoLLM的新框架，利用自然语言处理预训练LLMs的序列推理能力进行视频序列理解。实验结果证明LLMs的理解和推理能力可以有效应用于视频理解任务。

KeyVideoLLM：面向大规模视频关键帧选择

BriefGPT - AI 论文速递 ·

本文介绍了一种名为VideoLLM的新框架，利用自然语言处理预训练LLMs的序列推理能力进行视频序列理解。通过模态编码器和语义转换器，将不同来源的输入转换为统一的标记序列，然后输入LLM进行解码。实验结果证明LLMs的理解和推理能力可以有效应用于视频理解任务。

视频 LLM-online：用于流媒体视频的在线视频大语言模型

BriefGPT - AI 论文速递 ·

本文介绍了VideoLLM框架，利用LLMs的序列推理能力进行视频序列理解。通过编码器和转换器将输入转换为标记序列，然后输入LLM进行解码。实验证明LLMs在视频理解任务中具有有效的理解和推理能力。

大规模语言模型在视频摘要预训练中的扩展

BriefGPT - AI 论文速递 ·

本文介绍了VideoLLM框架，利用自然语言处理预训练LLMs进行视频序列理解。通过编码器和转换器将输入转换为标记序列，然后输入LLM进行解码。实验证明LLMs在视频理解任务中具有有效的理解和推理能力。

DoraemonGPT: 面向理解动态场景的大型语言模型

BriefGPT - AI 论文速递 ·