小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
Ai2 推出 Molmo 2 开源视频语言模型

Ai2发布了开源视频语言模型Molmo 2,支持多图像和视频输入,允许用户进行端到端研究,强调开源的重要性,适合企业使用,关注数据透明性和责任。

Ai2 推出 Molmo 2 开源视频语言模型

实时互动网
实时互动网 · 2025-12-17T03:38:15Z

本研究提出了一种新型视频分析系统AVA,基于视频语言模型(VLM),旨在提升开放性分析场景的适应性。AVA通过实时构建事件知识图谱和代理检索生成机制,显著改善复杂查询的表现,并在多个基准测试中超越现有系统,展示了处理超长视频内容的潜力。

Empowering Video Language Models for Agentic Video Analytics Systems

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-01T00:00:00Z

本研究针对视频语言模型ResNetVLLM中的多模态幻觉问题,提出了改进的Lynx模型和动态知识库策略。实验结果表明,ResNetVLLM-2的准确率从54.8%提升至65.3%,显著增强了模型的可靠性。

ResNetVLLM-2: Addressing the Multi-Modal Hallucination Problem in ResNetVLLM

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-20T00:00:00Z

本研究提出了一种名为差异蒸馏的方法,旨在降低视频语言模型处理长视频的计算成本。通过差异关键帧选择和特征合并机制,开发了ViLaMP模型,能够在单个NVIDIA A100 GPU上高效处理最多10K帧的视频,并在多个视频理解基准测试中表现优异。

Scaling Video-Language Models to 10K Frames via Hierarchical Differential Distillation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-03T00:00:00Z

本研究提出了一种新的即插即用KV缓存量化方法VidKV,旨在解决视频大型语言模型在处理长视频时的内存瓶颈问题。该方法将KV缓存压缩至低于2位,并通过通道级别量化实现精度与性能的平衡。

Plug-and-Play 1.x-Bit KV Cache Quantization for Video Large Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-20T00:00:00Z

本研究提出了一种时间标记器,解决了视频语言模型在时间定位上的不足。通过引入时间分隔符和AnyLength机制,适应不同长度的视频,评估结果显示其在视频理解中的优异表现。

时间标记器:一种具有优越时间定位能力的多用途视频大语言模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-27T00:00:00Z

本研究提出了VCBench基准,旨在评估大型视频语言模型在抽象概念下的认知能力。结果显示,先进模型在简单视频认知任务中的表现显著下降,凸显了VCBench的重要性。

VCBench:用于视频认知中的符号和抽象挑战的可控基准

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-14T00:00:00Z

我们开发了PlausiVL,一个视频语言模型,通过反事实学习和行动重复损失来研究行动序列的可行性。模型利用时态逻辑和动词-名词约束生成不可信的行动序列,以区分可行与不可行的序列。在Ego4D和EPIC-Kitchens-100数据集上的评估显示,该方法在行动预测任务中有显著提升。

ActionCOMET:一种零样本方法,学习图像特定的动作常识概念

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-17T00:00:00Z

VELOCITI是用于测试视频语言模型的新基准,结果显示当前最先进的模型在感知测试上表现良好,但在绑定测试上准确性接近随机,表明它们在绑定测试中失败。

VELOCITI:视频语言模型能否通过时间连接语义概念?

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-16T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码