小红花·文摘

机器之心 ·

塔西尔2是一个先进的大规模视觉语言模型，旨在生成准确的视频描述并具备卓越的视频理解能力。通过扩大预训练数据、精细时序对齐和优化偏好数据，塔西尔2在多个基准测试中超越了领先模型，展示了其在视频分析领域的重要性。

BriefGPT - AI 论文速递 ·