实时互动网 ·

Ai2 推出 Molmo 2 开源视频语言模型

💡 原文中文，约1300字，阅读约需4分钟。

📝

内容提要

Ai2发布了开源视频语言模型Molmo 2，支持多图像和视频输入，允许用户进行端到端研究，强调开源的重要性，适合企业使用，关注数据透明性和责任。

🎯

关键要点

Ai2发布了开源视频语言模型Molmo 2，支持多图像和视频输入。
Molmo 2包括基于阿里巴巴Qwen3和Ai2 Olmo语言模型的多个版本。
发布了九个新的数据集，包括长格式质量保证数据集和开放的视频指向和跟踪数据集。
Molmo 2-O-7B是一个透明模型，用户可以进行端到端的研究和自定义。
模型能够理解多张图像，支持所有图像和任何长度的视频。
用户可以向模型询问图像或视频的问题，模型能进行推理和生成描述性字幕。
Molmo 2已在Hugging Face和Ai2 Playground上线，提供测试工具和模型的平台。
Ai2对开源的承诺强调了数据透明性和责任的重要性。
企业逐渐意识到模型的大小并不重要，关键在于训练模型所用的数据的透明性。
Molmo 2模型提供了更大的微调灵活性，但也面临资金和采用的挑战。

❓

延伸问答

Molmo 2模型的主要功能是什么？

Molmo 2模型能够理解多张图像，支持所有图像和任何长度的视频，并能生成描述性字幕。

Ai2发布Molmo 2的背景是什么？

Ai2发布Molmo 2是为了展示其对开源的承诺，并为企业提供更好的模型使用控制。

Molmo 2有哪些版本？

Molmo 2包括基于阿里巴巴Qwen3的Molmo 2-4B和Molmo 2-8B，以及完全开源的Molmo 2-O-7B。

Molmo 2的开源特性有什么重要性？

开源特性强调数据透明性和责任，允许用户进行端到端的研究和自定义。

Molmo 2面临哪些挑战？

Molmo 2面临的挑战包括资金问题和模型采用的困难。

Molmo 2在哪些平台上可以使用？

Molmo 2已在Hugging Face和Ai2 Playground平台上线，用户可以在这些平台上测试模型。

🏷️

继续阅读

开源维护者的困境
开源维护者面临困境，贡献者与维护者之间的社会契约逐渐崩溃。AI的介入虽然提供帮助，但也引发责任和审核标准的疑问。维护者的工作量激增，未处理的拉取请求不断增...
人工智能论文评审：通过人类反馈训练语言模型以遵循指令（InstructGPT）
GPT-3在自然语言处理上取得了重大突破，但未能有效转化为助手。为此，OpenAI推出了InstructGPT，通过人类反馈训练模型更好地遵循指令，强调模...
YouTube获得行业首个短视频MRC认证
YouTube连续第六年获得媒体评级委员会（MRC）的品牌安全认证，并首次将认证扩展至YouTube Shorts，成为首个获得短视频品牌安全认证的平台。...
从任意视角探索场景：3D体积视频技术突破意味着3D流媒体可能很快成为现实
布朗大学研究人员推出了名为PackUV的3D体积视频处理方法，旨在实现可存储、流式传输的逼真3D视频。该技术通过多台摄像机拍摄场景，并利用算法重建三维空间...
App+1 | 零基础 3 分钟在线搞定产品演示视频：Mockup Studio
Mockup Studio 是一个在线工具，用户可以快速制作产品展示视频，只需拖入录屏并调整样式即可导出成品。该工具简化了视频制作流程，适合开发者和产品经...
Lumine Group 达成协议，将从 Synamedia 收购其视频网络业务
Lumine Group宣布收购Synamedia的视频网络业务，这是其第16笔企业剥离交易，旨在增强其在媒体供应链中的布局，专注于视频处理和直播流媒体。...