机器之心 ·

号称击败Claude 3.5 Sonnet，媲美GPT-4o，开源多模态模型Molmo挑战Scaling law

💡 原文中文，约5500字，阅读约需13分钟。

📝

内容提要

Ai2发布了多模态AI模型Molmo，类似贾维斯，能识别图像细节并执行复杂任务，如自动下单。尽管汉语输出有限，但在多项测试中表现优异，超越许多顶尖模型。Molmo体积小，可本地运行且完全开源，成功关键在于高质量数据，使用PixMo数据集训练。通过指向功能实现自然的人机交互，展示了开源模型的潜力。

🎯

🏷️

GPT-5.3上线Codex！OpenAI回应Claude新模型只用了15分钟
OpenAI推出了最新编程模型GPT-5.3-Codex，增强了编程能力和计算机操作，支持实时引导和任务调整。该模型在多个基准测试中表现优异，并参与自我训...
派早报：Mistral 发布 Voxtral Transcribe 2 系列语音转文字模型等
Mistral AI 于 2 月 4 日发布了 Voxtral Transcribe 2 系列模型，包括用于批量处理的 Voxtral Mini Tran...
Cloudflare展示Moltworker，将自托管AI代理带到边缘
Cloudflare推出Moltworker，一个开源平台，允许用户在其上运行个人AI助手Moltbot，消除对本地硬件的依赖。Moltbot集成AI模型...
由 Anthropic 官方管理的高质量 Claude Code 插件 | 开源日报 No.873
Vision-Agents 是一个实时多模态视频 AI 代理平台，支持低延迟视频交互，适用于运动教练和安防监控等场景。playwright-cli 是自动...
实测 GPT-5.3-Codex，OpenAI 史上第一个高危模型，连 API 都还不敢给我们
OpenAI发布的GPT-5.3-Codex是对竞争对手的有力回应，具备强大的编程和文件处理能力，支持视频下载、格式转换和代码修复，用户体验友好。Code...
Claude Opus 4.6和GPT-5.3-Codex同日发布，谁是编程之王？
2月5日，Anthropic和OpenAI发布了新一代模型Claude Opus 4.6和GPT-5.3-Codex。Claude Opus 4.6强调深...