💡
原文英文,约1500词,阅读约需6分钟。
📝
内容提要
本周AI工程动态介绍了DeepSeek的Janus-Pro多模态AI、OpenAI的o3-mini模型和Mistral Small 3高效模型。Janus-Pro在图像生成和理解任务中表现出色,o3-mini优化了推理速度,Mistral Small 3在资源效率上取得了突破。此外,Gemini 2.0实现了技术缺陷报告的自动生成,伯克利研究显示AI研究成本可降至30美元。
🎯
关键要点
- DeepSeek推出Janus-Pro多模态AI,在图像生成和理解任务中表现优异。
- Janus-Pro提供1B和7B参数版本,支持1024x1024图像生成,推理时间为2.4秒。
- OpenAI发布o3-mini模型,推理速度提升,支持结构化输出。
- Mistral Small 3模型在资源效率上取得突破,提供150 tokens/s的吞吐量。
- Gemini 2.0实现技术缺陷报告的自动生成,支持多种问题跟踪平台。
- 伯克利研究显示,DeepSeek R1的核心推理能力可用30美元的成本复现。
- AI2发布Tülu 3,规模达到405B参数,采用新型RLVR训练方法。
- Moonshot AI推出Kimi k1.5,利用可验证奖励的强化学习实现o1级推理。
- ByteDance开源UI-TARS,集成感知、推理和动作能力于一体,提升GUI自动化性能。
- ChatBot LLM竞技场提供AI聊天机器人的众包基准测试平台。
➡️