DEV Community ·

DeepSeek的新模型、OpenAI的o3-mini、Mistral的24B参数模型及更多

💡 原文英文，约1500词，阅读约需6分钟。

📝

内容提要

本周AI工程动态介绍了DeepSeek的Janus-Pro多模态AI、OpenAI的o3-mini模型和Mistral Small 3高效模型。Janus-Pro在图像生成和理解任务中表现出色，o3-mini优化了推理速度，Mistral Small 3在资源效率上取得了突破。此外，Gemini 2.0实现了技术缺陷报告的自动生成，伯克利研究显示AI研究成本可降至30美元。

🎯

关键要点

DeepSeek推出Janus-Pro多模态AI，在图像生成和理解任务中表现优异。
Janus-Pro提供1B和7B参数版本，支持1024x1024图像生成，推理时间为2.4秒。
OpenAI发布o3-mini模型，推理速度提升，支持结构化输出。
Mistral Small 3模型在资源效率上取得突破，提供150 tokens/s的吞吐量。
Gemini 2.0实现技术缺陷报告的自动生成，支持多种问题跟踪平台。
伯克利研究显示，DeepSeek R1的核心推理能力可用30美元的成本复现。
AI2发布Tülu 3，规模达到405B参数，采用新型RLVR训练方法。
Moonshot AI推出Kimi k1.5，利用可验证奖励的强化学习实现o1级推理。
ByteDance开源UI-TARS，集成感知、推理和动作能力于一体，提升GUI自动化性能。
ChatBot LLM竞技场提供AI聊天机器人的众包基准测试平台。

🔎

延伸解读

DeepSeek的Janus-Pro模型优势

DeepSeek的Janus-Pro模型在图像生成和理解任务中表现优异，尤其在准确性上超越了DALL-E 3。这表明，随着技术的进步，开源模型在商业应用中可能会成为更具竞争力的选择，尤其是在需要高效图像处理的领域。

OpenAI o3-mini的实用性

OpenAI的新模型o3-mini在推理速度上有显著提升，适合需要快速响应的应用场景，如实时聊天机器人和在线客服系统。其支持结构化输出的功能，可能会为开发者提供更灵活的数据处理方式，提升用户体验。

Mistral Small 3的资源效率

Mistral Small 3在资源效率上取得突破，能够在较低的硬件要求下实现高吞吐量。这对于中小型企业或资源有限的开发团队来说，意味着可以以更低的成本部署高效的AI解决方案，推动AI技术的普及。

❓

延伸问答

DeepSeek的Janus-Pro模型有什么特点？

Janus-Pro是一个多模态AI模型，支持1B和7B参数版本，能够生成1024x1024的图像，推理时间为2.4秒，准确率达到84.2%。

OpenAI的o3-mini模型相比于其他模型有什么优势？

o3-mini模型优化了推理速度，支持结构化输出，并在AIME 2024中达到了87.3%的准确率，显著降低了计算需求。

Mistral Small 3模型的资源效率如何？

Mistral Small 3模型在资源效率上取得突破，提供150 tokens/s的吞吐量，并且可以在单个RTX 4090上运行。

Gemini 2.0如何实现技术缺陷报告的自动生成？

Gemini 2.0通过视频分析能力，自动生成技术缺陷报告，支持多种问题跟踪平台，报告生成速度快且准确。

伯克利的研究如何降低AI研究的成本？

伯克利的研究表明，DeepSeek R1的核心推理能力可以用仅30美元的成本复现，挑战了高成本硬件的需求。

ByteDance的UI-TARS模型有什么创新之处？

UI-TARS集成了感知、推理和动作能力于一体，提升了GUI自动化性能，支持多种平台的自动化测试。

🏷️