上周AI动态 #297 - QwQ-32B-Preview、DeepSeek-R1-Lite-Preview、OLMo 2、Luma Photon

上周AI动态 #297 - QwQ-32B-Preview、DeepSeek-R1-Lite-Preview、OLMo 2、Luma Photon

💡 原文英文,约2000词,阅读约需8分钟。
📝

内容提要

阿里巴巴的Qwen团队推出了新AI模型QwQ-32B-Preview,参数达到325亿,推理能力与OpenAI的o1模型相当,但存在语言切换和常识推理不足的问题。DeepSeek的DeepSeek-R1-Lite-Preview模型具备实时推理能力。Ai2发布的OLMo 2系列模型符合开源标准,包含7亿和13亿参数的版本。Nvidia等公司也在持续推出新AI技术,推动行业发展。

🎯

关键要点

  • 阿里巴巴的Qwen团队推出了新AI模型QwQ-32B-Preview,参数达到325亿,推理能力与OpenAI的o1模型相当。
  • QwQ-32B-Preview模型在某些基准测试中表现优于OpenAI的o1-preview和o1-mini模型,但存在语言切换和常识推理不足的问题。
  • DeepSeek推出了DeepSeek-R1-Lite-Preview模型,具备实时推理能力,能够提供完整的推理输出。
  • Ai2发布的OLMo 2系列模型符合开源标准,包含7亿和13亿参数的版本,能够执行多种文本任务。
  • Luma Labs对Dream Machine平台进行了重大升级,推出了新图像模型Photon,提升了视频生成速度和自然语言理解能力。
  • OpenAI对GPT-4o模型进行了升级,使其在LLM排行榜上超越Google的Gemini。
  • NVIDIA推出了Hymba 1.5B模型,结合了变换器注意力和状态空间模型,性能优于其他小型模型。
  • Anthropic推出了模型上下文协议(MCP),允许AI系统直接连接到各种数据源,提升性能。
  • 微软将推出Teams的语音克隆工具,允许用户实时进行多语言翻译。
  • Nvidia的Fugatto AI音乐编辑器能够生成前所未有的声音,改变音频输入为独特的作品。
  • OpenAI因使用加拿大媒体的新闻进行训练而被起诉,面临法律挑战。
➡️

继续阅读