小红花·文摘

深度求索团队更新了DeepSeek-V2模型，新版本DeepSeek-V2-Chat在数学解题、逻辑推理、编程等方面性能提升了16%，对战胜率从41.6%提升到了68.3%。团队还优化了模型的指令跟随能力，提升了用户体验。SiliconCloud平台上线了DeepSeek-V2-Chat的推理加速版，速度快且输出准确。SiliconCloud还提供多种开源大语言模型和代码生成模型。

国产大模型新标杆！比肩GPT4，DeepSeek V2重磅升级

OneFlow深度学习框架 ·

本文介绍了VISUAL EMBEDDED INSTRUCTION (VIM)框架，用于评估多模态大语言模型(MLLMs)在视觉指令跟随能力方面的表现。通过将指令嵌入到视觉场景中，VIM对MLLMs提出挑战，需要强大的视觉解释能力。观察到开源的MLLMs与GPT-4V之间存在性能差异，提出了提高MLLMs在指令跟随方面能力的有希望方向。目标是推动该领域的技术进展和发展。

V*: 多模态 LLMs 中的核心机制：引导的视觉搜索

BriefGPT - AI 论文速递 ·