小红花·文摘 - 小红花技术领袖俱乐部

谷歌推出Gemini 2.5 Flash版本，性价比高，思考深度可调，竞技场排名第二。支持编程和复杂提示，适合预算有限的用户。尽管在某些测试中略逊于o4-mini，但价格优势明显，获得认可。

谷歌大模型“性价比之王”来了！混合推理模型，思考深度可自由控制，竞技场排名仅次于自家Pro

量子位 ·

本研究探讨了多模态大语言模型在科学图像生成中的表现，使用ScImage基准评估不同模型的空间、数字和属性理解能力。结果表明，尽管GPT-4o在简单提示下表现良好，但在复杂提示中，所有模型均面临显著挑战。

ScImage: How Well Do Multimodal Large Language Models Perform in Scientific Text-to-Image Generation?

BriefGPT - AI 论文速递 ·

Stability AI推出了开源模型Stable Diffusion 3 Medium，拥有20亿参数，显著提升了图像质量和复杂提示的理解能力。同时，HyperAI提供了ComfyUI的在线教程，帮助用户快速生成高质量图像。

在线教程 | Stable Diffusion 3 Medium 现已开源，一键开启你的创作之旅！

HyperAI超神经 ·