小红花·文摘

最新SuperCLUE报告显示，豆包1.5和商汤日日新V6并列国内大模型第一，超越Gemini 2.5，表明国产模型在中文领域能力显著提升。

量子位 ·

硕鼠的博客站 ·

DeepSeek是中国推出的开源推理大模型，具备强大的中文处理能力和金融优势。其V3和R1模型参数达到6000亿，适合深度思考场景。因低成本和开源特性，DeepSeek迅速流行，背后有强大资金支持和高水平团队。

后端技术杂谈 ·

爱范儿 ·

智源研究院发布了100余个大模型的综合评测结果，涵盖文本、语音、图像和视频等多模态。评测显示，国内模型在中文能力和复杂场景任务上与国际水平仍有差距。新评测增加了金融量化交易等应用能力的评估，发现大模型在生成策略代码方面已有进展。整体来看，模型能力显著提升，但仍需改进。

量子位 ·

本文介绍了以羊驼为名的大型语言模型LLaMA和Alpaca的发布，这些模型在中文能力上有显著提高。周边配套工具已自成生态。呼吁AI人人可用，希望在不久的将来实现。

少数派 ·