小红花·文摘

本文探讨了如何将开源语言模型转化为可用的API服务，涵盖模型推理、请求调度和显存管理等技术细节。强调了LLM推理过程，包括输入文本和生成下一个token的预测，介绍了模型生命周期、文件结构、量化技术及其对显存的影响，并讨论了服务框架选择和并发处理的重要性。

大语言模型推理服务知识梳理

Fernweh ·

EP219：12个开源大型语言模型

ByteByteGo Newsletter ·

如何在本地和云端运行开源大型语言模型

freeCodeCamp.org ·

五大开源AI模型API提供商

KDnuggets ·

介绍 gpt-oss

OpenAI ·

开源大型语言模型（LLMs）逐渐成熟，提供了比专有模型更具成本效益的选择。本文介绍了七种顶级LLMs，如DeepSeek R1、Qwen2.5-72B和Llama 3.3，强调它们在推理、编码和多语言任务中的优越性能。这些模型适用于多种应用，推动了AI技术的普及，使开发者能够构建复杂应用而无需依赖专有解决方案。

2025年七大开源大型语言模型

KDnuggets ·

本研究评估了12款开源语言模型在不同语言中的真实性，发现英语表现最佳，而其他语言（如巴斯克语）的真实性差异小于预期。研究提出利用机器翻译扩展真实性基准，并强调信息性的重要性。

真理无国界：评估跨英语的真实性

BriefGPT - AI 论文速递 ·

如何在AWS上使用基础设施即代码运行DeepSeek R1

The New Stack ·

新开源人工智能模型OLMo 2在使用更少计算能力的情况下匹配领先语言模型

DEV Community ·

本研究针对开源大型语言模型在数学推理方面的不足，提出了课程学习和分解策略。实验结果显示，WizardMath 7B在英语数据集上超越Gemini，在印地语上表现相当，表明双语方法有效提升数学推理能力。

多语言数学推理：推动开源LLM在印地语和英语中的发展

BriefGPT - AI 论文速递 ·

本研究提出ExecRepoBench框架和Repo-Instruct指令语料库，旨在解决现有代码补全评估基准的不足，从而提升开源大型语言模型在复杂编码场景中的表现。

ExecRepoBench: A Multi-Level Evaluation Framework for Executable Code Completion

BriefGPT - AI 论文速递 ·

Ai2推出OLMo 2，完全开源的基础模型

InfoQ ·

本研究探讨了开源大型语言模型在使用公共数据时的毒性输出问题，提出了新的数据策划流程，开发了ToxicCommons数据集，并构建了Celadon分类器，以更有效地检测有害内容。研究表明，平衡的内容过滤方法能显著提升模型的安全性。

Toxicity of the Commons: Curating Open-Source Pre-Training Data

BriefGPT - AI 论文速递 ·

该研究探讨了开源大型语言模型的指令调整和性能评估，分析了训练数据的数量、质量和语言分布对模型性能的影响。提出了ZhuJiu基准，评估多种语言模型的能力，并介绍了Baichuan 2模型在多个领域的优异表现。同时，研究关注数据管理和中文任务的评估，提出了ChatFlow模型以提升中文语言模型的性能。

BaichuanSEED：通过引入竞争性大语言模型基线共享广泛数据收集和去重的潜力

BriefGPT - AI 论文速递 ·

使用 Kubernetes AI 工具链运算符加速 AI 工作流程

The New Stack ·

最强模型Llama 3.1 405B正式发布，扎克伯格：开源引领新时代

机器之心 ·

本文介绍了多个开源语言模型的进展，包括ChuXin、Baichuan 2、CT-LLM、XGen、TinyLlama、LLaMA、XLM-T和Xmodel-VLM等。这些模型在参数规模、上下文长度和多语言能力上取得了显著提升，尤其在医学和法律领域表现突出。研究还强调了高效的训练方法和数据处理技术，以提升模型性能和生成能力。

Xmodel-LM 技术报告

BriefGPT - AI 论文速递 ·

MAmmoTH是一系列开源大型语言模型，专注于数学问题解决。研究构建了包含180万个问题的OpenMathInstruct-1数据集，并在数学推理基准上取得优异成绩。研究表明，数据量和模型参数对性能影响显著，人工指导数据优于合成数据。提出的双向指令调优策略提升了模型的数学推理能力，并探索了高质量指令数据生成的新方法。

MAmmoTH2：网络中的指令扩展

BriefGPT - AI 论文速递 ·

管理概览：开源基础模型的崛起

Databricks ·

模型多样性能好，语言应用没烦恼 | 开源专题 No.71

开源服务指南 ·