小红花·文摘 - 小红花技术领袖俱乐部

OpenClaw通过CLI绕过Claude API限制新玩法曝光

OpenClaw通过CLI绕过Claude API限制新玩法曝光

极道 ·

微软最新的Phi-4推理模型认为，规模并非一切

微软最新的Phi-4推理模型认为，规模并非一切

The New Stack ·

阿里巴巴通义千问团队继续推出小模型 9B参数能力甚至超过120B的开源同行

阿里巴巴通义千问团队继续推出小模型 9B参数能力甚至超过120B的开源同行

蓝点网 ·

一个小型自回归程序合成系统，支持受控实验

一个小型自回归程序合成系统，支持受控实验

Apple Machine Learning Research ·

你无法解雇一个机器人：关于AI生成内容和你工作的直言不讳的真相

你无法解雇一个机器人：关于AI生成内容和你工作的直言不讳的真相

The New Stack ·

演讲：语言人工智能的生态与经济实践

演讲：语言人工智能的生态与经济实践

InfoQ ·

新款Claude Haiku 4.5模型承诺以三分之一的成本提供更快的性能

新款Claude Haiku 4.5模型承诺以三分之一的成本提供更快的性能

InfoQ ·

JavaScript库在浏览器中运行机器学习模型

JavaScript库在浏览器中运行机器学习模型

The New Stack ·

本研究探讨了大规模语言模型（LLM）与小型模型（SM）协作的潜力，以应对LLM对数据和计算资源的高需求。提出了一种新方法，加速LLM在特定领域的适应，并强调基于真实数据集的多目标基准研究的重要性。

Harnessing the Collaborative Power of Large and Small Models to Address Domain Tasks

BriefGPT - AI 论文速递 ·

OpenAI计划下周发布改进版GPT-4.1及多个小型模型，如GPT-o4-mini、GPT-o4-mini-high和GPT-o3，这些模型体积小、响应快，适合简单推理。

OpenAI计划推出GPT-4o多模态模型的改进版本GPT-4.1 包含Mini版和Nano版

蓝点网 ·

本研究提出了一种知识指令方法，通过指令微调来解决大型语言模型在特定领域信息不足的问题，提升模型的事实记忆、减少遗忘并增强理解能力，适用于小型模型的数据生成。

Knowledge Instructions: Effectively Continuing Pre-training from Limited Data Using Instructions

BriefGPT - AI 论文速递 ·

本研究探讨了宪法AI在小型模型（如LLaMA 3-8B）中的应用，发现其能有效提升模型的无害性，但有用性有所下降。同时，小型模型在自我改进方面面临挑战，出现崩溃迹象。

Constitution or Collapse? Exploring Constitutional AI and LLaMA 3-8B

BriefGPT - AI 论文速递 ·

本研究探讨了机器翻译的便利性、潜在副作用和风险，强调小型高质量模型和预训练调优在气候变化中的低碳足迹及其在危机情况下的生命拯救潜力。

Sociotechnical Effects of Machine Translation

BriefGPT - AI 论文速递 ·

为什么红帽认为人工智能的未来是小型语言模型

为什么红帽认为人工智能的未来是小型语言模型

The New Stack ·

DeepSeek推出后，移动端AI风向要变

DeepSeek推出后，移动端AI风向要变

机器之心 ·

DeepSeek 对边缘 AIoT 的影响

DeepSeek 对边缘 AIoT 的影响

实时互动网 ·

本研究提出了一种新方法，通过程序生成的算术数据集提升小型模型的数学推理能力。实验结果表明，中间微调与指令微调的结合显著增强了小模型的算术能力。

Integrating Arithmetic Learning to Enhance Mathematical Reasoning in Small Models

BriefGPT - AI 论文速递 ·

开源人工智能已经开始投入生产

开源人工智能已经开始投入生产

The GitHub Blog ·

本研究通过将大型语言模型的情感理解提炼至小型模型，解决了细粒度情感分析的高成本问题，实验结果显示提炼后的模型F1得分提升了6.00%。

从大型语言模型提炼细粒度情感理解

BriefGPT - AI 论文速递 ·

Google DeepMind 推出“SALT”：一种使用 SLM 高效训练高性能大型语言模型的机器学习方法

Google DeepMind 推出“SALT”：一种使用 SLM 高效训练高性能大型语言模型的机器学习方法

实时互动网 ·