小红花·文摘

本研究分析了语言模型在推理任务中的性能差异，强调学习率与批量大小比率的重要性。通过开发SmolTulu模型，优化了这两者的关系，显著提升了模型在指令跟随和数学推理方面的表现。

SmolTulu: Higher Learning Rate and Batch Size Ratio Enhance the Reasoning Ability of SLMs

BriefGPT - AI 论文速递 ·

使用小型语言模型（SLMs）和本地托管的大型语言模型（LLMs）进行编码：技巧与建议

The New Stack ·

边缘计算中小语言模型（SLMs）的高效资源管理

InfoQ ·

本文讲述如何利用小型语言模型（SLMs）和LoRA适配器创建函数调用代理。通过分离推理和函数执行，SLMs在资源有限或低延迟环境中实现高效微调和执行，提升性能和速度。使用Salesforce/xlam-function-calling-60k数据集训练的模型，展示了构建高性能、低资源AI应用的方法，并可扩展至更大模型如LLaMA 3.1-8B。

微软推出了Phi-3.5-mini、Phi-3.5-vision和Phi-3.5-MoE等新产品，这些模型在多语言支持、图像理解和推理能力方面表现出色。Phi-3.5-MoE是一个混合专家模型，具有16个专家和66亿个参数，支持128K的上下文长度。Phi-3.5-mini具有多语言支持和128K的上下文长度。Phi-3.5-vision提高了多帧图像的理解和推理能力。这些模型在性能和安全性方面超越了更大规模的模型，并为各种任务提供了良好的能力。

发现新一代多语言高品质Phi-3.5 SLMs

dotNET跨平台 ·

SmolTulu: Higher Learning Rate and Batch Size Ratio Enhance the Reasoning Ability of SLMs

使用小型语言模型（SLMs）和本地托管的大型语言模型（LLMs）进行编码：技巧与建议

边缘计算中小语言模型（SLMs）的高效资源管理

从零开始使用SLMs构建ReAct代理

发现新一代多语言高品质Phi-3.5 SLMs