小红花·文摘

本文研究了稀疏参数高效微调（SPEFT）方法，提出了一种基于梯度的显著性指标，显示出在计算效率和性能上的优势。研究表明，静态掩蔽策略在自然语言处理任务中效果更佳，为SPEFT提供了有效的基线，挑战了高效微调中复杂性必要性的观点。

Salience-Aware Sparse Fine-Tuning Strategies for Language Models

BriefGPT - AI 论文速递 ·

The First Review of Multimodal Continual Learning, Jointly Released by CUHK, Tsinghua, and UIC

机器之心 ·

本文讲述如何利用小型语言模型（SLMs）和LoRA适配器创建函数调用代理。通过分离推理和函数执行，SLMs在资源有限或低延迟环境中实现高效微调和执行，提升性能和速度。使用Salesforce/xlam-function-calling-60k数据集训练的模型，展示了构建高性能、低资源AI应用的方法，并可扩展至更大模型如LLaMA 3.1-8B。

从零开始使用SLMs构建ReAct代理

DEV Community ·

研究表明，微调大型语言模型（LLMs）可能引入新的安全风险，尤其是在用户自定义微调时。现有安全措施无法完全覆盖这些风险。因此，建议在发布模型权重时进行风险评估，并提出后门增强安全对齐方法和高效微调算法，以提高模型的安全性和性能。

Badllama 3：将安全微调从 Llama 3 中移除的方法（仅需几分钟）

BriefGPT - AI 论文速递 ·

本地运行多种大语言模型：一行代码即可完成 | 开源日报 No.167

开源服务指南 ·