小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本文研究了稀疏参数高效微调(SPEFT)方法,提出了一种基于梯度的显著性指标,显示出在计算效率和性能上的优势。研究表明,静态掩蔽策略在自然语言处理任务中效果更佳,为SPEFT提供了有效的基线,挑战了高效微调中复杂性必要性的观点。

Salience-Aware Sparse Fine-Tuning Strategies for Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-18T00:00:00Z
The First Review of Multimodal Continual Learning, Jointly Released by CUHK, Tsinghua, and UIC

AIxiv专栏报道了多模态连续学习(MMCL)的进展及其面临的挑战,如灾难性遗忘、模态失衡和高计算成本。研究者提出了基于正则化、架构、重放和提示的方法来应对这些问题,未来可探索更多模态交互和高效微调的方向。

The First Review of Multimodal Continual Learning, Jointly Released by CUHK, Tsinghua, and UIC

机器之心
机器之心 · 2024-11-13T06:19:15Z

本文讲述如何利用小型语言模型(SLMs)和LoRA适配器创建函数调用代理。通过分离推理和函数执行,SLMs在资源有限或低延迟环境中实现高效微调和执行,提升性能和速度。使用Salesforce/xlam-function-calling-60k数据集训练的模型,展示了构建高性能、低资源AI应用的方法,并可扩展至更大模型如LLaMA 3.1-8B。

从零开始使用SLMs构建ReAct代理

DEV Community
DEV Community · 2024-09-29T10:00:52Z

研究表明,微调大型语言模型(LLMs)可能引入新的安全风险,尤其是在用户自定义微调时。现有安全措施无法完全覆盖这些风险。因此,建议在发布模型权重时进行风险评估,并提出后门增强安全对齐方法和高效微调算法,以提高模型的安全性和性能。

Badllama 3:将安全微调从 Llama 3 中移除的方法(仅需几分钟)

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-01T00:00:00Z
本地运行多种大语言模型:一行代码即可完成 | 开源日报 No.167

开源日报介绍了多个本地运行大语言模型的项目,包括ollama框架、ML-YouTube-Courses、ChatGLM Efficient Tuning和wenda平台。ollama框架支持简单API和多种模型导入;ML-YouTube-Courses收集最新机器学习课程;ChatGLM Efficient Tuning提供高效微调工具,支持多种微调方法和数据集;wenda平台专注于高效内容生成,关注资源和隐私问题。

本地运行多种大语言模型:一行代码即可完成 | 开源日报 No.167

开源服务指南
开源服务指南 · 2024-01-27T23:35:06Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码