小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

前面四篇文章中,我们探讨了SGD从有界域到无界域、从平均损失到终点损失的一系列收敛结论。或许有读者觉得,说来说去都还是SGD,这恐怕是“上古时代”的结果了吧?还真不是!像第四篇《让炼丹更科学一些...

让炼丹更科学一些(五):基于梯度精调学习率

科学空间|Scientific Spaces
科学空间|Scientific Spaces · 2026-01-09T02:56:00Z

本研究针对在大规模语言模型精调过程中出现的隐私挑战,分析了多种隐私攻击的脆弱性,包括成员推断、数据提取和后门攻击。文章还评估了差分隐私、联邦学习和知识遗忘等隐私保护机制的效果和局限性,并提出未来的研究方向,以推动隐私保护方法在大规模语言模型精调中的发展,促进其在多种应用中的负责任使用。

大规模语言模型精调中的隐私:攻击、防御与未来方向

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-21T00:00:00Z

本文介绍了多种基于扩散模型的创新方法,如DiffFit、DiffiT、TerDiT、WcDT和FiT,旨在提升模型在新领域的适应性和生成能力。DiffFit通过微调特定层实现快速适应,FiT解决了图像分辨率问题,WcDT优化了自动驾驶轨迹生成。这些方法在多个任务中表现出色,展示了扩散模型的广泛应用潜力。

DriveDiTFit:面向自动驾驶的精调扩散 Transformer

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-22T00:00:00Z

本文探讨了通过精调和检索增强生成(RAG)技术提升大型语言模型(LLMs)在问答任务中的表现。研究表明,RAG在知识密集型任务中优于精调,而微调则能增强模型的泛化能力。通过对农业数据集的分析,提出了一种有效的微调和RAG流程,展示了在特定行业知识整合方面的优势。

大型语言模型的性能误区揭秘:微调与失败?

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-17T00:00:00Z

本文探讨了利用多维质量指标(MQM)和大型语言模型(LLMs)进行机器翻译的后编辑,以提升翻译质量。研究表明,通过微调模型和使用外部反馈,可以显著改善翻译效果,减少人工修改时间,提高效率。实验结果显示,个性化的自动后编辑框架在多个评估指标上优于传统模型。

使用 HED-IT 进行精调:人工后期编辑对对话式语言模型的影响

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-11T00:00:00Z

本文探讨了通过精调和检索增强生成(RAG)技术提升大型语言模型(LLM)在问答系统中的表现。研究表明,RAG在知识密集型任务中优于精调,结合微调的嵌入模型可提高准确性。使用长上下文和RAG策略能改善模型在复杂对话中的表现,但仍未达到人类水平。

适用于对话的不同技术方法评估:微调还是 RAG?

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-10T00:00:00Z

研究发现,对大型语言模型进行微调可能会危及其安全性,即使使用良性数据集进行微调也可能降低安全性。当前的安全基础设施无法解决这些风险,需要进一步研究以加强对齐的语言模型的安全协议。

精调后保持 LLMs 一致性:提示模板的关键作用

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-28T00:00:00Z

本研究分析了不同QA数据集上的微调策略性能,发现传统的基于预训练语言模型和微调策略在低预算下次优。最佳策略是使用预训练语言模型与目标数据集和SQuAD数据集微调,性能优于标准策略2.28%至6.48%。对QA从业者在低预算下微调QA系统具有实用价值。

低标注预算约束下领域特定问答精调策略

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-17T00:00:00Z

字节跳动安全研究团队与南京大学合作发布了一项研究论文,提出了一种基于分割学习的联邦精调框架,用于解决大语言模型精调服务中的模型和数据隐私问题。该框架能够在保护隐私的同时提升模型的可用性。

字节跳动安全研究团队公布大模型联邦精调最新研究进展

FreeBuf网络安全行业门户
FreeBuf网络安全行业门户 · 2024-01-02T08:45:28Z

工业机器人编程通常需要专家,我们提出了一种基于自然语言的助手,用于高级工业机器人应用的编程。我们研究了在有限的数据和计算资源下领域特定微调基础模型的策略。

面向交互式机器人编程的领域特定大型语言模型精调

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-12-21T00:00:00Z

提出了一种新型参数高效调参方法(PEFT)框架,用于多模态、多任务迁移学习。通过LoRA、BitFit和IA3等技术,在几乎不需要可训练参数和GPU内存的情况下,展示了与预训练模型完全微调相当的性能。提出了Context-PEFT,根据令牌的领域学习不同的适配器参数组,实现类似LoRA的权重注入,无需额外的架构修改。在COCO字幕任务上评估,优于完全微调,并提供更高的参数效率和计算经济性的解决方案。

精调预训练大型语言模型中的稀疏是足够的

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-12-19T00:00:00Z

本文评估了大型语言模型(LLM)在生物医学任务中的性能,发现在具有较小训练集的生物医学数据集中,LLMs的效果超过了当前最先进的生物医学模型。然而,不同LLMs的性能可能因任务而异。尽管与精细调整的生物医学模型相比,LLMs的性能仍然较差,但它们在缺乏大规模注释数据的生物医学任务中具有潜在的价值。

Taiyi: 一个用于多样化生物医学任务的双语精调大型语言模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-20T00:00:00Z

该研究使用诱导句子扰动的检测方法,分析了四个多语言transformers的形态句法内容,并研究了精调POS标记对模型知识的影响。研究结果表明,精调可以改善和降低探测性能,并改变形态句法知识在模型中的分布。

自动音韵重构和同源语反射预测的认知变换器

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-11T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码