小红花·文摘

前面四篇文章中，我们探讨了SGD从有界域到无界域、从平均损失到终点损失的一系列收敛结论。或许有读者觉得，说来说去都还是SGD，这恐怕是“上古时代”的结果了吧？还真不是！像第四篇《让炼丹更科学一些...

让炼丹更科学一些（五）：基于梯度精调学习率

科学空间|Scientific Spaces ·

本研究针对在大规模语言模型精调过程中出现的隐私挑战，分析了多种隐私攻击的脆弱性，包括成员推断、数据提取和后门攻击。文章还评估了差分隐私、联邦学习和知识遗忘等隐私保护机制的效果和局限性，并提出未来的研究方向，以推动隐私保护方法在大规模语言模型精调中的发展，促进其在多种应用中的负责任使用。

大规模语言模型精调中的隐私：攻击、防御与未来方向

BriefGPT - AI 论文速递 ·

本文介绍了多种基于扩散模型的创新方法，如DiffFit、DiffiT、TerDiT、WcDT和FiT，旨在提升模型在新领域的适应性和生成能力。DiffFit通过微调特定层实现快速适应，FiT解决了图像分辨率问题，WcDT优化了自动驾驶轨迹生成。这些方法在多个任务中表现出色，展示了扩散模型的广泛应用潜力。

DriveDiTFit：面向自动驾驶的精调扩散 Transformer

BriefGPT - AI 论文速递 ·

本文探讨了通过精调和检索增强生成（RAG）技术提升大型语言模型（LLMs）在问答任务中的表现。研究表明，RAG在知识密集型任务中优于精调，而微调则能增强模型的泛化能力。通过对农业数据集的分析，提出了一种有效的微调和RAG流程，展示了在特定行业知识整合方面的优势。

大型语言模型的性能误区揭秘：微调与失败？

BriefGPT - AI 论文速递 ·

本文探讨了利用多维质量指标（MQM）和大型语言模型（LLMs）进行机器翻译的后编辑，以提升翻译质量。研究表明，通过微调模型和使用外部反馈，可以显著改善翻译效果，减少人工修改时间，提高效率。实验结果显示，个性化的自动后编辑框架在多个评估指标上优于传统模型。

使用 HED-IT 进行精调：人工后期编辑对对话式语言模型的影响

BriefGPT - AI 论文速递 ·

本文探讨了通过精调和检索增强生成（RAG）技术提升大型语言模型（LLM）在问答系统中的表现。研究表明，RAG在知识密集型任务中优于精调，结合微调的嵌入模型可提高准确性。使用长上下文和RAG策略能改善模型在复杂对话中的表现，但仍未达到人类水平。

适用于对话的不同技术方法评估：微调还是 RAG？

BriefGPT - AI 论文速递 ·

研究发现，对大型语言模型进行微调可能会危及其安全性，即使使用良性数据集进行微调也可能降低安全性。当前的安全基础设施无法解决这些风险，需要进一步研究以加强对齐的语言模型的安全协议。

精调后保持 LLMs 一致性：提示模板的关键作用

BriefGPT - AI 论文速递 ·

本研究分析了不同QA数据集上的微调策略性能，发现传统的基于预训练语言模型和微调策略在低预算下次优。最佳策略是使用预训练语言模型与目标数据集和SQuAD数据集微调，性能优于标准策略2.28%至6.48%。对QA从业者在低预算下微调QA系统具有实用价值。

低标注预算约束下领域特定问答精调策略

BriefGPT - AI 论文速递 ·

字节跳动安全研究团队与南京大学合作发布了一项研究论文，提出了一种基于分割学习的联邦精调框架，用于解决大语言模型精调服务中的模型和数据隐私问题。该框架能够在保护隐私的同时提升模型的可用性。

字节跳动安全研究团队公布大模型联邦精调最新研究进展

FreeBuf网络安全行业门户 ·

工业机器人编程通常需要专家，我们提出了一种基于自然语言的助手，用于高级工业机器人应用的编程。我们研究了在有限的数据和计算资源下领域特定微调基础模型的策略。

提出了一种新型参数高效调参方法（PEFT）框架，用于多模态、多任务迁移学习。通过LoRA、BitFit和IA3等技术，在几乎不需要可训练参数和GPU内存的情况下，展示了与预训练模型完全微调相当的性能。提出了Context-PEFT，根据令牌的领域学习不同的适配器参数组，实现类似LoRA的权重注入，无需额外的架构修改。在COCO字幕任务上评估，优于完全微调，并提供更高的参数效率和计算经济性的解决方案。