小红花·文摘

本研究提出了一种新方法Panacea，旨在应对有害细调攻击的安全风险。该方法通过自适应扰动来恢复模型的安全性，同时保持细调性能。实验结果表明，平均有害得分降低最高可达21.5%。

万应药: 通过后细调扰动减轻大规模语言模型的有害细调

BriefGPT - AI 论文速递 ·

本研究首次探讨基础模型在人脸识别中的适用性，发现其在特定任务中表现不佳。经过细调的基础模型在数据有限时优于从头训练的模型，并在大规模数据集上表现出可比效果，且计算成本更低。同时，研究关注了人脸识别中的偏差问题。

Foundation Models: Are Foundation Models Suitable for Face Recognition?

BriefGPT - AI 论文速递 ·

本文研究了大型语言模型（LLMs）在细调和检索增强生成（RAG）中的应用，发现RAG在知识密集型任务中表现优于细调。使用检索增强后，模型在长上下文任务中的表现更佳，生成速度也更快。同时，研究指出LLMs在复杂问题回答中面临的挑战，强调提高准确性和可靠性的必要性。

从人工针到真实大量数据集：通过在合成数据上进行微调来改进 LLMs 的检索能力

BriefGPT - AI 论文速递 ·

本文探讨了视觉语言模型（VLMs）作为强化学习代理的奖励来源的可行性，提出了VLM-CaR框架，通过生成密集奖励函数提高训练效率。研究表明，基于VLMs的奖励模型在多种任务中表现优越，有效支持强化学习策略的训练。此外，提出了改进VLM推理性能的两阶段训练框架，强调了VLMs在视觉推理中的潜力和应用前景。

通过强化学习将大型视觉语言模型细调为决策代理

BriefGPT - AI 论文速递 ·

研究表明，大型语言模型（LLMs）在处理不熟悉概念时容易产生幻觉。通过分析模型输出行为，开发了一种新的方法来减轻这一问题。研究发现，训练数据的记忆和频率偏好是导致幻觉的主要因素。提出的知识感知微调方法显著提高了模型在自然语言处理任务中的表现。

Cloudflare宣布在Workers AI上推出了LoRA的开放测试版。LoRA是一种细调方法，可以将细调权重和预训练模型分开，从而减少可训练参数和GPU内存需求，提高效率和成本效益。Workers AI非常适合运行LoRA，可以将多个LoRA适配器插入一个基础模型。Cloudflare构建了一个多租户的LoRA服务系统，优化了GPU资源利用率，并提供低推理延迟。公司计划在未来支持更多模型和任务类型，并致力于提供一键细调服务。

在 Workers AI 上使用 LoRA 运行微调模型

The Cloudflare Blog ·

本文探讨了自然语言推理中的归因方法，评估其合理性和忠实度。提出了多语言 NLI 数据集，回顾了模型解释方法，强调忠实度的重要性，并总结了现有方法的优缺点及未来研究方向。此外，介绍了提高语言模型解释质量的框架 xLLM，以及评估自然语言解释忠实度的挑战和方法。

多语言和单语细调语言模型的解释忠实度比较

BriefGPT - AI 论文速递 ·

本文研究了提高大型语言模型性能的方法，包括细调、RAG和软提示等。测试发现，经过细调的模型和RAG方法在回答事件问题方面表现优于未修改版本的GPT 3.5。应用软提示可以显著提高性能。

微调与检索增强生成：面向不那么流行的知识

BriefGPT - AI 论文速递 ·

我们引入了一个新的基准数据集MULTITuDE，用于多语言机器生成文本检测。该数据集包括11种语言的真实和机器生成的文本，共计74,081个样本。通过比较零样本和微调检测器的性能，评估了这些检测器在未见过的语言和未见过的模型上的泛化性能。

KInIT 参加 SemEval-2024 任务 8：用于多语言机器生成文本检测的细调 LLMs

BriefGPT - AI 论文速递 ·

该文章介绍了一种新的开放域个性化图像生成模型Subject-Diffusion，通过构建大规模数据集和设计新的统一框架，实现了在任何领域中支持个性化生成单一或多个主体的能力。该模型在单一、多个和人类定制的图像生成方面表现优于其他框架。

基于对象驱动的一次性细调文本到图像扩散与原型嵌入

BriefGPT - AI 论文速递 ·

通过核苷酸序列语言模型和PubMed文章的文本语言模型，提出了细调核苷酸序列语言模型和文本语言模型的方法，以及结合两个模型的集成方法。该方法在药物抗性类别预测中表现出更好的性能。

利用大型语言模型预测抗菌性能

BriefGPT - AI 论文速递 ·

本文对多种大语言模型进行了评估，包括Alpaca、Alpaca-LoRA和GPT-3.5，针对在线文本数据中的心理健康预测任务。实验结果显示，LLMs在零样本和少样本提示设计上有限但有希望的性能。指令微调可以显著提升LLMs在所有任务上的表现。最佳微调模型Mental-Alpaca在平衡精度上比GPT-3.5高出16.7％，与最先进的任务特定模型相媲美。提供了行动指南，介绍如何赋予LLMs更好的心理健康领域知识，并成为心理健康预测任务的专家。

针对在线性侵犯聊天和辱骂性文本的细调 Llama 2 大型语言模型

BriefGPT - AI 论文速递 ·

万应药: 通过后细调扰动减轻大规模语言模型的有害细调

Foundation Models: Are Foundation Models Suitable for Face Recognition?

从人工针到真实大量数据集：通过在合成数据上进行微调来改进 LLMs 的检索能力

通过强化学习将大型视觉语言模型细调为决策代理

对新知识进行细调的 LLMs 是否鼓励产生幻觉？

在 Workers AI 上使用 LoRA 运行微调模型

多语言和单语细调语言模型的解释忠实度比较

微调与检索增强生成：面向不那么流行的知识

KInIT 参加 SemEval-2024 任务 8：用于多语言机器生成文本检测的细调 LLMs

基于对象驱动的一次性细调文本到图像扩散与原型嵌入

利用大型语言模型预测抗菌性能

针对在线性侵犯聊天和辱骂性文本的细调 Llama 2 大型语言模型