小红花·文摘

本研究提出了一种知识指令方法，通过指令微调来解决大型语言模型在特定领域信息不足的问题，提升模型的事实记忆、减少遗忘并增强理解能力，适用于小型模型的数据生成。

Knowledge Instructions: Effectively Continuing Pre-training from Limited Data Using Instructions

BriefGPT - AI 论文速递 ·

本文探讨了在指令微调阶段选择预训练大型语言模型（LLMs）数据的方法，提出了一种新的多模态评分机制，以提升数据质量和多样性。研究表明，该方法在多个实验中比随机采样和现有方法更有效，显著提高了模型性能。

Essence: Harvesting Rich, Scalable, and Transferable Multi-Modal Data for Instruction Fine-Tuning

BriefGPT - AI 论文速递 ·

本研究提出了UNIT微调范式，解决了大语言模型在指令微调中的有效性与真实性的平衡问题，显著减少了幻觉现象，提高了模型的可靠性。

Instruction Fine-tuning Addressing the Trade-off Between Helpfulness and Truthfulness Through Uncertainty Awareness

BriefGPT - AI 论文速递 ·

三种简单的语言模型微调方法

MachineLearningMastery.com ·

本研究提出BIDS算法，解决大型语言模型在指令微调中训练数据选择不平衡的问题。该算法通过规范化影响分数，迭代选择最具影响力的训练实例，从而提升不同任务间的性能平衡。实验结果表明，BIDS在多个基准测试中优于现有方法，增强了多样化能力的学习。

Improving Influence-based Instruction Tuning Data Selection for Balanced Learning of Diverse Capabilities

BriefGPT - AI 论文速递 ·

本研究探讨了大型语言模型（LLMs）在指令微调后上下文理解能力的下降，首次识别出聊天模板输入导致的性能降低，并提出了后期注意力引导和条件指令微调两种有效的缓解方法。

关于通用指令微调中上下文意识的丧失

BriefGPT - AI 论文速递 ·

Meta AI推出思维偏好优化，助力AI模型在回应前进行思考

InfoQ ·

本研究提出了一种新方法，通过指令微调和高级提示策略，提升对话状态跟踪性能，采用变分图自编码器建模用户意图，且无需预定义本体，在开放领域对话中表现优异。

Goal-Oriented Dialogue State Tracking Beyond Ontology

BriefGPT - AI 论文速递 ·

本文介绍了QA4RE框架，通过指令微调提升大型语言模型（LLM）在零样本任务中的性能。研究发现，长上下文LLM在处理长文本时表现优异，人工指导数据优于合成数据。LongAlign框架和Step-Skipping Alignment技术有效增强了LLM的长上下文能力，优化指令数据集可显著提高多模态LLM的效率和效果。

通过同源模型引导和上下文感知测量选择具有影响力的样本以实现长期上下文对齐

BriefGPT - AI 论文速递 ·

本研究探讨了大型语言模型在指令微调后上下文依赖性降低的现象。通过“上下文参数反演”，揭示了模型在微调初期依赖性上升但随后下降的趋势，并提出了一些缓解策略。

Context-Parametric Inversion: Why Instruction Fine-tuning May Not Actually Improve Context Dependence

BriefGPT - AI 论文速递 ·

本研究提出了一种模块鲁棒性分析方法，通过模块分层学习率策略，解决大型语言模型在指令微调后安全性降低的问题。实验表明，该策略能有效减少微调后的有害性，且不影响模型的可用性和专业性。

Towards Safe Fine-Tuning: Mitigating Security Risks Arising from Benign Instruction Fine-Tuning

BriefGPT - AI 论文速递 ·

本文介绍了多种算法和方法以提高大型语言模型（LLMs）的指令微调性能，包括UDIT、Dynosaur、InstructMining和FANNO等。这些方法在生成高质量指令数据和提升模型推理能力方面表现显著，特别是通过合成数据和指令双向翻译技术，解决了数据质量和多样性的问题。

REInstruct：从无标签语料库构建指令数据

BriefGPT - AI 论文速递 ·

通义千问开源Qwen2-Math，成为最先进的数学专项模型

机器之心 ·

本文探讨了指令微调在大型语言模型中的应用，提出了多种方法以提升模型在复杂指令下的性能，包括长度提示和顺序指令调整。研究表明，使用有效的训练数据和新框架（如LongAlign）可以显著提高模型在长篇背景任务中的表现。此外，FollowIR数据集的引入增强了信息检索模型对真实世界指令的遵循能力。

遵循指导中的长度限制

BriefGPT - AI 论文速递 ·

Qwen-Max-0428模型介绍

Blog on Qwen ·

该研究探讨了大语言模型在情绪智能和心理健康任务中的表现，发现“积极思考”提示和元认知提示能显著提升模型性能。实验表明，LLMs在共情生成和负向语句理解方面具有潜力与局限，指令微调有效提高其在心理健康任务中的准确性。

消极刺激与心理学在大型语言模型增强中的应用

BriefGPT - AI 论文速递 ·

该研究探讨了大型语言模型（LLMs）在分析Reddit用户评论中的应用，旨在识别自杀风险的关键摘录并验证风险水平。研究强调数据隐私，使用开源LLMs，并优先考虑低计算需求的模型。结果表明，LLMs在心理健康任务中表现出希望，尤其是通过指令微调显著提升性能。研究总结了LLMs在心理健康领域的应用潜力与挑战，强调其应作为专业心理健康服务的补充。

大型语言模型与专家相当：识别青少年在线论坛中的心理健康因素

BriefGPT - AI 论文速递 ·

人工智能研究院推出了经过15T个tokens训练的Llama 3模型，提供预训练和指令微调的语言模型，具有新功能和改进的推理能力，支持多语言和多模式。Meta创新了指令微调方法，提高了推理和编程性能，并引入了安全功能。Llama 3模型在云计算平台上提供，开发者可自行下载。Meta正在训练下一代Llama，希望推出多模态版本并扩大上下文支持。

Meta推出Llama 3人工智能模型提供70B参数版本性能大幅度提升

蓝点网 ·

本研究探讨了大型语言模型（LLM）的不确定性，发现较大模型可能表现出更高的不确定性，且指令微调会增加这种不确定性。提出了一种新的无参考幻觉检测方法，强调不确定性在评估中的重要性。研究表明，LLM在事实验证方面表现良好，能够执行多任务语言检查，为开发可信生成模型提供了见解。

通过令牌级别不确定性量化对大型语言模型的事实核查

BriefGPT - AI 论文速递 ·

研究评估了多种大语言模型在心理健康任务中的性能，发现LLMs在零样本和少样本提示设计上有限但有希望的表现。指令微调可以显著提升LLMs在所有任务上的性能。最佳微调模型Mental-Alpaca在平衡精度上比GPT-3.5高出16.7％，与最先进的任务特定模型相媲美。提供了行动指南，帮助研究人员、工程师和实践者在心理健康领域中使用LLMs。

LLM 指令微调的提示权重实验

BriefGPT - AI 论文速递 ·

Knowledge Instructions: Effectively Continuing Pre-training from Limited Data Using Instructions

Essence: Harvesting Rich, Scalable, and Transferable Multi-Modal Data for Instruction Fine-Tuning

Instruction Fine-tuning Addressing the Trade-off Between Helpfulness and Truthfulness Through Uncertainty Awareness

三种简单的语言模型微调方法

Improving Influence-based Instruction Tuning Data Selection for Balanced Learning of Diverse Capabilities

关于通用指令微调中上下文意识的丧失

Meta AI推出思维偏好优化，助力AI模型在回应前进行思考

Goal-Oriented Dialogue State Tracking Beyond Ontology

通过同源模型引导和上下文感知测量选择具有影响力的样本以实现长期上下文对齐

Context-Parametric Inversion: Why Instruction Fine-tuning May Not Actually Improve Context Dependence

Towards Safe Fine-Tuning: Mitigating Security Risks Arising from Benign Instruction Fine-Tuning

REInstruct：从无标签语料库构建指令数据

通义千问开源Qwen2-Math，成为最先进的数学专项模型

遵循指导中的长度限制

Qwen-Max-0428模型介绍

消极刺激与心理学在大型语言模型增强中的应用

大型语言模型与专家相当：识别青少年在线论坛中的心理健康因素

Meta推出Llama 3人工智能模型 提供70B参数版本 性能大幅度提升

通过令牌级别不确定性量化对大型语言模型的事实核查

LLM 指令微调的提示权重实验

Meta推出Llama 3人工智能模型提供70B参数版本性能大幅度提升