小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究提出了一种知识指令方法,通过指令微调来解决大型语言模型在特定领域信息不足的问题,提升模型的事实记忆、减少遗忘并增强理解能力,适用于小型模型的数据生成。

Knowledge Instructions: Effectively Continuing Pre-training from Limited Data Using Instructions

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-08T00:00:00Z

本文探讨了在指令微调阶段选择预训练大型语言模型(LLMs)数据的方法,提出了一种新的多模态评分机制,以提升数据质量和多样性。研究表明,该方法在多个实验中比随机采样和现有方法更有效,显著提高了模型性能。

Essence: Harvesting Rich, Scalable, and Transferable Multi-Modal Data for Instruction Fine-Tuning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-17T00:00:00Z

本研究提出了UNIT微调范式,解决了大语言模型在指令微调中的有效性与真实性的平衡问题,显著减少了幻觉现象,提高了模型的可靠性。

Instruction Fine-tuning Addressing the Trade-off Between Helpfulness and Truthfulness Through Uncertainty Awareness

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-17T00:00:00Z

本研究提出BIDS算法,解决大型语言模型在指令微调中训练数据选择不平衡的问题。该算法通过规范化影响分数,迭代选择最具影响力的训练实例,从而提升不同任务间的性能平衡。实验结果表明,BIDS在多个基准测试中优于现有方法,增强了多样化能力的学习。

Improving Influence-based Instruction Tuning Data Selection for Balanced Learning of Diverse Capabilities

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-21T00:00:00Z

本研究探讨了大型语言模型(LLMs)在指令微调后上下文理解能力的下降,首次识别出聊天模板输入导致的性能降低,并提出了后期注意力引导和条件指令微调两种有效的缓解方法。

关于通用指令微调中上下文意识的丧失

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-05T00:00:00Z
Meta AI推出思维偏好优化,助力AI模型在回应前进行思考

Meta FAIR、加州大学伯克利分校和纽约大学的研究人员提出了一种思维偏好优化(TPO)方法,旨在提高大语言模型(LLM)在指令微调中的响应质量。与传统模型不同,TPO鼓励模型在回应前进行内部思考,从而生成更准确的答案。该方法结合了改进的思维链推理,优化了模型的思维过程,提升了响应的相关性和质量,适用于多种复杂任务。

Meta AI推出思维偏好优化,助力AI模型在回应前进行思考

InfoQ
InfoQ · 2024-11-04T07:03:00Z

本研究提出了一种新方法,通过指令微调和高级提示策略,提升对话状态跟踪性能,采用变分图自编码器建模用户意图,且无需预定义本体,在开放领域对话中表现优异。

Goal-Oriented Dialogue State Tracking Beyond Ontology

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-30T00:00:00Z

本文介绍了QA4RE框架,通过指令微调提升大型语言模型(LLM)在零样本任务中的性能。研究发现,长上下文LLM在处理长文本时表现优异,人工指导数据优于合成数据。LongAlign框架和Step-Skipping Alignment技术有效增强了LLM的长上下文能力,优化指令数据集可显著提高多模态LLM的效率和效果。

通过同源模型引导和上下文感知测量选择具有影响力的样本以实现长期上下文对齐

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-21T00:00:00Z

本研究探讨了大型语言模型在指令微调后上下文依赖性降低的现象。通过“上下文参数反演”,揭示了模型在微调初期依赖性上升但随后下降的趋势,并提出了一些缓解策略。

Context-Parametric Inversion: Why Instruction Fine-tuning May Not Actually Improve Context Dependence

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-14T00:00:00Z

本研究提出了一种模块鲁棒性分析方法,通过模块分层学习率策略,解决大型语言模型在指令微调后安全性降低的问题。实验表明,该策略能有效减少微调后的有害性,且不影响模型的可用性和专业性。

Towards Safe Fine-Tuning: Mitigating Security Risks Arising from Benign Instruction Fine-Tuning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-06T00:00:00Z

本文介绍了多种算法和方法以提高大型语言模型(LLMs)的指令微调性能,包括UDIT、Dynosaur、InstructMining和FANNO等。这些方法在生成高质量指令数据和提升模型推理能力方面表现显著,特别是通过合成数据和指令双向翻译技术,解决了数据质量和多样性的问题。

REInstruct:从无标签语料库构建指令数据

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-20T00:00:00Z
通义千问开源Qwen2-Math,成为最先进的数学专项模型

阿里通义团队开源了新一代数学模型Qwen2-Math,包含1.5B、7B、72B三个参数的基础模型和指令微调模型。Qwen2-Math-72B-Instruct在MATH基准测评中的准确率达到84%,超过其他开源数学模型。Qwen2-Math基础模型使用Qwen2大语言模型进行初始化,并在数学专用语料库上进行预训练。研发团队训练了指令微调版本模型,通过奖励模型和二元信号进行学习。Qwen2-Math目前主要支持英文,但将推出中英双语版本和多语言版本。阿里通义团队希望通过开源模型为科学界解决高级数学问题做出贡献。

通义千问开源Qwen2-Math,成为最先进的数学专项模型

机器之心
机器之心 · 2024-08-09T07:42:04Z

本文探讨了指令微调在大型语言模型中的应用,提出了多种方法以提升模型在复杂指令下的性能,包括长度提示和顺序指令调整。研究表明,使用有效的训练数据和新框架(如LongAlign)可以显著提高模型在长篇背景任务中的表现。此外,FollowIR数据集的引入增强了信息检索模型对真实世界指令的遵循能力。

遵循指导中的长度限制

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-25T00:00:00Z
Qwen-Max-0428模型介绍

Qwen团队推出了新模型Qwen-Max-0428,参数规模从5亿到1100亿,经过指令微调,表现优于Qwen1.5-110B-Chat。该模型已上线Chatbot Arena和Hugging Face,支持OpenAI API格式,欢迎用户体验。

Qwen-Max-0428模型介绍

Blog on Qwen
Blog on Qwen · 2024-05-11T10:10:00Z

人工智能研究院推出了经过15T个tokens训练的Llama 3模型,提供预训练和指令微调的语言模型,具有新功能和改进的推理能力,支持多语言和多模式。Meta创新了指令微调方法,提高了推理和编程性能,并引入了安全功能。Llama 3模型在云计算平台上提供,开发者可自行下载。Meta正在训练下一代Llama,希望推出多模态版本并扩大上下文支持。

Meta推出Llama 3人工智能模型 提供70B参数版本 性能大幅度提升

蓝点网
蓝点网 · 2024-04-19T01:59:20Z

研究评估了多种大语言模型在心理健康任务中的性能,发现LLMs在零样本和少样本提示设计上有限但有希望的表现。指令微调可以显著提升LLMs在所有任务上的性能。最佳微调模型Mental-Alpaca在平衡精度上比GPT-3.5高出16.7%,与最先进的任务特定模型相媲美。提供了行动指南,帮助研究人员、工程师和实践者在心理健康领域中使用LLMs。

LLM 指令微调的提示权重实验

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-24T00:00:00Z

本研究全面评估了多种大语言模型(LLMs)在心理健康任务中的性能,发现LLMs具有有限但有希望的表现。指令微调可以显著提升LLMs在所有任务上的性能。最佳微调模型Mental-Alpaca在平衡精度上比GPT-3.5高出16.7%,与最先进的任务特定模型相媲美。提供了行动指南,介绍如何赋予LLMs更好的心理健康领域知识,并成为心理健康预测任务的专家。

通过大型语言模型理解心理健康的评估

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-09T00:00:00Z

研究评估了多种大语言模型在心理健康任务中的表现,发现LLMs在零样本和少样本提示设计上具有有限但有希望的性能。指令微调可以显著提升LLMs在所有任务上的表现。最佳微调模型Mental-Alpaca在平衡精度上比GPT-3.5高出16.7%,并与最先进的任务特定模型相媲美。研究总结了一系列行动指南,介绍如何赋予LLMs更好的心理健康领域知识,并成为心理健康预测任务的专家。

基于量化的 LLaMa 模型在巴西中学考试上的基准测试

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-21T00:00:00Z

本文介绍了数据集的构建和预处理过程,包括中英文语料的来源、数据分词、文本切分、数据预处理工具、数据集的剔除和合并等。同时,还介绍了指令微调数据集的构建和训练过程,包括使用 GPT4 进行翻译、信息抽取数据集的构造、KG2Instruction 的介绍等。最后,介绍了基于私有化LLM技术的数据库交互方式DB-GPT的架构和应用。

知识图谱实战导论:从什么是KG到LLM与KG/DB的结合实战

结构之法 算法之道
结构之法 算法之道 · 2023-09-16T03:22:14Z

研究评估了多种大语言模型在心理健康任务中的表现,发现LLMs在零样本和少样本提示设计上具有有限但有希望的性能。指令微调可以显著提升LLMs在所有任务上的表现。最佳微调模型Mental-Alpaca在平衡精度上比GPT-3.5高出16.7%,并与最先进的任务特定模型相媲美。研究总结了一系列行动指南,介绍如何赋予LLMs更好的心理健康领域知识,并成为心理健康预测任务的专家。

大规模语言模型的公共卫生平衡和可解释的社交媒体分析

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-12T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码