小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
语义掌握:通过先进的自然语言理解提升大型语言模型

本文探讨了如何通过先进的自然语言理解技术提升大型语言模型的能力。尽管大型语言模型在自然语言处理任务中取得了显著进展,但在语义理解、上下文连贯性和细微推理方面仍面临挑战。研究分析了结构化知识图谱、检索增强生成和微调策略等方法,强调语义精确性对提升AI语言系统的重要性,并提出未来研究方向。

语义掌握:通过先进的自然语言理解提升大型语言模型

Apple Machine Learning Research
Apple Machine Learning Research · 2025-12-09T00:00:00Z

本研究探讨了基础时间序列模型在增量学习中的持续改进能力。研究表明,Time-MoE和Chronos等模型在增量微调中能够持续提高预测精度,而传统模型则表现下降,强调了优化微调策略的重要性。

Evaluation of Temporal Plasticity in Incremental Fine-Tuning of Fundamental Time Series Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-20T00:00:00Z

本研究探讨了低秩适应(LoRA)在航拍图像跨域少样本目标检测中的应用。将LoRA集成到DiffusionDet中,结果显示在1-shot和5-shot的低样本设置下,性能略有提升,表明其在资源有限情况下的适应潜力,对少样本学习的微调策略研究具有重要意义。

Analysis of the Impact of Low-Rank Adaptation on Cross-Domain Few-Shot Object Detection in Aerial Images

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-08T00:00:00Z

本研究提出了一种新微调策略,利用集基提示方法解决大型语言模型在自然语言处理中的顺序依赖性问题,从而显著提升多项选择任务的准确性和鲁棒性。

Order Independence in Fine-Tuning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-30T00:00:00Z

本研究提出了ProJudgeBench,这是第一个用于评估多模态大语言模型(MLLM)过程判断能力的基准。研究表明,开放源代码模型与专有模型之间存在显著性能差距,并通过ProJudge-173k数据集和双阶段微调策略提升了开放源代码模型的评估能力。

ProJudge: A Multi-Modal Multi-Disciplinary Benchmark and Instruction-Tuning Dataset for MLLM-based Process Judges

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-09T00:00:00Z

本研究探讨了在患者群体和临床实践差异显著的情况下,临床机器学习的知识转移挑战。通过对比预测编码(CPC)进行表示学习,发现合适的微调策略能有效促进知识共享,尤其在数据有限时。研究结果表明,时间进展模式比临床决策更易转移,为跨机构部署提供了可行路径。

Contrastive Representation Learning Facilitates Knowledge Transfer Across Institutions: A Study on Pediatric Ventilation Management

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-23T00:00:00Z

论文提出了AlignSum框架,通过构建数据金字塔,结合抽取、生成和人工标注的方法,提升预训练语言模型在文本摘要生成中的能力。该框架解决了低质量数据导致的自动与人工评估不一致问题,并采用高斯重采样和两阶段微调策略,使模型更好地对齐人类摘要偏好。实验结果表明,AlignSum显著提升了模型性能。

AlignSum:数据金字塔与层级微调,提升文本摘要模型性能 | EMNLP'24 - 晓飞的算法工程笔记

晓飞的算法工程笔记
晓飞的算法工程笔记 · 2024-11-14T01:49:00Z

本研究探讨了大语言模型后训练量化中的块间交互问题,关注量化误差。引入两种多块微调策略,发现这些方法在特定网络模型上显著提升了量化效果。

Interactions Across Blocks in Post-Training Quantization of Large Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-06T00:00:00Z

本研究探讨了大型语言模型在数学问题求解中的能力,采用多种微调策略显著提升模型性能。尽管模型在常规任务上表现良好,但在复杂问题上仍面临挑战,需要进一步研究以提高其数学推理能力。

BEATS:通过BackVerify和自适应消歧义的高效树搜索优化大型语言模型的数学能力

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-26T00:00:00Z

该论文提出了多种高效的扩散模型微调策略,包括DiffFit和SDFT,旨在快速适应新领域并提升生成能力。研究还探讨了低秩适应性与模型蒸馏结合的方法,显著降低内存消耗和推理时间,并提出了新的谱感知适应框架SODA,以优化生成模型的参数适应。

SaRA:高效扩散模型的渐进稀疏低秩适应微调

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-10T00:00:00Z

本文介绍了预训练语言模型(PLMs)和大型语言模型(LLMs)的最新研究进展,重点讨论了模型的预训练、微调策略及其在不同应用中的表现。研究表明,微调方法与数据量和模型规模密切相关,并提出了优化资源使用的新算法。此外,探讨了将外部知识融入LLMs的技术及其伦理问题,为未来研究提供指导。

大规模语言模型的领域适应微调:训练策略、比例、模型合并及协同能力探索

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-05T00:00:00Z

本文探讨了通过预训练和在线评分优化神经机器翻译模型的微调策略,显著提高了翻译质量和收敛速度。提出的QUAK数据集和AutoMQM评估方法利用大语言模型提升翻译输出质量,并强调真实数据在训练中的重要性。

引入NewsPaLM MBR和QE数据集:LLM生成的高质量平行数据优于传统网络爬取数据

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-13T00:00:00Z

本文研究了大型语言模型(LLM)在数学推理中的能力,分析其推理技能及与人类的异同。通过对比实验,发现LLM在识别错误答案及其背后误解方面存在困难。研究提出了ConceptMath基准,以评估LLM的概念级数学推理能力,并指出现有模型在不同数学概念上的表现差异,提出微调策略以提升其能力。

通过结合教育课程评估语言模型的数学推理能力

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-08T00:00:00Z

本文介绍了多种针对大型语言模型(LLMs)的指令调优方法,如CodecLM、Semi-Instruct和对比指令调优。这些方法通过改进指令生成和数据集质量,显著提升了模型在代码理解和生成任务中的表现,尤其在处理未知指令时的稳健性。研究表明,适当的微调和数据扩充策略能够有效提高模型的性能和通用性。

InverseCoder: 发挥逆向指令调谐代码语言模型的能力与逆向指令实现

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-08T00:00:00Z

该论文提出了一种名为Tastle的新型越狱攻击方法,旨在自动化攻击大型语言模型(LLMs)。研究评估了多种攻击和防御技术,发现通过新算法和微调策略成功降低了攻击率,强调了评估越狱方法的重要性,并为未来的安全防护提供了见解。

大型语言模型是不自觉的说真话者:利用谬误失误进行越狱攻击

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-01T00:00:00Z

本文探讨了大型语言模型(LLMs)通过思维链提示(CoT)提升推理能力的方法,包括微调策略、跨语言推理和多模态框架。研究表明,自我审查、步骤级辩论和视觉推理等新技术能显著提高模型在复杂任务中的准确性和性能。

深思专家的混合(MoTE):思维链和专家混合在自我对齐中的协同作用

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-01T00:00:00Z

本文介绍了新的微调策略HiFT和量化全参数调优框架QFT,显著降低了大型语言模型的GPU内存使用。研究表明,稀疏微调方法在性能上优于传统方法,但存在灾难性遗忘问题。提出了神经元级微调(NeFT),以实现更高效的模型更新,并强调了参数高效微调的必要性及未来研究方向。

HFT: 大型语言模型的半微调

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-29T00:00:00Z

大型语言模型在自然语言理解上取得了进展,但在数学推理方面仍存在不足。研究通过引入新的数学数据集和微调策略,提升了模型在数学问题上的表现。探索了对话式解决框架MathChat,并评估了模型在复杂数学问题上的能力,提出了改进建议。希望这些研究能推动人工智能在数学推理领域的发展。

ChatGLM-Math: 使用自我批评流程提高大型语言模型在数学问题求解中的能力

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-03T00:00:00Z

本研究介绍了ConceptMath,这是一个评估大型语言模型数学推理能力的双语基准。与传统基准不同,ConceptMath按数学概念层次组织问题,揭示了模型在不同概念上的性能差异。研究还提出了微调策略以提升模型表现,并评估了大型语言模型在金融和小学数学领域的能力,发现GPT-4在多个测试中表现优异。

FineMath:面向中文大语言模型的细粒度数学评估基准

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-12T00:00:00Z

本研究介绍了ConceptMath,一个用于评估语言模型数学推理能力的双语基准。通过按照数学概念层次组织问题,可以评估不同细粒度的数学推理能力。提出了微调策略以改进模型的弱点。希望ConceptMath能指导开发人员了解模型的数学能力并促进模型的发展。

ConceptMath:大型语言模型数学推理的双语概念评估基准

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-22T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码