小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究提出了动态参数检索增强生成(DyPRAG)框架,旨在解决传统RAG方法在推理成本和知识冲突方面的不足。DyPRAG通过轻量级参数翻译模型动态增强大型语言模型的知识,降低了推理、训练和存储成本。实验结果表明,DyPRAG在知识融合能力上优于传统方法,有效缓解了RAG的幻觉问题。

Better Wit than Wealth: Dynamic Parametric Retrieval-Augmented Generation for Test-Time Knowledge Enhancement

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-31T00:00:00Z

本文探讨了大型语言模型(LLMs)和小型语言模型(SLMs)的最新进展,重点在于通过知识融合和数据增强等方法提升模型在自然语言理解和推理任务中的表现。

堆叠小型语言模型以增强可泛化性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-21T00:00:00Z
Weekly #20:我的个人宣言 v0.1

文章探讨了人类在融合知识方面的优势,反对过度专业化。作者参观中南大学铁道校区,感受到季节变化,并分享了学习、创造和影响的重要性。书籍《计算》涉及计算的原理和哲学。作者提到推特的使用和数据安全事件,并讨论地铁一号线标识色多选红色的原因。

Weekly #20:我的个人宣言 v0.1

SkyWT
SkyWT · 2024-10-06T18:00:00Z
Weekly #20:我的个人宣言 v0.1

文章探讨个人成长与学习,强调知识的广泛融合。作者制定个人宣言,追求学习、创造和影响。书籍《成长的边界》讨论通才与专才,主张从宏观角度发展,避免过度专业化。作者对该书评分70分,认为论证不足。同时,正在阅读《计算》,探讨计算的本质与原理。

Weekly #20:我的个人宣言 v0.1

SkyWT
SkyWT · 2024-10-06T18:00:00Z

本文探讨了大型语言模型(LLM)融合的多种方法,特别是针对非英语语言的适应性。研究提出了TransLLM框架,通过翻译连接英语与非英语,提升模型性能。同时,知识融合技术被拆解为四个场景,强调内部参数化知识的重要性。新方法Cool-Fusion和WIDEN有效解决了计算负载和模型合并中的挑战,提升了多语种能力和准确性。

FuseChat:聊天模型的知识融合

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-15T00:00:00Z

本文探讨了通过知识融合和模型合并提升大型语言模型(LLMs)在低资源语言和机器翻译任务中的性能。研究表明,结合不同模型和微调方法能显著提高翻译质量,尤其在数据稀缺的情况下。实验结果显示,预训练模型在翻译任务中表现优越,理解翻译指令至关重要。

通过权重解耦,将模型合并从微调扩展到预训练的大型语言模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-06T00:00:00Z

本文探讨了通过知识融合技术提升大型语言模型(LLM)性能的方法,包括模型融合、机器翻译集成和多语言任务应用。研究表明,融合不同领域模型可提高翻译质量和生成能力,提出的UltraFuser框架和Evolver方法在多任务学习中表现优越,设立了新评估标准。

Cool-Fusion: 不进行训练即可融合大型语言模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-29T00:00:00Z

本文探讨了通过知识融合提升大型语言模型(LLM)性能的方法,包括模型融合、机器翻译模型的即时集成和个性化推荐等。研究表明,这些技术在推理、翻译质量和推荐性能上显著优于传统方法,展示了LLM在多领域应用的潜力。

LLMs 模型群:通过困惑度优化在测试时间融合模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-17T00:00:00Z

本文探讨了通过检查点平均化和知识融合等方法提升大型语言模型(LLMs)性能的策略,包括多模态模型的训练数据构建、数据增强在跨语言推理中的应用,以及改进机器翻译能力的研究。研究表明,这些策略能有效提高低资源语言的表现,并展示了LLMs与传统自然语言处理技术的协同作用。

LLM 预训练中的基于贝叶斯优化的检查点合并

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-28T00:00:00Z

本文探讨了通过知识融合技术提升大型语言模型(LLM)性能的方法,包括聊天、代码生成和数学推理等应用。研究表明,模型如CodeFuse和MathCoder在中文提示下表现优异。此外,提出了MultiFusion方法以整合多模态输入,提高图像生成效率,并介绍了SportsMetrics系统用于评估数值推理能力。最后,构建了多语种数学推理模型MathOctopus,展示了其在少样本情况下的优势。

通过融合高度专业化的语言模型,同时掌握文本、代码和数学

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-13T00:00:00Z

该研究提出了一种新的视频理解任务方法,融入知识可在视频问答方面产生卓越的改进。研究发现,该方法仍远远落后于人类的准确度,具有较高的研究价值。

VQPy:现代视频分析的面向对象方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-03T00:00:00Z

该文介绍了一种基于数据驱动知识融合的深度多实例学习算法(DKMIL),使用知识融合模块和两级注意力模块提高分类效果。实验结果证明了该算法的可扩展性和有效性。

有限数据可用情况下深度实例生成框架在 MILP 求解器中的应用

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-04T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码