小红花·文摘

本研究提出了动态参数检索增强生成（DyPRAG）框架，旨在解决传统RAG方法在推理成本和知识冲突方面的不足。DyPRAG通过轻量级参数翻译模型动态增强大型语言模型的知识，降低了推理、训练和存储成本。实验结果表明，DyPRAG在知识融合能力上优于传统方法，有效缓解了RAG的幻觉问题。

Better Wit than Wealth: Dynamic Parametric Retrieval-Augmented Generation for Test-Time Knowledge Enhancement

BriefGPT - AI 论文速递 ·

本文探讨了大型语言模型（LLMs）和小型语言模型（SLMs）的最新进展，重点在于通过知识融合和数据增强等方法提升模型在自然语言理解和推理任务中的表现。

堆叠小型语言模型以增强可泛化性

BriefGPT - AI 论文速递 ·

Weekly #20：我的个人宣言 v0.1

SkyWT ·

Weekly #20：我的个人宣言 v0.1

SkyWT ·

本文探讨了大型语言模型（LLM）融合的多种方法，特别是针对非英语语言的适应性。研究提出了TransLLM框架，通过翻译连接英语与非英语，提升模型性能。同时，知识融合技术被拆解为四个场景，强调内部参数化知识的重要性。新方法Cool-Fusion和WIDEN有效解决了计算负载和模型合并中的挑战，提升了多语种能力和准确性。

FuseChat：聊天模型的知识融合

BriefGPT - AI 论文速递 ·

本文探讨了通过知识融合和模型合并提升大型语言模型（LLMs）在低资源语言和机器翻译任务中的性能。研究表明，结合不同模型和微调方法能显著提高翻译质量，尤其在数据稀缺的情况下。实验结果显示，预训练模型在翻译任务中表现优越，理解翻译指令至关重要。

通过权重解耦，将模型合并从微调扩展到预训练的大型语言模型

BriefGPT - AI 论文速递 ·

本文探讨了通过知识融合技术提升大型语言模型（LLM）性能的方法，包括模型融合、机器翻译集成和多语言任务应用。研究表明，融合不同领域模型可提高翻译质量和生成能力，提出的UltraFuser框架和Evolver方法在多任务学习中表现优越，设立了新评估标准。

Cool-Fusion: 不进行训练即可融合大型语言模型

BriefGPT - AI 论文速递 ·

本文探讨了通过知识融合提升大型语言模型（LLM）性能的方法，包括模型融合、机器翻译模型的即时集成和个性化推荐等。研究表明，这些技术在推理、翻译质量和推荐性能上显著优于传统方法，展示了LLM在多领域应用的潜力。

LLMs 模型群：通过困惑度优化在测试时间融合模型

BriefGPT - AI 论文速递 ·

本文探讨了通过检查点平均化和知识融合等方法提升大型语言模型（LLMs）性能的策略，包括多模态模型的训练数据构建、数据增强在跨语言推理中的应用，以及改进机器翻译能力的研究。研究表明，这些策略能有效提高低资源语言的表现，并展示了LLMs与传统自然语言处理技术的协同作用。

LLM 预训练中的基于贝叶斯优化的检查点合并

BriefGPT - AI 论文速递 ·

本文探讨了通过知识融合技术提升大型语言模型（LLM）性能的方法，包括聊天、代码生成和数学推理等应用。研究表明，模型如CodeFuse和MathCoder在中文提示下表现优异。此外，提出了MultiFusion方法以整合多模态输入，提高图像生成效率，并介绍了SportsMetrics系统用于评估数值推理能力。最后，构建了多语种数学推理模型MathOctopus，展示了其在少样本情况下的优势。

通过融合高度专业化的语言模型，同时掌握文本、代码和数学

BriefGPT - AI 论文速递 ·

该研究提出了一种新的视频理解任务方法，融入知识可在视频问答方面产生卓越的改进。研究发现，该方法仍远远落后于人类的准确度，具有较高的研究价值。

VQPy：现代视频分析的面向对象方法

BriefGPT - AI 论文速递 ·

该文介绍了一种基于数据驱动知识融合的深度多实例学习算法（DKMIL），使用知识融合模块和两级注意力模块提高分类效果。实验结果证明了该算法的可扩展性和有效性。

有限数据可用情况下深度实例生成框架在 MILP 求解器中的应用

BriefGPT - AI 论文速递 ·