量子位 ·

利用公开知识定向提升大模型，腾讯优图&上交大新方法性能达SOTA

💡 原文中文，约3800字，阅读约需9分钟。

📝

内容提要

腾讯优图与上海交大提出了一种新方法，通过开源知识增强框架提升大模型性能。该方法无需依赖数据集和模型信息，利用K-shot样本指导模型选择和数据筛选，结合混合专家模型实现知识互补。实验显示，该方法在多个任务上优于基线和SOTA方法，强调了K-shot数据在模型选择和数据扩增中的重要性。

🎯

关键要点

腾讯优图与上海交大提出了一种新型开源知识增强框架，提升大模型性能。
该方法不依赖于数据集和模型元信息，利用K-shot样本指导模型选择和数据筛选。
实验结果显示，该方法在多个任务上优于基线和SOTA方法。
研究背景指出传统指令微调需要大量标注数据和计算资源，难以在实际业务中获得。
提出的框架利用K-shot样本实现LLM的定向任务增强，解决了多个关键问题。
研究团队设计了一套可扩展的LLM知识增强管线，面临模型选择、数据筛选和模型融合的挑战。
贡献包括高效筛选潜力模型的方法、从开源数据中提取相关知识的方法和自适应模型融合系统。
核心方法包括K-shot引导的专家模型选择、混合专家模型初始化和数据选择策略。
实验使用六个开源数据集进行评估，结果显示本文方法在各项任务上表现优异。
方法的优势在于不依赖数据集和模型的元信息，具有多任务适用性和易用性。
结论强调K-shot数据在模型选择和数据扩增中的重要性，展示了高效的知识挖掘流程。

❓

延伸问答

腾讯优图与上海交大提出的新方法有什么特点？

该方法利用开源知识增强框架提升大模型性能，不依赖数据集和模型元信息，使用K-shot样本指导模型选择和数据筛选。

K-shot样本在该方法中起什么作用？

K-shot样本用于指导模型选择和数据筛选，帮助实现LLM的定向任务增强。

该方法在实验中表现如何？

实验结果显示，该方法在多个任务上优于基线和SOTA方法，表现优异。

传统指令微调存在哪些问题？

传统指令微调需要大量标注数据和计算资源，难以在实际业务中获得。

研究团队在模型选择上面临哪些挑战？

团队面临如何有效利用K-shot数据、识别相关指令数据和构建自适应模型融合系统的挑战。

该方法的贡献有哪些？

主要贡献包括高效筛选潜力模型的方法、从开源数据中提取相关知识的方法和自适应模型融合系统。

🏷️

标签

K-shot 上海交大大模型混合专家模型知识增强腾讯腾讯优图

➡️

继续阅读

移远通信端侧AI大模型解决方案迎来全面升级
(全球TMT 2026年07月20日讯)在WAIC 2026（世界人工智能大会）期间，移远通信宣布其端侧AI大 […]
D7VK 2.0 发布，性能大幅提升：最高可达 2 倍或更高
上周五，D7VK 2.0 发布，这是基于 Vulkan API 实现的 Direct3D 7 及更早版本的最新重大功能版本。 D7VK 2.0 带来了一系...
如何禁用/限制WordPress REST API？关闭接口方法与教程
在WordPress中，禁用REST API通常涉及到几个不同的方法和策略，具体取决于你想达到的目的。 RES […]
苹果国行 AI 刷屏之外，三星也把端侧大脑交给国产 AI
把智能装进手机的秘诀，在于「多、快、好、省」#欢迎关注爱范儿官方微信公众号：爱范儿（微信号：ifanr），更多精彩内容第一时间为您奉上。
AliExpress fined almost $630 million over illegal product sales
AliExpress has been hit with a €550 million (about $629 million) fine for vio...
Kimi K3 把我当日本人整
听说Kimi K3已经把claude和gpt都给干怕了，说是前端非常屌，于是我赶紧充了个会员，体验一下「国产最屌」，下单了99每月的次高等会员。然后下载了...