小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究探讨了视觉-语言模型(VLMs)与大型语言模型(LLMs)之间的感知与推理机制,提出了跨模态模型融合的方法。结果表明,模型融合有效地将LLMs的推理能力转移至VLMs,且感知能力主要集中在早期层,而推理能力在中后期层得到增强。

将推理引入视觉:通过模型融合理解感知和推理

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-08T00:00:00Z

本研究提出了一种统一多任务学习与模型融合的方法,以提高语言模型的防护效率。通过生成特定任务数据,训练出更小且性能优越的分类器,显著提升了对不安全和安全行为的检测能力。

Unified Multi-Task Learning and Model Fusion for Efficient Language Model Guardrailing

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-27T00:00:00Z
NAACL2025|中国移动九天团队提出大模型调色板:一种可控文本生成的解决方案

中国移动九天人工智能团队自2013年成立,专注于AI技术研发,拥有800多名研发人员。在文本生成领域,该团队提出了多属性模型融合策略,有效解决属性冲突问题,提升了可控文本生成效果。

NAACL2025|中国移动九天团队提出大模型调色板:一种可控文本生成的解决方案

机器之心
机器之心 · 2025-03-19T05:44:58Z

本研究提出了一种模型融合方法,显著提升了泰语大型语言模型的推理能力,达到DeepSeek R1水平。

开放的配方:通过模型融合在一天内将语言特定的大型语言模型适应为推理模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-13T00:00:00Z

本文提出了一种名为版权保护模型融合(CP-Fuse)的方法,旨在解决语言模型重现训练数据中版权所有材料的问题。通过在推理时结合不同版权材料集的模型输出,CP-Fuse显著降低了版权材料的复制风险,同时保持文本和代码生成的质量,并可与其他保护措施无缝集成。

Copyright-Protected Language Generation via Adaptive Model Fusion

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-09T00:00:00Z

本研究提出了一种新型模型融合技术,利用多目标贝叶斯优化解决微调预训练语言模型的最佳选择问题,显著提升多个下游任务的性能。

Model Fusion in Language Model Fine-Tuning via Bayesian Optimization

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-11T00:00:00Z

本文探讨了通过知识融合技术提升大型语言模型(LLM)性能的方法,包括模型融合、机器翻译集成和多语言任务应用。研究表明,融合不同领域模型可提高翻译质量和生成能力,提出的UltraFuser框架和Evolver方法在多任务学习中表现优越,设立了新评估标准。

Cool-Fusion: 不进行训练即可融合大型语言模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-29T00:00:00Z

本文介绍了Cool-Fusion模型融合方法,通过结合不同大型语言模型的知识,提升了模型的准确性。研究表明,模型融合增强了共享知识,但未共享知识可能会丢失。此外,UltraFuser框架和MultiFusion方法有效整合多模态输入,提高了生成效率,并强调了模型融合在隐私保护和版权遵守方面的潜力。

自适应模型融合强版权保护语言模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-29T00:00:00Z
虚拟助手的服务器端重评分技术在实体中心知识查询中的应用

本文探讨了服务器端重评分技术在虚拟助手中的应用,特别是针对实体丰富的查询。研究表明,结合服务器端语言模型与设备端信号可以提高识别准确率23%-35%。模型融合技术有效整合了不同模型的优势,提升了语音识别系统的性能。

虚拟助手的服务器端重评分技术在实体中心知识查询中的应用

Apple Machine Learning Research
Apple Machine Learning Research · 2024-06-14T00:00:00Z

该研究探讨了多模态指导调优方法在复杂推理和对话任务中的表现,指出现有方法在处理多模态数据集和生成真实响应方面的局限性。提出了一种通用的多模态模型融合框架,结合预训练语言模型以提高图像描述质量,并在多个基准数据集上显示出显著改进。

图像文本分类的稳健潜在表示调整

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-10T00:00:00Z

本文比较了机器学习模型与数值天气预报模型在高影响天气事件模拟中的表现,指出机器学习模型在捕捉气旋宏观结构方面表现良好,但在细节结构上较为复杂。研究探讨了人工智能天气预报模型的演变,提出了“三大规则”,强调人工智能与传统模型的融合将提升天气预报的准确性和可靠性。

危险风险管理的潜在范式转变:基于人工智能的热带气旋灾害天气预报

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-29T00:00:00Z

通过模型融合,将预训练适配器高效地整合到单一模型,以提高适配器调优的性能。MerA方法在两个预训练语言模型上实现了显著的性能提升,并通过引入“同路径”设置进一步增加了模型的容量,超越全微调和适配器调优的表现。

MerA:合并预训练适配器进行弱监督学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-08-30T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码