本研究探讨了视觉-语言模型(VLMs)与大型语言模型(LLMs)之间的感知与推理机制,提出了跨模态模型融合的方法。结果表明,模型融合有效地将LLMs的推理能力转移至VLMs,且感知能力主要集中在早期层,而推理能力在中后期层得到增强。
本研究提出了一种统一多任务学习与模型融合的方法,以提高语言模型的防护效率。通过生成特定任务数据,训练出更小且性能优越的分类器,显著提升了对不安全和安全行为的检测能力。
中国移动九天人工智能团队自2013年成立,专注于AI技术研发,拥有800多名研发人员。在文本生成领域,该团队提出了多属性模型融合策略,有效解决属性冲突问题,提升了可控文本生成效果。
本研究提出了一种模型融合方法,显著提升了泰语大型语言模型的推理能力,达到DeepSeek R1水平。
本文提出了一种名为版权保护模型融合(CP-Fuse)的方法,旨在解决语言模型重现训练数据中版权所有材料的问题。通过在推理时结合不同版权材料集的模型输出,CP-Fuse显著降低了版权材料的复制风险,同时保持文本和代码生成的质量,并可与其他保护措施无缝集成。
本研究提出了一种新型模型融合技术,利用多目标贝叶斯优化解决微调预训练语言模型的最佳选择问题,显著提升多个下游任务的性能。
本文探讨了通过知识融合技术提升大型语言模型(LLM)性能的方法,包括模型融合、机器翻译集成和多语言任务应用。研究表明,融合不同领域模型可提高翻译质量和生成能力,提出的UltraFuser框架和Evolver方法在多任务学习中表现优越,设立了新评估标准。
本文介绍了Cool-Fusion模型融合方法,通过结合不同大型语言模型的知识,提升了模型的准确性。研究表明,模型融合增强了共享知识,但未共享知识可能会丢失。此外,UltraFuser框架和MultiFusion方法有效整合多模态输入,提高了生成效率,并强调了模型融合在隐私保护和版权遵守方面的潜力。
本文探讨了服务器端重评分技术在虚拟助手中的应用,特别是针对实体丰富的查询。研究表明,结合服务器端语言模型与设备端信号可以提高识别准确率23%-35%。模型融合技术有效整合了不同模型的优势,提升了语音识别系统的性能。
该研究探讨了多模态指导调优方法在复杂推理和对话任务中的表现,指出现有方法在处理多模态数据集和生成真实响应方面的局限性。提出了一种通用的多模态模型融合框架,结合预训练语言模型以提高图像描述质量,并在多个基准数据集上显示出显著改进。
本文比较了机器学习模型与数值天气预报模型在高影响天气事件模拟中的表现,指出机器学习模型在捕捉气旋宏观结构方面表现良好,但在细节结构上较为复杂。研究探讨了人工智能天气预报模型的演变,提出了“三大规则”,强调人工智能与传统模型的融合将提升天气预报的准确性和可靠性。
通过模型融合,将预训练适配器高效地整合到单一模型,以提高适配器调优的性能。MerA方法在两个预训练语言模型上实现了显著的性能提升,并通过引入“同路径”设置进一步增加了模型的容量,超越全微调和适配器调优的表现。
完成下面两步后,将自动完成登录并继续当前操作。