小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究提出了两种有效的方法,以解决多任务场景下模型合并性能下降的问题。实验结果表明,这些方法在样本数量和训练步数上优于传统多任务学习,显著提升了模型性能。

Single-Input Multi-Output Model Merging: Leveraging Foundation Models for Dense Multi-Task Learning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-15T00:00:00Z

本研究提出了一种新的遗忘系统TIES-Merging,通过模型合并方法选择性删除大型语言模型中的敏感知识。该系统在26个团队中排名第二,展示了其有效性,并呼吁重新思考遗忘目标和评估方法。

ZJUKLAB在SemEval-2025任务4:通过模型合并进行遗忘

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-27T00:00:00Z

本研究提出了一种新方法——Frank-Wolfe合并(FW-Merging),旨在解决多任务学习中模型合并的适应性和扩展性问题。FW-Merging通过约束优化显著提高了合并的准确性和稳定性,实验结果表明其在多个模型合并中表现优异,且内存开销保持恒定,具有潜在应用价值。

FW Merging: Extending Model Merging Using Frank-Wolfe Optimization

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-16T00:00:00Z

本研究提出了Speech-FT策略,通过模型合并解决微调语音表示模型时的泛化能力下降问题,提供了一种高效的解决方案。

Speech-FT: A Fine-Tuning Strategy for Speech Representation Models that Balances Generalization Ability

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-18T00:00:00Z

OpenAI计划将o系列与GPT系列合并为GPT-5,用户将根据订阅等级自动获得不同的智能级别,从而简化模型选择,提升使用体验。

解决各种模型和名称混乱:OpenAI将简化模型并合并o系列和GPT系列模型

蓝点网
蓝点网 · 2025-02-13T02:06:04Z

本文提出了一种自动化模型合并框架,克服了手动设计超参数合并策略的局限性。该框架利用多保真近似方法,支持单目标和多目标优化,能够在有限计算成本下自动发现有效的合并方案。

Okay, I'll merge it myself: A Multi-Fidelity Framework for Automated Model Merging

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-06T00:00:00Z
逆向工程利器:轻松解码与构建 Android 应用 | 开源日报 No.492

Apktool 是用于逆向工程 Android apk 文件的工具,支持解码和重建应用资源,方便开发者调试和修改。Pixelfed 是一个道德的照片分享平台,支持 ActivityPub 协议。ton 是构建和运行 TON 区块链的代码库,兼容多种操作系统。evolutionary-model-merge 提供模型合并的优化与评估工具。

逆向工程利器:轻松解码与构建 Android 应用 | 开源日报 No.492

开源服务指南
开源服务指南 · 2025-01-25T03:17:17Z

本研究提出了LoRACLR方法,解决个性化模型合并中的属性缠结问题。该方法能够无缝整合多个LoRA模型,提升个性化图像生成能力,无需单独微调。研究结果表明,LoRACLR在准确合并多个概念方面表现优异。

LoRACLR: A Contrastive Adaptation Method for Customization of Diffusion Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-12T00:00:00Z

本研究探讨了通过回收不同训练轮次的模型检查点来优化多个任务训练的通用模型合并。研究表明,调整检查点权重的线性组合可以生成性能优于单个模型的帕累托最优模型,甚至表现不佳的检查点也能改善合并效果。

If You Can't Use Them, Recycle Them: Optimizing Large-Scale Merging to Mitigate Performance Trade-offs

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-05T00:00:00Z

论文提出了一种新方法 exttt{Pcb-Merging},通过平衡参数竞争优化模型合并,提升性能而无需额外训练。该方法评估参数的重要性和相似性,舍弃低分参数并进行重新缩放,适用于多种任务和领域,显著超越现有技术。

Pcb-Merging:无需训练的多任务模型合并方案 | NeurIPS'24 - 晓飞的算法工程笔记

晓飞的算法工程笔记
晓飞的算法工程笔记 · 2024-11-22T01:21:00Z

本研究提出Fisher合并方法,以提高模型合并的效率和性能。通过对不同数据集模型的加权平均,探讨了模型合并的潜力与挑战,并提出新的正则化方法以提升合并效果。研究结果表明,强大的基础模型和较大模型显著改善合并性能,为未来研究提供重要参考。

重新思考权重平均模型合并

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-14T00:00:00Z

本研究提出了一种新方法(ATM),通过优化任务向量选择,提高多任务学习中的模型合并效率,计算机视觉和自然语言处理任务的准确率最高可提升20%。

ATM: Improving Model Merging through Alternating Tuning and Merging

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-05T00:00:00Z

该论文研究了多目标域适应中的模型合并技术,提出在不直接访问训练数据的情况下合并独立模型。通过参数和缓冲区的合并,结果表明线性合并足以实现鲁棒性,其性能与数据组合训练相当。

Data-Free,多目标域适应合并方案,简单又有效 | ECCV'24 - 晓飞的算法工程笔记

晓飞的算法工程笔记
晓飞的算法工程笔记 · 2024-10-30T01:20:00Z

本研究提出了一种新的渐进式LoRA训练策略CopRA,旨在解决标准LoRA训练中模型快速收敛于局部最优的问题。实验结果表明,CopRA在模型合并和剪枝任务中表现优异。

CopRA:渐进式LoRA训练策略

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-30T00:00:00Z

本研究提出了一种新策略LoRM,旨在解决深度学习中模型合并的瓶颈问题。该策略在联邦持续学习中保持模型一致性,显著提升性能,并在多种场景中展现了先进成果。

Closed Merging of Parameter-Efficient Modules in Federated Continual Learning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-23T00:00:00Z

本研究提出了一种无约束模型合并框架,解决创建强大通用大语言模型的资源和数据限制问题。该框架兼容不同模型架构,专注于推理任务,通过模型合并实现了超越简单加性效果的组合推理,推动去中心化大语言模型的发展。

Unconstrained Model Merging to Enhance the Inference Capabilities of Large Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-17T00:00:00Z

本研究探讨大型语言模型在多语言环境中的安全使用,特别关注西方中心数据集的偏见问题。研究发现,目标导向的模型合并比混合数据更有效,性能提升8%,安全性提升10%。跨语言模型合并也取得显著成效,为构建强大且安全的多语言模型提供了框架。

Hybrid Data or Model Merging? Optimization for Multitask Learning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-14T00:00:00Z

本文提出了TrIm方法用于多任务模型合并,解决了模型参数干扰问题。研究展示了该方法在大型语言模型和多模态模型中的应用潜力,实验结果表明其在多个任务中表现优异,具有更高的灵活性和适应性。

模型合并中的参数竞争平衡

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-03T00:00:00Z

本研究探讨了模型合并技术,提出了Fisher合并和TrIm方法,以解决不同模型参数干扰的问题。研究表明,模型合并能显著提高准确性,并分析了权重匹配的应用。自适应随机权重平均技术也能提升泛化性能。整体而言,模型合并在多个机器学习领域具有广泛应用潜力,但仍面临挑战。

权重范围对齐:一种令人沮丧的简单模型合并方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-22T00:00:00Z

本文提出了TrIm方法(TIES-Merging),旨在解决多任务模型合并中因参数干扰导致的性能下降问题。研究表明,不同数据集间的合并模型准确性显著下降,而使用高准确性数据集可以提升合并效果。通过MuDSC框架和PLeaS算法,展示了模型合并的技术进展,并强调了其在大型语言模型和多模态模型中的应用潜力及未来研究方向。

您只需一次合并:学习基于偏好的模型合并的帕累托集

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-22T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码