机器之心 ·

模型参数作知识通用载体，MergeNet离真正的异构知识迁移更进一步

💡 原文中文，约3800字，阅读约需10分钟。

📝

内容提要

AIxiv专栏促进了学术交流，报道了2000多篇文章。研究团队提出MergeNet框架，解决了异构模型间的知识迁移问题，显著提升了跨结构、跨模态和跨任务的迁移效果。

🎯

🔎

在物联网应用中，由于设备的计算资源和任务需求差异，传统的知识迁移方法面临适配性和兼容性问题。MergeNet框架通过引入参数适配器，旨在解决这些挑战，实现跨异构模型的知识迁移。这为不同设备间的智能协作提供了新的可能性。

MergeNet的训练过程分为自学习和互学习两个阶段，强调模型在吸收外部知识的同时，巩固自身知识结构。这种设计不仅提升了知识迁移的效果，也为未来的模型训练提供了新的思路，值得研究者关注。

MergeNet在多个知识迁移场景中均显示出显著的性能提升，尤其是在跨结构和跨模态的实验中。这表明该框架在实际应用中具有较强的适应性，能够有效提升不同任务和模型间的协同能力，具有广泛的应用前景。

❓

MergeNet框架旨在建立一个跨异构模型架构、任务与模态的通用知识迁移框架。

MergeNet通过使用模型参数作为知识的通用载体，并引入参数适配器促进异构模型间知识的直接交互。

MergeNet的训练过程分为自学习和互学习两个阶段。

在跨结构知识转移实验中，MergeNet在MobileNetV2上实现了1.02%的准确率提升。

传统知识迁移方法依赖于模型结构或特定任务特征的共享元素，限制了其应用范围。

MergeNet通过引入低秩参数知识适配器，学习弥合异构模型参数空间的差距，促进知识的直接交互。

🏷️