基于Mindspore2.0的GPT2预训练模型迁移教程
原文中文,约15700字,阅读约需38分钟。发表于: 。这篇文章主要目的是为了让大家能够清楚如何用MindSpore2.0来进行模型的迁移。
MindSpore是一个全场景深度学习框架,支持第三方前端,提供ModelZoo、Extend、Science、Expression、Data、Compiler、Runtime、Insight、Armour等功能,期待更多开发者参与。网络迁移指的是把参考源码中所使用的框架API替换为MindSpore中的API,可以参考MindNLP中的Bert模型迁移代码,但需要注意hugging face自封装的类别和函数以及API参数的差异。