Phi-3小型和中型下载地址
💡
原文中文,约1400字,阅读约需4分钟。
📝
内容提要
微软推出了Phi-3小型和中型下载地址,Phi-3小型和中型在MIT许可下可用。Phi-3小型和中型分别有128k和8k的版本。Phi-3小型击败了Mistral 7B和Llama 3 8B,中型与Mixtral 8x22B、Llama 3 70B和beats Command R+ 104B及GPT 3.5竞争。短上下文版本表现稍好,适用于资源受限环境。
🎯
关键要点
- 微软推出了Phi-3小型(7B)和中型(14B),现已在MIT许可下可用。
- Phi-3小型和中型分别有128k和8k的版本。
- Phi-3小型击败了Mistral 7B和Llama 3 8B。
- 中型与Mixtral 8x22B、Llama 3 70B、beats Command R+ 104B及GPT 3.5竞争。
- 短上下文版本表现稍好,适用于资源受限环境。
- 中型和小型的上下文长度分别为4K和128K。
- 中型参数为14B,小型参数为7.5B,Vision参数为4.2B。
- 模型在4.8T标记上进行训练,使用经过过滤的数据和合成数据。
- 短上下文版本在准确性上表现更好,适合需要关注细节的场景。
❓
延伸问答
Phi-3小型和中型的参数分别是多少?
Phi-3小型的参数为7.5B,中型的参数为14B。
Phi-3小型和中型的上下文长度是多少?
小型的上下文长度为128K,中型的上下文长度为4K。
Phi-3小型在性能上与哪些模型竞争?
Phi-3小型击败了Mistral 7B和Llama 3 8B。
中型Phi-3与哪些模型竞争?
中型Phi-3与Mixtral 8x22B、Llama 3 70B、beats Command R+ 104B及GPT 3.5竞争。
短上下文版本在什么情况下更受欢迎?
短上下文版本在准确性非常重要且不需要长上下文的情况下更受欢迎。
Phi-3模型使用了什么类型的数据进行训练?
Phi-3模型使用经过过滤的数据和合成数据进行训练。
➡️