【中文Llama-3】Chinese-LLaMA-Alpaca-3开源大模型项目正式发布

💡 原文中文,约2500字,阅读约需6分钟。
📝

内容提要

中国LLaMA-Alpaca-3开源大模型项目发布,包括Llama-3-Chinese-8B和Llama-3-Chinese-8B-Instruct模型。这些模型使用中文数据进行预训练和精调,提升了中文语义和指令理解能力。模型已在多个平台上线。

🎯

关键要点

  • 中国LLaMA-Alpaca-3开源大模型项目发布,包含Llama-3-Chinese-8B和Llama-3-Chinese-8B-Instruct模型。
  • 模型使用大规模中文数据进行增量预训练和高质量指令数据精调,提升中文语义和指令理解能力。
  • 相关模型已在多个平台上线,包括Hugging Face、ModelScope等,并提供GGUF量化版本。
  • Llama-3模型于2024年发布,包含8B和70B两种大小,未来将开放400B+模型。
  • 中文Llama-3项目推出8B模型版本,基于Llama-3进行增量中文训练。
  • Llama-3-Chinese-8B-Instruct模型通过500万高质量指令进行精调。
  • Llama-3原生词表从32K提升至128K,编码效率显著提升。
  • 项目提供多种工具和教程,支持用户快速体验和部署大模型。
  • 模型在线对战平台可评测模型回复质量,提供胜率和Elo评分等指标。
  • 开源部分指令数据,包括Alpaca指令数据和STEM指令数据,供用户下载。
  • 相关项目链接提供了中文羊驼大模型一期、二期和Mixtral大模型的访问地址。
➡️

继续阅读