Mistral 7B v0.1 是一个70亿参数的语言模型,采用新技术提高推理效率,表现优于Llama 2 13B。Baichuan 2系列模型在多个基准测试中表现出色,支持医学和法律领域。Skywork-13B和OpenBA模型通过创新训练方法提升性能,并发布开放资源,推动LLM研究。
Skywork-13B是一个基于3.2万亿标记训练的大型语言模型系列,采用两阶段训练方法,表现出色,并发布了SkyPile语料库。同时,提出了一种新颖的泄漏检测方法,证明测试数据污染是一个迫切需要LLM社区进一步研究的问题。
完成下面两步后,将自动完成登录并继续当前操作。