Dolly 2.0是一个开源的大型语言模型,经过人类生成的指令数据集fine-tuned。数据集包含15,000个高质量的人类生成的提示/响应对,专门设计用于指令调整大型语言模型。该模型基于EleutherAI pythia模型系列,适用于商业使用。模型权重、训练代码和数据集都是开源的。Dolly 2.0表现出高质量的指令跟随行为,可用于摘要和内容生成。发布Dolly 2.0和开源数据集鼓励在人工智能领域进行评论、研究和创新。
Dolly 2.0是EleutherAI pythia模型系列的语言模型,参数为120亿。Databricks发布了名为databricks-dolly-15k的Dolly 2.0微调数据集,包含1.5万条记录,涵盖公开问答、封闭式问答、维基百科信息提取等7个任务。RedPajama是1.2万亿token的开源数据集,包含维基百科、GitHub等来源。COIG是首个大规模可商用的中文开源指令数据集。StableLM是开源语言模型,有3B和7B参数版本,应用于自然语言处理任务。还有其他可商用的模型。
完成下面两步后,将自动完成登录并继续当前操作。