本研究解决了开放源语言模型开发中的数据挑战,发布了RedPajama-V1和V2数据集,提供超过100万亿条高质量文本数据,推动语言模型的透明与高效发展。
完成下面两步后,将自动完成登录并继续当前操作。