研究推出了BeanCounter,一个包含1590亿个令牌的公共数据集,专注于商业公开信息。与网络数据集相比,BeanCounter的数据更真实、毒性更低,并在金融领域表现更好。这为训练大型语言模型提供了高质量、低毒性的领域特定数据源。
完成下面两步后,将自动完成登录并继续当前操作。