DataStax与Wikimedia合作,通过NeMo Retriever技术将数据处理速度提升10倍,支持全球用户。该技术可实现多语言信息检索,帮助企业构建高效的生成式AI系统,提升数据存取效率,确保实时更新,增强全球可访问性。
介绍了一个新的多说话人英语数据集,用于训练文本转语音模型。该数据集基于公共领域的LibriVox有声读物和Project Gutenberg文本书籍,包含10个说话者的约292小时的语音样本。数据集已公开发布。
完成下面两步后,将自动完成登录并继续当前操作。