实时互动网 ·

Google AI 发布 WAXAL：用于训练自动语音识别和文本转语音模型的多语言非洲语音数据集

💡 原文中文，约1400字，阅读约需4分钟。

📝

内容提要

WAXAL是一个开放的多语言语音数据集，涵盖24种非洲语言，专为自动语音识别（ASR）和文本转语音（TTS）设计。ASR部分通过图像提示自然采集语音，TTS部分在录音棚中高质量录制，确保语音一致性。

🎯

🏷️

Perplexity iOS AI 浏览器 Comet 已上架，可让 AI 控制访问网页
Perplexity Pro 账号重新上线，iOS 浏览器 Comet 已上架 App Store。Comet 支持直接打开网页、跨标签页提问和语音模式，...
苹果 iPhone、iPad 和 Mac 上的 AI 白噪音软件：Endel
我试用了同事推荐的白噪音软件Endel，支持多种苹果设备，界面简洁，声音效果出色，曾获苹果年度最佳应用奖。
Ultralytics Platform发布，全面简化视觉AI工作流程
Ultralytics平台于3月18日发布，整合视觉AI生命周期，提供数据标注、模型训练和快速部署功能。核心包括智能数据标注、YOLO模型训练、灵活部署方...
代理式AI为网络和设备带来全新要求
InterDigital与ABI Research发布报告，指出代理式AI将在未来三年显著提升应用率，产生大量上行数据，可能导致网络过载。行业需转向分布式...
小米神操作！认领榜一神秘模型Hunter Alpha，龙虾之父都忍不住打听
小米发布了万亿参数的旗舰模型MiMo-V2-Pro，取代Hunter Alpha，表现优异，支持长文本和复杂任务，全球智能指数排名第八，代码能力超越Cla...
基于 AI 的 Amazon EKS 事件响应
AWS DevOps Agent 是一款全托管的 AI 代理，能够主动解决和预防事件，提升 AWS 和多云环境中应用的可靠性与性能。它通过分析 Kuber...