BriefGPT - AI 论文速递 ·

Speech Wikimedia：一个包含 77 种语言的多语言语音数据集

💡 原文中文，约300字，阅读约需1分钟。

📝

内容提要

介绍了一个新的多说话人英语数据集，用于训练文本转语音模型。该数据集基于公共领域的LibriVox有声读物和Project Gutenberg文本书籍，包含10个说话者的约292小时的语音样本。数据集已公开发布。

🎯

🏷️

在线教程｜阿里千问团队开源首个原生语言世界模型，一个模型打通终端、网页与手机智能体交互
阿里巴巴推出的「Qwen-AgentWorld-35B-A3B」模型在AgentWorldBench评测中超越Claude Sonnet 4.6。该模型专...
OpenAI发布全新语音模型，实现更自然的实时对话
OpenAI于2026年推出了新对话模型GPT-Live-1和GPT-Live-1 mini，旨在提升自然对话体验。这些全双工模型支持实时翻译和长时间对话...
如果肿瘤和体检报告其实是使用同一种语言呢？
一项新研究表明，限制糖分摄入并采用生酮饮食可显著延长胶质母细胞瘤患者的生存期，从14.7个月提高到21.5个月。研究强调癌细胞对葡萄糖的依赖，提出通过代谢...
ChatGPT升级的语音模式更擅长保持安静
OpenAI推出了新的GPT-Live-1语音模型，能够实时说话和倾听，减少打断。该模型支持实时翻译和AI生成的视觉信息，具备内置安全措施，确保适龄回答。...
流处理与批处理：数据处理的两种哲学
When is the data complete enough to be moved to the compute stage?
SharePoint Copilot 应用现已进入公开预览：在 Microsoft 365 Copilot 中从意图到行动
SharePoint Copilot Apps are now in public preview, introducing a new way to b...