量子位 ·

清华大学生数科技：从波形到隐空间，AudioLBM引领音频超分新范式

💡 原文中文，约2600字，阅读约需7分钟。

📝

内容提要

清华大学与生数科技合作开发了音频超分辨率模型AudioLBM，能够将低采样率音频提升至192 kHz，显著改善音质。该模型基于桥类生成模型，采用隐空间建模，提升了音频生成的效率与质量，推动了音频超分领域的发展。

🎯

关键要点

清华大学与生数科技合作开发音频超分辨率模型AudioLBM，提升低采样率音频至192 kHz。
音频超分辨率技术提升语音清晰度、音乐细节与沉浸式音频体验。
高频细节在低采样率信号中损失严重，音频生成领域面临挑战。
OpenAI推出的Sora 2模型能生成96 kHz音频，设立新技术标杆。
清华大学与生数科技在ICASSP 2025和NeurIPS 2025发表了两项成果：Bridge-SR和AudioLBM。
Bridge-SR首次将薛定谔桥模型引入语音超分任务，实现高效、高保真的语音超分。
AudioLBM在波形连续隐空间中构建低分辨率到高分辨率的隐变量桥接生成过程。
AudioLBM提出频率感知机制，实现任意采样率到任意采样率的超分过程。
级联桥类模型设计使得模型能力从48 kHz扩展至96 kHz与192 kHz。
AudioLBM在Any-to-48kHz超分任务上取得新的SOTA表现，显著提升通用性。
李畅和陈泽华为两项目的第一作者，分别来自中国科学技术大学和清华大学。

🏷️

继续阅读

AI 不只是聊天：小龙虾背后的范式变化
小龙虾（OpenClaw）展示了三种AI应用方式：聊天AI、自动化工具和AI代理。聊天AI用于回答问题，自动化工具处理流程，而小龙虾能够自主规划任务。尽管...
火星人发布了空间魔法师套系产品，这是厨电的「iPhone 时刻」吗？
火星人推出的M80和W80集成厨电产品，将12种厨房电器功能合并，解决了厨房空间不足的问题。其集成设计简化了厨房布局，提高了烹饪效率，并通过AI技术实现智...
【音视频】客户端音视频超分
超分技术在移动音视频领域提升用户体验并降低带宽成本。iOS开发者应充分利用Apple硬件，通过Core ML和Vision实现超分。面临的主要挑战包括零拷...
博云科技发布AI原生智能体平台BoClaw
博云科技于3月9日推出AI原生智能体平台BoClaw，旨在提供数据保护和技能定制。该平台支持多种操作系统，用户可快速安装，内置36项技能，涵盖文档处理和创...
基于华为开发者空间鸿蒙云手机+MaaS的鸿蒙原生智能应用开发 - 翻译助手APP
本文介绍了基于华为鸿蒙云手机和MaaS平台的翻译助手APP开发案例。开发者需使用DevEco Studio和DevEco Testing工具，远程连接云手...
摩尔线程MTVSR实时视频超分技术：让经典影像获高清“重生”
随着4K显示器的普及，720p和1080p的视频内容仍然占主导，影响观看体验。摩尔线程的MTVSR技术通过实时超分辨率提升视频清晰度，保留原始文件，支持多...

清华大学生数科技：从波形到隐空间，AudioLBM引领音频超分新范式

内容提要

关键要点

标签

继续阅读