BriefGPT - AI 论文速递 ·

在数据稀缺环境中利用 ASR 驱动的 Wav2Vec2 探索病态语音质量评估

📝

内容提要

自动语音质量评估中，由于数据稀缺，大多数研究仅在二元分类等简单任务上取得良好结果。本文提出了一种新的方法，通过采用预训练的 Wav2Vec2 架构作为语音评估中的特征提取器，将学习系统从片段级别提升至音频级别，从而建立了一个新的基准，使得只使用 95 个训练样本可以实现对可懂度和严重程度得分的预测，平均均方误差分别为 0.73 和 1.15。结果表明，基于 ASR 的 Wav2Vec2...

➡️

继续阅读

AI-DLC 在数据工程中的实践：从分层建模到数据质量的全流程协作
本文将介绍 AI-DLC（AI-Driven Development Life Cycle）——亚马逊云科技于 2025 年提出的一套开发方法论——在数据...
XMOS推出搭载先进AI语音处理的VocalFusion XVF3620
XMOS 发布了新一代语音处理器 VocalFusion XVF3620，它将 AI 降噪技术与完整的片上语音处理流程相结合，即使在嘈杂、混响和动态环境中...
数据显示：世界杯直播观看量比2022年增长473%
Everyone TV 公布的 Barb 收视数据显示，通过宽带观看 2026 年 FIFA 世界杯的人数显著增加，凸显了英国持续向互联网电视转型。 Ba...
涛思数据TDengine升级为AI原生工业数据平台
（全球TMT 2026年07月22日讯）涛思数据宣布TDengine产品重大升级，从高性能时序数据库正式演进为 […]
角落新声｜我的上帝模式，一名设计师创作环境的演变
声音只是其中一个切片。客观来看，它记录的是我的创作环境如何不断迭代；但从个人经历来看，它真正映照的是我对创作这件事的理解如何变化。查看全文
澳鹏数据已连续八届深度参与世界人工智能大会
(全球TMT 2026年07月21日讯)2026年7月17日至20日，2026世界人工智能大会暨人工智能全球治 […]