小红花·文摘

本研究提出了一种基于时间差编码器（TDE）的低功耗嵌入式系统关键词检测方法。TDE网络在准确性和效率上优于其他脉冲神经网络，能够以更少的突触操作实现更高的检测精度。

Efficient Keyword Detection Based on Spiking Time Difference Encoders

BriefGPT - AI 论文速递 ·

本研究提出了一种新网络架构Centaurus，旨在优化状态空间模型（SSM）的训练效率，从而提升关键词检测、语音降噪和自动语音识别等音频处理任务的性能。

Making State-Space Models Convolutional Networks: State-Space Modeling with Optimal Tensor Contractions

BriefGPT - AI 论文速递 ·

基于命名实体识别的准确幻觉检测

DEV Community ·

本文探讨了关键词检测技术的进展，重点介绍了深度学习和少样本学习的方法，提出了多语言关键词检测系统和基于示例查询的检测系统，显著提升了识别性能和鲁棒性，适用于多种声学环境。

GE2E-KWS：用于零-shot关键词识别的通用端到端训练和评估

BriefGPT - AI 论文速递 ·

本研究评估了在资源受限微控制器上运行的关键词检测神经网络架构。通过优化，提升了准确性并降低了存储和计算需求。深度可分离卷积神经网络（DS-CNN）实现了95.4%的准确率，并提出了新架构和自监督学习方法，显著提高了关键词检测性能，适用于低功耗设备。

超低功耗音频传感器的个性化关键词识别自学习

BriefGPT - AI 论文速递 ·

本文探讨了语义标记的最佳配置及其在音频应用中的性能提升，提出了SpeechTokenizer用于语音大型语言模型的训练。研究表明，儿童语音识别系统的性能接近传统方法，且参数减少约83%。此外，介绍了关键词检测系统的数据集及其挑战，并提出了TokenSplit模型用于语音分离，展示了其在分离和转录任务中的优越性能。

DASB -- 离散音频和语音基准

BriefGPT - AI 论文速递 ·

本文提出了一种新颖的用户定义关键词检测方法，结合语音和文本序列，通过注意力机制实现跨模态匹配，提升了在嘈杂环境中的稳健性。同时，研究探讨了多语言关键词检测系统及深度学习在语音识别中的应用，提出多种模型和方法以提高关键词检测的准确性和效率。

MM-KWS: 多模态用户定义多语言关键词检测

BriefGPT - AI 论文速递 ·

本文探讨了多语言预训练模型 wav2vec 2.0 的微调方法，以提升无监督语音识别的音素和单词识别能力。研究表明，通过在 IPA 音素转写上微调，某些语言的单词错误率可低于 20%。此外，KWS-Net 结构在关键词检测上表现优异，且在无音频情况下也能有效工作，展示了无标签语音数据在语音识别中的应用潜力。

零封多语言口语关键词识别的通用语言特征建模

BriefGPT - AI 论文速递 ·