小红花·文摘 - 小红花技术领袖俱乐部

本文探讨了如何通过频谱图分析音乐文件的真实性，特别是无损和高解析度音频。使用ffmpeg生成频谱图，比较真实与伪造音频的特征，揭示许多高解析度音频实际上只是普通CD音质的升频版本。

一日一技｜用频谱分析找出「假无损」音乐

少数派 ·

从声音到句子：探究现代语音模型的工作原理

从声音到句子：探究现代语音模型的工作原理

实时互动网 ·

本文提出了一种具有选择性听觉机制的目标讲话者定位算法，通过给定目标讲话者的参考语音，消除干扰讲话者的语音，在经过长短期记忆网络提取过滤后的频谱图中的目标讲话者的位置。实验证实了该方法在不同尺度不变信噪比条件下相比现有算法的优越性。

LocSelect: 带有听觉选择性听觉定位机制的目标说话人定位

BriefGPT - AI 论文速递 ·

该研究设计了适用于时间序列和频谱图输入表示的编码器-预测器体系结构，并在SHHS数据集上显著提高了性能。这些体系结构的见解对于未来的睡眠分期研究和其他时间序列注释任务具有相关性。

S4Sleep: 深度学习基于睡眠阶段分类模型的设计空间阐明

BriefGPT - AI 论文速递 ·