小红花·文摘 - 小红花技术领袖俱乐部

移远通信推出智能睡眠声学解决方案SleepHub

移远通信推出智能睡眠声学解决方案SleepHub

全球TMT-美通国际 ·

火山引擎联合中科院声学所在 ICASSP 首届低资源音频编解码器挑战赛中取得佳绩

火山引擎联合中科院声学所在 ICASSP 首届低资源音频编解码器挑战赛中取得佳绩

实时互动网 ·

2026年国际声学、语音与信号处理会议（ICASSP）

2026年国际声学、语音与信号处理会议（ICASSP）

Apple Machine Learning Research ·

声学邻居嵌入的理论框架

声学邻居嵌入的理论框架

Apple Machine Learning Research ·

瑞声科技公开人形机器人感知解决方案，释放机器人业务加速落地信号

量子位 ·

覆盖天体物理/地球科学/流变学/声学等19种场景，Polymathic AI构建1.3B模型实现精确连续介质仿真

覆盖天体物理/地球科学/流变学/声学等19种场景，Polymathic AI构建1.3B模型实现精确连续介质仿真

HyperAI超神经 ·

Polymathic AI 联合研究团队提出了一个以 Transformer 为核心架构、主要面向类流体连续介质动力学的基础模型 Walrus。Walrus 在预训练阶段覆盖了 19 种高度多样化的物理场景，涵盖天体物理、地球科学、流变学、等离子体物理、声学以及经典流体力学等多个领域。结果表明，无论在下游任务的短期预测还是长期预测中，Walrus 均优于此前的基础模型。

覆盖天体物理/地球科学/流变学/声学等19种场景，Polymathic AI构建1.3B模型实现精确连续介质仿真

HyperAI超神经 ·

没有这个设置，你的耳机和扬声器无法获得最佳音质

没有这个设置，你的耳机和扬声器无法获得最佳音质

ZDNET ·

这个30秒的调整让我再也不必在耳机和扬声器上听到平淡的音频

这个30秒的调整让我再也不必在耳机和扬声器上听到平淡的音频

ZDNET ·

EchoFree—超轻量神经声学回声消除模型 | ASRU 2025

EchoFree—超轻量神经声学回声消除模型 | ASRU 2025

实时互动网 ·

TÜV莱茵聚焦四大核心板块，举办年度新服务发布会

TÜV莱茵聚焦四大核心板块，举办年度新服务发布会

全球TMT-美通国际 ·

Perch团队推出的新模型通过分析音频数据加速生态监测，帮助保护濒危物种。该模型能够识别多种动物声音，适应不同环境，提高数据处理效率。自2023年发布以来，Perch已广泛应用于生物监测，帮助科学家更快识别和保护物种，特别是夏威夷的蜜雀。

人工智能如何推动生物声学科学的发展，以拯救濒危物种

Google DeepMind Blog ·

生物声学在生物多样性保护中至关重要，深度学习逐渐取代传统信号处理方法，提高了检测与分类效率。Google的Perch 2.0模型通过优化数据集和训练策略，显著提升了物种识别能力，展现出广泛的应用前景。

覆盖近 1.5 万个物种，谷歌 DeepMind 发布 Perch 2.0，刷新生物声学分类检测 SOTA

HyperAI超神经 ·

Google DeepMind与Google Research推出的Perch 2.0在物种分类的生物声学研究中取得突破，整合多种数据集，刷新BirdSET和BEANS基准测试记录。该模型利用深度学习技术提高了生物多样性监测的效率与准确性，展现出广泛应用前景。

覆盖近1.5万个物种，谷歌DeepMind发布Perch 2.0，刷新生物声学分类检测SOTA

HyperAI超神经 ·

新版本的Perch AI模型通过分析生物声学数据，识别鸟类及其他动物的声音，帮助保护濒危物种。该模型适应性强，能处理复杂音频数据，支持科学家监测生态系统健康。自2023年推出以来，Perch已广泛应用于生物学研究，助力发现新物种并提高监测效率。

人工智能如何推动生物声学科学的发展以拯救濒危物种

Google DeepMind Blog ·

本研究提出了AquaSignal，一个模块化的水下声学信号处理框架，结合深度学习技术，显著提高了噪声处理和分类的准确性。

水下声学信号：一个集成的稳健分析框架

BriefGPT - AI 论文速递 ·

本研究针对DCASE 2025挑战的任务五，定义了三个子集，以评估音频语言模型在复杂场景中的问答能力，旨在提升其理解与推理能力。

面向声学内容推理的多领域音频问答研究——DCASE 2025挑战

BriefGPT - AI 论文速递 ·

专访帝瓦雷 CEO Jacques Demont：AI 不仅对我们的产品重要，对公司每一个方面都是

专访帝瓦雷 CEO Jacques Demont：AI 不仅对我们的产品重要，对公司每一个方面都是

爱范儿 ·

本研究解决了房间脉冲响应（RIR）估计的难题，通过对外部大规模数据集进行神经声学场的预训练，提出了一种新的适应方法。主要发现是，可以利用房间几何信息或从外部数据集中检索的几何信息来提高RIR预测的准确性，从而有效改善说话者距离估计的性能。

基于检索增强预训练的神经声学场数据增强

BriefGPT - AI 论文速递 ·

一个未使用的核电站如何变成世界级声学实验室的家

一个未使用的核电站如何变成世界级声学实验室的家

The Verge ·