小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
声学邻居嵌入的理论框架

本文提出了声学邻居嵌入的理论框架,解释了可变宽度音频或文本的音素内容在固定维度嵌入空间中的表示。通过定量定义词语音素相似性,提出了嵌入距离的概率解释。研究表明,该框架可用于音频和文本嵌入的最近邻搜索,分类准确率与有限状态转换器相同,并在词汇恢复和方言聚类中表现优异。所有源代码和预训练模型均已提供。

声学邻居嵌入的理论框架

Apple Machine Learning Research
Apple Machine Learning Research · 2026-04-09T00:00:00Z
瑞声科技公开人形机器人感知解决方案,释放机器人业务加速落地信号

瑞声科技在焉知机器人大会上展示了其人形机器人感知解决方案,强调机器人需具备“听得见、听得懂、能自然交互”的能力。随着行业向工程化发展,市场对供应链的要求提升,关注系统能力与稳定交付。瑞声科技将声学领域的经验应用于机器人,推动技术与业务的双重进展。

瑞声科技公开人形机器人感知解决方案,释放机器人业务加速落地信号

量子位
量子位 · 2026-03-31T06:06:40Z
覆盖天体物理/地球科学/流变学/声学等19种场景,Polymathic AI构建1.3B模型实现精确连续介质仿真

Walrus模型通过创新方法解决复杂物理系统的预测问题,参数达到13亿,涵盖多种物理场景,表现优于现有模型,具备跨领域迁移能力,推动科学AI发展。

覆盖天体物理/地球科学/流变学/声学等19种场景,Polymathic AI构建1.3B模型实现精确连续介质仿真

HyperAI超神经
HyperAI超神经 · 2026-02-03T11:59:16Z

Polymathic AI 联合研究团队提出了一个以 Transformer 为核心架构、主要面向类流体连续介质动力学的基础模型 Walrus。Walrus 在预训练阶段覆盖了 19 种高度多样化的物理场景,涵盖天体物理、地球科学、流变学、等离子体物理、声学以及经典流体力学等多个领域。结果表明,无论在下游任务的短期预测还是长期预测中,Walrus 均优于此前的基础模型。

覆盖天体物理/地球科学/流变学/声学等19种场景,Polymathic AI构建1.3B模型实现精确连续介质仿真

HyperAI超神经
HyperAI超神经 · 2026-02-03T06:17:52Z
没有这个设置,你的耳机和扬声器无法获得最佳音质

均衡器通过调整特定频率来改善音质,解决扬声器或房间声学问题。尽管现代设备多为软件驱动,均衡器仍能提升低音、中音和高音表现,满足个人听音需求。使用时需考虑设备、环境和个人听力差异,以获得最佳效果。

没有这个设置,你的耳机和扬声器无法获得最佳音质

ZDNET
ZDNET · 2026-02-02T01:02:00Z
这个30秒的调整让我再也不必在耳机和扬声器上听到平淡的音频

均衡器可调节特定频率以改善音质,解决扬声器或房间声学问题。不同类型的均衡器提供不同的调节范围,用户可根据个人喜好和设备特点进行优化。

这个30秒的调整让我再也不必在耳机和扬声器上听到平淡的音频

ZDNET
ZDNET · 2026-02-01T14:00:43Z
EchoFree—超轻量神经声学回声消除模型 | ASRU 2025

声学回声消除(AEC)是语音通信的重要技术,旨在实时分离近端语音与远端回声。西北工业大学提出的“EchoFree”模型采用超轻量级混合架构,仅需278K参数和30 MMACs计算量,适合资源受限设备,性能接近最先进的DeepVQE-S模型,为低延迟部署提供了新方案。

EchoFree—超轻量神经声学回声消除模型 | ASRU 2025

实时互动网
实时互动网 · 2025-12-08T03:07:27Z
TÜV莱茵聚焦四大核心板块,举办年度新服务发布会

德国莱茵TÜV于11月6日在深圳推出新服务,专注于机器人、人工智能和声学领域,提供智能传感测试能力和AI合规认证,推动行业标准与技术信任,提升AI产品价值。同时,介绍声学技术研发及应用,发布视觉服务战略和智能护眼服务。

TÜV莱茵聚焦四大核心板块,举办年度新服务发布会

全球TMT-美通国际
全球TMT-美通国际 · 2025-11-08T03:02:15Z

Perch团队推出的新模型通过分析音频数据加速生态监测,帮助保护濒危物种。该模型能够识别多种动物声音,适应不同环境,提高数据处理效率。自2023年发布以来,Perch已广泛应用于生物监测,帮助科学家更快识别和保护物种,特别是夏威夷的蜜雀。

人工智能如何推动生物声学科学的发展,以拯救濒危物种

Google DeepMind Blog
Google DeepMind Blog · 2025-10-24T02:30:54Z

生物声学在生物多样性保护中至关重要,深度学习逐渐取代传统信号处理方法,提高了检测与分类效率。Google的Perch 2.0模型通过优化数据集和训练策略,显著提升了物种识别能力,展现出广泛的应用前景。

覆盖近 1.5 万个物种,谷歌 DeepMind 发布 Perch 2.0,刷新生物声学分类检测 SOTA

HyperAI超神经
HyperAI超神经 · 2025-08-11T06:55:41Z

Google DeepMind与Google Research推出的Perch 2.0在物种分类的生物声学研究中取得突破,整合多种数据集,刷新BirdSET和BEANS基准测试记录。该模型利用深度学习技术提高了生物多样性监测的效率与准确性,展现出广泛应用前景。

覆盖近1.5万个物种,谷歌DeepMind发布Perch 2.0,刷新生物声学分类检测SOTA

HyperAI超神经
HyperAI超神经 · 2025-08-11T03:21:58Z

新版本的Perch AI模型通过分析生物声学数据,识别鸟类及其他动物的声音,帮助保护濒危物种。该模型适应性强,能处理复杂音频数据,支持科学家监测生态系统健康。自2023年推出以来,Perch已广泛应用于生物学研究,助力发现新物种并提高监测效率。

人工智能如何推动生物声学科学的发展以拯救濒危物种

Google DeepMind Blog
Google DeepMind Blog · 2025-08-07T14:59:00Z

本研究提出了AquaSignal,一个模块化的水下声学信号处理框架,结合深度学习技术,显著提高了噪声处理和分类的准确性。

水下声学信号:一个集成的稳健分析框架

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-20T00:00:00Z

本研究针对DCASE 2025挑战的任务五,定义了三个子集,以评估音频语言模型在复杂场景中的问答能力,旨在提升其理解与推理能力。

面向声学内容推理的多领域音频问答研究——DCASE 2025挑战

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-12T00:00:00Z
专访帝瓦雷 CEO Jacques Demont:AI 不仅对我们的产品重要,对公司每一个方面都是

帝瓦雷在中国开设首家旗舰店,展示奢华声学产品。CEO Jacques Demont 强调品牌融合时尚、科技与奢华,致力于提供独特声音体验。帝瓦雷与腾势等品牌合作,推动高端音响技术,展现多样性与生活方式特征。

专访帝瓦雷 CEO Jacques Demont:AI 不仅对我们的产品重要,对公司每一个方面都是

爱范儿
爱范儿 · 2025-04-24T10:25:48Z

本研究解决了房间脉冲响应(RIR)估计的难题,通过对外部大规模数据集进行神经声学场的预训练,提出了一种新的适应方法。主要发现是,可以利用房间几何信息或从外部数据集中检索的几何信息来提高RIR预测的准确性,从而有效改善说话者距离估计的性能。

基于检索增强预训练的神经声学场数据增强

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-19T00:00:00Z
一个未使用的核电站如何变成世界级声学实验室的家

华盛顿州的Satsop商业园曾是未完成的核电站,现在作为声学测试实验室。NWAA实验室由Ron Sauro及其妻子于2010年成立,利用厚混凝土墙体和稳定的温湿度进行声学实验,展示科学与创造力的结合。

一个未使用的核电站如何变成世界级声学实验室的家

The Verge
The Verge · 2025-04-08T14:00:00Z
基于标签变异建模语音情感及分析不同说话者和未见声学条件下的性能

自发语音情感数据通常包含感知评分,因评分者意见差异而引入标签不确定性。我们提出使用情感评分的概率密度函数作为目标,替代常用的共识评分,从而在基准评估集上取得更好表现。此外,我们探讨了基于显著性驱动的基础模型选择,以训练多任务语音情感模型,并在情感识别上展示了最先进的性能。

基于标签变异建模语音情感及分析不同说话者和未见声学条件下的性能

Apple Machine Learning Research
Apple Machine Learning Research · 2025-04-02T00:00:00Z
2025年国际声学、语音与信号处理会议(ICASSP)

苹果赞助的IEEE国际声学、语音与信号处理会议(ICASSP)将于2025年4月6日至11日在印度海得拉巴举行,展示信号处理相关研究与应用,苹果将在C3展位设立展台,欢迎参观。

2025年国际声学、语音与信号处理会议(ICASSP)

Apple Machine Learning Research
Apple Machine Learning Research · 2025-03-31T00:00:00Z

作者更换为创新GS5条形音箱,外观简约,支持多种连接,音质优秀,适合游戏和观影。RGB灯效和SuperWide技术提升体验,性价比高,值得推荐。

40年老字号,60W峰值功率的声学奇迹!小巧但不简单,创新GS5音箱

熊猫不是猫QAQ
熊猫不是猫QAQ · 2025-03-13T12:59:37Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码