小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
SHAC 开源全球首个适用于 Web 和桌面端的交互式空间音频格式

2025年11月14日,SHAC团队发布全球首个开源交互式空间音频格式,支持六自由度操控,用户可通过普通耳机在三维音频环境中自由移动。该格式结合Ambisonics技术,适用于音乐、游戏和教育等领域,具有高效播放和低延迟的特点。开发者Zyz希望通过SHAC培养创作者社群,推动技术发展。

SHAC 开源全球首个适用于 Web 和桌面端的交互式空间音频格式

实时互动网
实时互动网 · 2025-11-14T03:30:21Z
基于波形域神经网络的Ambisonics超分辨率

本文介绍了一种基于卷积时间域音频神经网络(Conv-TasNet)的数据驱动空间音频解决方案,能够将一阶Ambisonics(FOA)输入转换为高阶Ambisonics(HOA)输出。该方法在空间准确性上优于传统渲染器,量化评估显示预测与实际第三阶HOA之间的平均位置均方误差为0.6dB,感知质量提高了80%。

基于波形域神经网络的Ambisonics超分辨率

Apple Machine Learning Research
Apple Machine Learning Research · 2025-08-04T00:00:00Z
苹果公司与罗切斯特大学联合开发生成式空间音频模型,进一步提升沉浸式体验

ImmerseDiffusion是一种新型生成音频模型,能够根据空间、时间和环境条件生成高质量的3D沉浸式音景。该模型专注于一阶Ambisonics音频,支持描述性和参数化模式,适用于电影和游戏等场景,表现出色,具有广泛应用前景。

苹果公司与罗切斯特大学联合开发生成式空间音频模型,进一步提升沉浸式体验

实时互动网
实时互动网 · 2025-02-18T01:56:07Z

本研究提出了一种统一框架,用于盲目估计Ambisonics录音中的频段声学参数,包括混响时间(T60)、直接与混响比(DRR)和清晰度(C50)。新特征SSCV显著提高了估计精度,FOA-Conv3D网络在估计错误上优于现有方法。

盲估计基于Ambisonics录音的子带声学参数:通过光谱空间协方差特征

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-05T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码