小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
Interspeech 2026 第二届音频编码器能力挑战赛正式启动

国际语音会议Interspeech 2026将于2026年9月在悉尼举行,期间将举办音频编码器能力挑战赛(AECC)。比赛聚焦音频编码器在复杂场景下的表现,参赛者需提交预训练模型,主办方提供评估系统。参赛者可使用公开数据集,报名截止日期为2026年1月25日。

Interspeech 2026 第二届音频编码器能力挑战赛正式启动

实时互动网
实时互动网 · 2025-12-16T01:55:24Z

At Interspeech 2025, Bloomberg's AI engineers explore how they adapted OpenAI's Whisper system into a true streaming automatic speech recognition (ASR) model that delivers real-time CPU...

Bloomberg’s AI Researchers Turn Whisper into a True Streaming ASR Model at Interspeech 2025

Bloomberg L.P.
Bloomberg L.P. · 2025-08-18T22:45:58Z
Interspeech 2025

苹果将在2025年8月17日至21日于荷兰鹿特丹的Interspeech大会上展示语言处理技术的新成果,并设立展位欢迎参观。

Interspeech 2025

Apple Machine Learning Research
Apple Machine Learning Research · 2025-08-12T00:00:00Z
Interspeech 2025

苹果将在2025年8月17日至21日于荷兰鹿特丹的Interspeech大会上展示语言处理技术,设立展位并举办多场研讨会和活动。

Interspeech 2025

Apple Machine Learning Research
Apple Machine Learning Research · 2025-08-12T00:00:00Z

本研究提出了一种结合超声声响与机器学习的新方法,用于小鼠自闭症谱系障碍(ASD)的检测,显示出良好的分类效果,为ASD检测开辟了新方向。

MAD-UV:首届INTERSPEECH小鼠自闭症通过超声声响检测挑战

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-08T00:00:00Z
推动多语言语音科技迈向新高度:INTERSPEECH 2025 ML-SUPERB 2.0 挑战赛

随着语音技术的发展,全球语言多样性面临挑战。卡内基梅隆大学等机构推出ML-SUPERB 2.0挑战赛,旨在推动多语言语音技术,提供141种语言的语音数据,特别关注小众语言,确保技术公平应用。

推动多语言语音科技迈向新高度:INTERSPEECH 2025 ML-SUPERB 2.0 挑战赛

机器之心
机器之心 · 2025-01-07T06:49:00Z
Interspeech 2024

苹果赞助2024年9月1日至5日在希腊科斯举行的第25届Interspeech大会,专注于语言处理技术的研究。会议期间,苹果将在Kipriotis酒店展位展示与语音识别相关的研究和工具。

Interspeech 2024

Apple Machine Learning Research
Apple Machine Learning Research · 2024-08-16T00:00:00Z

该研究评估了基于Transformer的语音表示模型在多语言语音情感识别中的性能,发现使用最优层特征可降低错误率32%。在德语和波斯语中取得了最新成果,强调中间层对情感信息捕捉的重要性,并提出了多预训练模型和特征增强方法,以提升情感识别的准确率。

INTERSPEECH 2009 情感挑戰重探:在語音情感識別領域 15 年的進展基準

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-10T00:00:00Z

本文探讨了语音识别和生成系统的研究进展,重点关注印度语言的ASR模型和视觉语音识别系统的表现。研究表明,离散单元在语音处理中的有效性,以及通过不同技术提高识别准确率的潜力。

Interspeech 2024 离散语音单元挑战中的语音处理技术报告

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-09T00:00:00Z

Interspeech 2023收录了火山引擎流媒体音频团队的4篇研究论文,涵盖了语音增强、基于AI编解码、回声消除和无监督自适应语音增强等领域。他们在无监督自适应语音增强方面获得了CHiME挑战赛冠军。此外,他们还提出了轻量级语音谐波增强方法、端到端神经网络音频编码器、回声消除方法和无监督域自适应语音增强系统。

Interspeech 2023 | 火山引擎流媒体音频技术之语音增强和AI音频编码

字节跳动技术团队官方博客
字节跳动技术团队官方博客 · 2023-09-01T03:01:22Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码