小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究提出了一种基于音段语音声学特征的深伪音频检测方法。这些特征与人类发音过程密切相关,难以被深伪模型复制。研究结果表明,某些音段特征在识别深伪音频方面表现优异,为法医学音频检测提供了新思路。

Forensic Deepfake Audio Detection Based on Segmental Speech Features

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-20T00:00:00Z

本研究提出了一种基于最佳运输的图匹配方法(GM-OT),旨在解决从预训练语言模型向声学特征学习转移语言知识时的对齐挑战。该方法通过将语言和声学序列建模为结构化图,提升了知识迁移效率,显著提高了自动语音识别模型的性能。

Cross-modal Knowledge Transfer Learning for Automatic Speech Recognition Based on Optimal Transport Graph Matching

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-19T00:00:00Z

本研究探讨了语音转换中的关键问题,即如何有效地将一个说话者的声学特征转换为另一个,同时保持语言内容的完整性。文章整合了生成对抗网络在语音转换中的应用,评估了当前技术挑战及潜在解决方向,以推动更高质量的语音合成技术发展。

基于生成对抗网络的语音转换:技术、挑战与最新进展

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-27T00:00:00Z
探索语音基础模型掩码预训练中的预测目标

语音基础模型HuBERT通过无标签语音数据预训练,采用掩码预测目标学习信息。预测目标的选择影响下游任务表现,细粒度声学特征模型在去噪任务中表现优异,而高层次抽象模型适合内容相关任务。尽管预测目标重要,但相关设计选择尚未深入研究。本文探讨这些设计选择及其对下游任务的影响,提出更具信息性的预测目标,并展示其在多项任务中的有效性。

探索语音基础模型掩码预训练中的预测目标

Apple Machine Learning Research
Apple Machine Learning Research · 2025-03-14T00:00:00Z

本研究探讨了乐器音色形容词与声学特征之间的矛盾,构建了数据集并通过音频调整获得专家标注,揭示了形容词评分与频谱特征的相关性。

Can It Vibrate? A Data-Driven Understanding of Guitar Timbre

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-16T00:00:00Z

本文探讨了利用神经网络从单幅图像生成音响脉冲响应的方法,以便更便捷地测量空间声学特征。介绍了新颖的音频环境建模技术,如NACF和AV-RIR,提升了声源定位和去混响效果。同时,研究提出了SoundCam和Real Acoustic Fields数据集,为音频与视觉结合的研究提供了数据支持。

HARP:大规模高阶Ambisonic房间脉冲响应数据集

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-21T00:00:00Z

该系统利用声学、认知和语言特征,通过神经网络检测阿尔茨海默病及其严重程度。在ADReSS数据集上精度为83.3%,在DementiaBank Pitt数据库上精度为88.0%,验证了无意识语音的通用性。

监督式多模态分裂学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-30T00:00:00Z

本研究探讨了讽刺的声学特征、讽刺用语使用的倾向和韵律线索之间的相互作用。研究发现,当讽刺意义明显时,韵律线索的相关性较低。此外,还有其他研究探讨了讽刺解释、情感识别和讽刺检测等相关主题。

传达讽刺的韵律与语义线索之间的功能权衡

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-27T00:00:00Z

本文介绍了一种利用深度递归神经网络识别语音情感的方法,通过训练声学特征并采用特殊的概率性CTC损失函数,该方法在长语音片段中考虑了情感和中性部分,展示了高质量的结果。

RE-ENACT:使用 Actor-Critic 策略进行情感语音生成的强化学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-04T00:00:00Z

综述了帕金森病识别的综合方法,重点介绍了机器学习和数据驱动方法的进展。研究发现,声学特征和先进的机器学习技术能够有效区分帕金森病患者和健康对照组。总结了不同模型的比较,确定了最有效的识别方法,并提出了未来研究的潜在方向。

利用声学分析和机器学习进行早期帕金森病识别

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-22T00:00:00Z

该研究使用BOSS观察了264,283个星系,通过声学特征探测测定了距离约为2094+/-34 Mpc,对宇宙学距离梯形和模型研究具有重要意义。

基于 DESI DR1 BAO 测量的模型无关宇宙学推论

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-29T00:00:00Z

使用端到端的自动语音识别模型代替传统的语音活动检测器,在处理长音频时表现更好,提供更好的声学特征和语义特征。实验结果显示,相比于传统方法,改进了8.5%的相对WER和减少了250ms的分割延迟。

通过联合建模主要和非主要发言者改善长篇语音识别

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-12-18T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码