小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

作者分享了与口吃斗争的经历,强调与AI互动如何减轻表达焦虑。通过AI的支持,他逐步克服沟通障碍,提升表达能力,最终实现自信交流。

用 AI 帮我改善口吃:一段关于自我和解的旅程

少数派
少数派 · 2025-10-07T07:00:00Z

本文介绍了博利项目,旨在解决印度语言中口吃语音数据稀缺的问题,构建了多语种口吃语音数据集,包含匿名元数据、问卷回应及朗读、自发言语记录,并详细注释五种口吃类型,为相关研究和技术发展提供了重要资源。

Boli: Understanding Stuttering Experiences and Analyzing Stuttering Speech Dataset

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-27T00:00:00Z

本文介绍了一种基于声学特征的口吃检测模型StutterNet,采用深度学习技术,平均漏诊率为10.03%。研究还探讨了结合音频和视频数据的多模态故障检测方法,显著提高了检测性能。通过多任务学习和注意力机制,提出了改进的口吃检测系统,展示了其在多语言和跨语料库环境中的有效性。

MMSD-Net:面向多模态口吃检测

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-16T00:00:00Z

近年来,深度学习在口吃症言语识别方面取得了显著进展。研究提出了一种全自动方法,结合连续时间分类和编码器-解码器模型,能够准确识别语音异常,区分失语症患者与健康人群,漏诊率仅为10.03%。此外,研究还探讨了多任务学习和声学特征在口吃分类中的应用,显示出良好的准确性和实时性。

优化多重口吃语音分类:利用 Whisper 的编码器实现自动评估中高效参数减少

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-09T00:00:00Z

本研究使用wav2vec 2.0模型对发音困难症声学语音信号进行自动检测和严重程度分类,结果表明使用wav2vec模型的嵌入特征在准确度和严重程度分类任务中均有提升。

基于 Wav2vec 的言语智能识别与严重程度分类 —— 以口吃为例

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-25T00:00:00Z

本文通过多阶段增强方法改进阿拉伯语言障碍患者的自动语音识别性能。方法包括生成阿拉伯语言障碍患者的语音,通过对英语语言障碍患者语音数据进行训练进行多语言扩充,以及在不同的语音障碍程度下进行微调和文本纠正策略。实验结果显示,在阿拉伯语言障碍患者的语音数据集上,词错误率为18%,字符错误率为17.2%。相比只针对健康数据训练的基础模型,实现了81.8%的词错误率提升,并在真实的英文语言障碍患者语音数据集上实现了124%的词错误率提升。

为 ASR 数据增强精确合成口吃病患者语音

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-08-16T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码