小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
自我反思的不确定性:大型语言模型是否了解其内部答案分布?

本文探讨了通过双向长短期记忆网络(bi-LSTM)提高语言识别准确性的方法。研究表明,该方法在字符级别处理语言识别,错误率降低15%至60%,模型大小减少40%至80%。这改善了苹果平台的多语言输入体验,提升了自动纠正和预测功能。

自我反思的不确定性:大型语言模型是否了解其内部答案分布?

Apple Machine Learning Research
Apple Machine Learning Research · 2025-07-11T00:00:00Z

本研究提出了SLIDE数据集和多标签语言识别模型,旨在解决斯堪的纳维亚语言的多标签识别问题,强调同时识别多种语言对提高识别准确性的重要性。

Multi-Label Scandinavian Language Recognition (SLIDE)

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-10T00:00:00Z

本研究探讨了低资源德拉威语中的词级语言识别挑战,特别是代码混合现象。研究表明,Kanna模型在准确性和可靠性上优于Tam文本模型,揭示了不同德拉威语在语言识别中的表现差异,具有实际应用价值。

Prompt Engineering Using GPT for Word-Level Code-Mixed Language Identification in Low-Resource Dravidian Languages

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-06T00:00:00Z

本研究介绍了AfriHuBERT模型,通过在6500小时语音数据上继续预训练,将支持的非洲语言从16种扩展到39种。结果显示,该模型在语言识别和自动语音识别任务中表现更佳,并指出现有评估基准对低资源非洲语言的数据质量需改进。

AfriHuBERT: A Self-Supervised Speech Representation Model for African Languages

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-30T00:00:00Z

本研究探讨了编码层、池化层和损失函数在语音说话人和语言识别系统中的作用,开发了一个可解释的端到端系统,显著提升了性能。提出了基于CNN的说话人识别模型及多种改进方法,实验结果在不同数据集上表现优异,特别是在特征提取和模型架构方面取得了显著进展。

预训练模型多层特征的通用池化方法用于扬声器验证

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-12T00:00:00Z

本文探讨了跨语言预训练和迁移学习在多语言任务中的应用,提出多种方法以提高零样本情况下的语言识别和主题预测准确性。实验结果表明,这些方法在低资源语言上表现优异,推动了跨语言转移学习的发展。

跨语言迁移学习的语音翻译

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-01T00:00:00Z

本文探讨了利用卷积神经网络和多标签方法构建高效的口语语种识别模型,实验结果表明该模型在速度和稳健性上优于现有方法。同时,研究还涉及基于注意力机制的语言识别、改进的循环神经网络模型及多语言混杂的优化方案,展示了在不同语音识别任务中的高准确率和有效性。

探索多语种广播和机构演讲自动转写的口语语言识别策略

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-13T00:00:00Z

本文研究了多语言混合环境下的语言识别技术,提出了基于深度学习的模型和数据增强策略,显著提高了低资源语言和短语音段的识别准确性,推动了相关技术的发展。

MaskLID:通过迭代遮盖进行的代码切换语言识别

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-10T00:00:00Z

本文探讨了 Transformer 编码器的计算模型及其在语言识别和序列转换任务中的应用。研究表明,Transformer 通过自注意力和前馈层的特性,能够有效逼近复杂序列关系,并在高维数据上表现出优越性。实验结果显示,Transformer 在音素识别和语言处理任务中显著优于传统 RNN 模型。

变压器作为传感器

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-02T00:00:00Z

基于连接主义时间分类(CTC)的新型仅编码器语音模型(OWSM-CTC)在多语言自动语音识别(ASR),语音翻译(ST)和语言识别(LID)任务上取得了有竞争力的结果,并在ST上提高了25%的相对改进。该模型在推断中更为稳健且速度更快,同时也对长形式ASR结果有20倍的加速。

OWSM-CTC:一种用于语音识别、翻译和语种识别的开放式编码器语音基础模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-20T00:00:00Z

本研究使用BERT和Google Translate API解决了转写文本的语言识别挑战,为数字通信的多样化语言环境提供了突破。通过创新方法和前沿技术,为内容审核、分析和全球互联的有意义对话社区提供了希望。

音译内容的语言检测

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-09T00:00:00Z

本文研究使用不同方法进行阿拉伯语方言识别,使用多类支持向量机综合这些特征,在阿拉伯语/英语语言识别任务中获得100%的准确率。研究释放了数据作为方言识别的标准语料库。

阿拉伯方言识别审视:单标签分类的局限性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-20T00:00:00Z

该论文提出了一种面向低资源语言的强大的视觉语音识别方法,使用Whisper模型进行语言识别和基于音频的语音识别,从而在没有人工注释的情况下获得与人工注释标签相似的VSR性能,并提供了大规模无标注多语言数据库的自动标签。

利用 Whisper 模型的自动标签实现低资源语种的视觉语音识别

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-15T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码