多个来源胜过一个：在低资源词汇标注中整合外部知识

原文中文，约400字，阅读约需1分钟。发表于：。

通过协调多个语言专业知识源，我们解决了低资源语言自动数据驱动预览中的数据稀缺问题，并在词级准确性方面获得了 5 个百分点的平均绝对改进，对横跨六种低资源语言的多样化数据集而言，这些增强在最低资源的 Gitksan 语言中表现尤为明显，我们实现了 10 个百分点的改进。此外，在相同六种语言的模拟超低资源环境中，仅在少于 100 个含义标注句子上训练下，我们在词级准确性方面获得了 10...

本研究通过在资源稀缺环境中使用插入式脚注和嵌入式翻译信息来增强神经模型，模型在 SIGMORPHON 2023 共享任务数据集上表现优于现有技术水平。仅使用 100 个句子进行训练时，模型在极度资源稀缺环境中平均改善了 9.78 个百分点。研究结果突显了翻译信息在提升系统性能方面的关键作用，为语言的记载和保护提供了有希望的途径。

SIGMORPHON 2023 共享任务嵌入式翻译信息插入式脚注神经模型资源稀缺环境

相关推荐去reddit讨论

分享给好友

相关推荐
编辑精选

Meta 宣布推出 AI 驱动的视频生成器 Movie Gen
Meta推出Movie Gen AI视频生成器，可通过文本生成高清视频并添加音效，还能编辑现有视频和图像。由于成本高和生成时间长，暂不公开发布。工具引发版...
模块化：Python程序员轻松入门Mojo🔥
本文介绍了Mojo编程语言，从Python程序员的角度出发，通过一个简单的例子展示了Mojo的语法和性能优势。文章指出Mojo与Python语法相似，但在...
Modular：我们筹集了1亿美元以改善全球开发者的AI基础设施
Modular宣布获得1亿美元新融资，加速实现全球开发者AI基础设施愿景。他们的下一代AI开发者平台改善了AI的可编程性、可用性、可扩展性、计算效率和硬件...
模块化：Mojo🔥 如何实现比 Python 快 35,000 倍的加速 – 第二部分
在本博客文章中，我们将继续优化Mandelbrot集合问题，并将速度提高到Python的26,000倍。我们将分享使用的技术，并讨论Mojo的优势。第三部...
Modular：发布 MAX 开发者版预览
Modular推出了Modular Accelerated Xecution (MAX)平台，旨在简化在不同硬件平台上部署AI模型。MAX包括先进的AI编...
模块化：Mojo🔥 - 它终于来了！
自从5月2日推出Mojo编程语言以来，已有超过120,000名开发者注册使用Mojo Playground，19,000名开发者在Discord和GitH...
模块化：Mojo🔥如何实现比Python快35,000倍的速度提升——第一部分
本文介绍了Mojo编程语言在Mandelbrot集合问题上的性能优化，通过类型注释、严格模式和简化计算等方法，实现了46倍至89倍的速度提升。与NumPy...
模块化：在Python🐍中使用Mojo🔥
本文介绍了在Mojo中使用Python模块和包的方法，包括查找和加载模块和包、使用venv创建虚拟环境和使用Conda安装libpython。文章提供了示...
【Hadoop】【持续更新】hdfs 常见命令
hdfs fsck命令是用于检查Hadoop分布式文件系统（HDFS）中的文件和目录的工具。它可以检测出文件和目录的损坏、丢失和副本问题，并提供修复建议。...
【Hadoop】Yarn 作业启动源码解读
本文介绍了作业提交的流程和相关类的功能。作业提交的核心类是Job.java，其中的submit()函数实现了作业的提交。在作业提交过程中，主要包括连接Re...

更多...

多个来源胜过一个：在低资源词汇标注中整合外部知识

验证