小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究开发了一种机器翻译模型,将英文医学手册翻译为索拉尼库尔德语,以解决库尔德语医学手册的缺乏问题。通过对319份手册的平行语料库进行评估,翻译的准确性和清晰度得到了积极评价。

Domain-Specific Machine Translation: Translating English Medical Manuals into Sorani Kurdish

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-23T00:00:00Z

通过众包方法从双语网站收集了10,000个URL对,创建了一个包含4.6M个句对的日语-中文平行语料库。使用1.2M条高质量的句对训练了一个平行语料库过滤器,准确度与全球网络挖掘的语料库相当。证实了使用众包进行平行数据的网络挖掘是可行的。

利用众包进行网络挖掘的日中平行语料库

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-15T00:00:00Z

SAMER语料库是第一个针对学龄儿童的阿拉伯语句子简化的手工注释的平行语料库,包括15部公开可获取的阿拉伯小说,总共约159K个单词。该语料库进行了可读性标注,并提供了两个简化版本的平行文本。该语料库可公开获取,支持和鼓励阿拉伯语句子简化、阿拉伯语自动可读性评估和阿拉伯语教育语言技术的研究发展。

SAMER 阿拉伯文本简化语料库

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-29T00:00:00Z

KazParC是一个用于哈萨克语、英语、俄语和土耳其语机器翻译的并行语料库,包含371,902个不同领域的平行句子。研究还开发了一种名为Tilmash的神经机器翻译模型,其性能在某些情况下超过了Google Translate和Yandex Translate。KazParC和Tilmash可在GitHub上下载。

KazParC: 机器翻译用的哈萨克平行语料库

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-28T00:00:00Z

该研究提出了一种新的无监督方法,使用单语数据来获得跨语言句子嵌入,产生合成平行语料库,并使用预训练的跨语言掩码语言模型对其进行微调以得到多语言句子表示。结果表明,该方法可以比基准模型获得高达22个F1点的改进,并且单个合成的双语语料库能够改善其他语言对的结果。

双语语料库挖掘和多阶段微调以提升讲座文稿机器翻译

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-07T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码