Roblox开发了一种支持16种语言的实时聊天翻译模型,翻译速度约为100毫秒。该模型采用“专家混合”架构,优化了256种语言对的翻译效率,并通过知识蒸馏和量化技术将参数从10亿减少到6.5亿,提升了处理速度。此外,Roblox还建立了质量评估模型,以确保翻译的准确性和流畅性,解决多语言输入和平台特定术语的挑战。
谷歌发布了基于Gemma 3架构的开源翻译模型套件TranslateGemma,支持55种语言,提供4B、12B和27B三种参数规模,适用于移动设备和云加速器。通过监督微调和强化学习,TranslateGemma在翻译质量和效率上有显著提升,尤其在低资源语言方面表现优异,受到社区的赞赏,适合成本敏感的应用场景。
Gemma是新推出的开放翻译模型,支持55种语言,提供三种参数规模(4B、12B和27B)。其12B模型在翻译质量上超越27B,效率显著提升,适合移动设备和本地开发。经过两阶段微调,确保高质量翻译,推动语言交流。
作者重新开发了一个停更的浏览器翻译插件,名为“轻量翻译”。通过选择合适的翻译模型、精简代码和删除多余功能,提升了用户体验。尽管网页翻译仍需改进,但整体效果令人满意,感谢开源社区的支持。
腾讯发布的Hunyuan-MT-7B翻译模型支持33种语言及5种方言互译,表现优异,赢得WMT2025比赛30项冠军。该模型基于AngelSlim工具,性能提升30%,并推出开源集成模型,能够处理文化特定现象。用户可在HyperAI官网体验该模型的翻译功能。
Fredric Lindstrom和Huib Kleinhout正在开发Google Meet的实时语言翻译功能,旨在消除语言障碍。该技术采用“单次”翻译模型,显著降低翻译延迟,支持意大利语、葡萄牙语、德语和法语,帮助全球用户更好地沟通。
Qwen-MT翻译模型在速度和准确性方面表现出色,支持92种语言的互译,并具备专业翻译功能。实测结果显示其翻译效果良好,但对双语谐音笑话的理解能力不足。
NVIDIA 开源了 Canary 1B Flash 和 Canary 180M Flash 两个多语言语音识别与翻译模型,支持多种语言,具备高准确率和实时处理能力,采用编码器-解码器架构,适合设备部署,减少对云服务的依赖,推动 AI 研究与创新。
本研究针对中英文翻译中的定语名词问题,通过在Penn中文语篇树库中插入“DE”助词,开发数据集以微调翻译模型,显著提高翻译准确性,具有实际应用价值。
本研究探讨了大型语言模型在低资源环境下的泛化能力,比较了不同LLMs与专门翻译模型在英语-泰语翻译中的表现。结果表明,LLMs在计算限制下效果不佳,而专门模型表现更优,强调了在资源受限情况下使用专门模型的重要性。
本研究解决了手势书写缺乏自动评估指标的问题,支持手语转录和翻译模型的发展。通过引入专门设计的评估指标,展示了其在评估单个符号与连贯手势表现上的有效性,为手势书写技术提供重要工具和见解。
作者使用Cloudflare的免费向量数据库和嵌入模型,将博客内容转化为聊天AI的知识库。通过RAG技术,AI能根据用户问题检索相关内容。由于缺乏中文嵌入模型,作者使用翻译模型将中文转为英文处理。实现中,作者利用Cloudflare Workers和HTTP API进行数据库操作,并实现了文章摘要和向量化。作者对Cloudflare的免费服务表示赞赏。
SCALE是一个协作框架,将专用翻译模型和通用语言模型连接为一个统一的翻译引擎。它减轻了语言偏见和平行数据偏见,增强了专业性。在低资源环境中,SCALE在翻译方面优于其他模型。在Xhosa到英语的翻译中,SCALE通过紧凑模型获得了稳定提高。SCALE还可以利用现有语言偏见,在多个翻译方向上优于其他模型。对SCALE的稳健性和延迟成本进行了分析。
该研究使用视频处理美国手语拼写翻译任务,通过新的架构和损失项实现了准确预测指拼单词长度的翻译模型,并通过两阶段推理方法提高了相对性能10%以上。该研究突出了手语翻译中拼写识别的潜力。
本文提出了解决神经机器翻译模型中大词汇表问题的方法,通过选择小目标词汇表并基于翻译模型或短语库实现。实验证明,该方法在英法翻译任务中的BLEU分数比使用大词汇表的系统高1个点。
该研究提供了一份包含25,421组句子对和697个高质量的众包句子的平行机器翻译训练语料库,用于英语和Akuapem Twi。研究使用fine-tune transformer翻译模型在该语料库上进行训练,并推荐该数据集用于Akuapem Twi机器翻译的进一步训练和评估。
SCALE是一个协作框架,将专用翻译模型和通用大型语言模型连接为一个统一的翻译引擎,减轻了语言偏见和平行数据偏见,增强了专业性,而不牺牲通用性。SCALE在低资源环境中表现优异,可以有效地利用LLMs的现有语言偏见,在八个翻译方向上优于少样本GPT-4的平均6个COMET分。同时,对SCALE的稳健性、翻译特性和延迟成本进行了深入分析。
完成下面两步后,将自动完成登录并继续当前操作。