小红花·文摘

本地部署 Hy-MT2 翻译模型

如鱼饮水 ·

腾讯混元开源全新翻译模型Hy-MT2 ，上线小程序「腾讯Hy翻译」

量子位 ·

腾讯开源 Hy-MT1.5 翻译模型：440MB 跑出顶级翻译能力；从图像序列到点云生成：LingBot-Map 在线 3D 重建流程

HyperAI超神经 ·

Roblox如何利用人工智能在100毫秒内翻译16种语言

ByteByteGo Newsletter ·

谷歌推出TranslateGemma开源模型，实现多语言翻译

InfoQ ·

Gemma是新推出的开放翻译模型，支持55种语言，提供三种参数规模（4B、12B和27B）。其12B模型在翻译质量上超越27B，效率显著提升，适合移动设备和本地开发。经过两阶段微调，确保高质量翻译，推动语言交流。

TranslateGemma：一套新的开放翻译模型

The Keyword ·

AI 开发——改了一个浏览器翻译插件

W4J1e's blog ·

在线教程丨ACL机器翻译大赛30个语种摘冠，腾讯Hunyuan-MT-7B支持33种语言翻译

HyperAI超神经 ·

Fredric Lindstrom和Huib Kleinhout正在开发Google Meet的实时语言翻译功能，旨在消除语言障碍。该技术采用“单次”翻译模型，显著降低翻译延迟，支持意大利语、葡萄牙语、德语和法语，帮助全球用户更好地沟通。

人工智能如何使Google Meet的语言翻译成为可能

The Keyword ·

Qwen-MT翻译模型在速度和准确性方面表现出色，支持92种语言的互译，并具备专业翻译功能。实测结果显示其翻译效果良好，但对双语谐音笑话的理解能力不足。

Testing the Qwen-MT Translation Model: Indeed Fast and Good

量子位 ·

NVIDIA AI 开源 Canary 1B 和 180M Flash：多语言语音识别和翻译模型

实时互动网 ·

本研究针对中英文翻译中的定语名词问题，通过在Penn中文语篇树库中插入“DE”助词，开发数据集以微调翻译模型，显著提高翻译准确性，具有实际应用价值。

The Role of Handling Attributive Nouns in Improving Chinese-English Machine Translation

BriefGPT - AI 论文速递 ·

本文探讨了多语言预训练和微调在翻译模型中的应用，证明其在性能不减的情况下可扩展至更多语言。研究表明，基于ML50数据集的多语言微调显著提升了模型效果，并通过构建开源数据集和知识增强方法，提升了大语言模型的跨语言能力。FuxiTranyu模型在多语言基准测试中表现优异，推动了多语言模型的研究进展。

使用单一源语言的大规模机器翻译语料库进行多语言预训练

BriefGPT - AI 论文速递 ·

本研究探讨了在自动翻译中，单语源数据的数量与质量之间的关系。实验结果表明，在低资源的英语-德语翻译任务中，优先使用高质量且与测试数据相关的单语数据比使用所有可用数据更有效，数据质量显著提升翻译模型的表现。

Quantity vs. Quality of Monolingual Source Data in Automatic Text Translation: Can It Be Too Good to Be Too Little?

BriefGPT - AI 论文速递 ·

本研究解决了手势书写缺乏自动评估指标的问题，支持手语转录和翻译模型的发展。通过引入专门设计的评估指标，展示了其在评估单个符号与连贯手势表现上的有效性，为手势书写技术提供重要工具和见解。

手势书写评价：通过手势书写有效评估手语

BriefGPT - AI 论文速递 ·

作者使用Cloudflare的免费向量数据库和嵌入模型，将博客内容转化为聊天AI的知识库。通过RAG技术，AI能根据用户问题检索相关内容。由于缺乏中文嵌入模型，作者使用翻译模型将中文转为英文处理。实现中，作者利用Cloudflare Workers和HTTP API进行数据库操作，并实现了文章摘要和向量化。作者对Cloudflare的免费服务表示赞赏。

用CF Vectorize把博客作为聊天AI的知识库

Mayx的博客 ·

本文研究了结构化文本本地化，提出了高质量的多语种数据集和翻译模型。实验表明，使用XML标签可以提高翻译的精确度。同时，探讨了低资源语言的机器翻译支持、缩略语消歧及大型语言模型在翻译中的应用，提出了一种新的机器翻译范式，特别适用于濒危语言。

翻译技术术语：机器翻译缩写的翻译工作流程

BriefGPT - AI 论文速递 ·

本文探讨了大型语言模型的红队测试，提出了ASSERT方法以评估模型在不同环境下的鲁棒性。尽管现有模型有安全措施，但在语义相关场景中仍存在分类准确率差异，可能影响用户安全。此外，研究还涉及检测生成有害回应和改进翻译模型性能的方法。

STAR: 社会技术方法在红队化语言模型中的应用

BriefGPT - AI 论文速递 ·

本文介绍了一种多语言语音翻译模型，支持无文本的语音到语音翻译，采用自监督技术优化多说话者语音。研究表明，该模型在多语言翻译中优于传统双语模型，并在不同任务上取得显著改进，展现出强大的翻译能力和效率。

MSLM-S2ST：一个适用于无文本语音到语音翻译的多任务语音语言模型，保持说话人风格

BriefGPT - AI 论文速递 ·

本文提出了解决神经机器翻译模型中大词汇表问题的方法，通过选择小目标词汇表并基于翻译模型或短语库实现。实验证明，该方法在英法翻译任务中的BLEU分数比使用大词汇表的系统高1个点。

词汇重要性对机器翻译模型盗用的影响

BriefGPT - AI 论文速递 ·