机器翻译技术的前沿探索与应用 - 小红花·文摘 - 小红花技术领袖俱乐部

《GPT 图解》笔记：Seq2Seq及点积注意力

《GPT 图解》笔记：Seq2Seq及点积注意力

Ying’s Blog ·

腾讯混元开源全新翻译模型Hy-MT2 ，上线小程序「腾讯Hy翻译」

量子位 ·

腾讯开源 Hy-MT1.5 翻译模型：440MB 跑出顶级翻译能力；MIT 联合发布 MathNet：涵盖 2.7 万道奥数真题的多模态数学推理基准

腾讯开源 Hy-MT1.5 翻译模型：440MB 跑出顶级翻译能力；MIT 联合发布 MathNet：涵盖 2.7 万道奥数真题的多模态数学推理基准

HyperAI超神经 ·

AI 潮来，翻译何为

AI 潮来，翻译何为

少数派 ·

《Attention Is All You Need》论文于2017年发表，提出了Transformer架构，摆脱了RNN和CNN，专注于并行化训练。其核心贡献包括多头自注意力和位置编码，显著提升了机器翻译的训练速度。尽管初期反响平平，但后来成为大语言模型的基础，影响深远。作者团队背景各异，后续大多离开Google，成为AI领域的重要人物。

【Transformer 与注意力机制】19｜《Attention Is All You Need》论文背景

土法炼钢兴趣小组的博客 ·

《Attention Is All You Need》论文通过WMT14英译德和英译法任务取得优异的BLEU分数，证明了Transformer架构的有效性。其训练效率显著优于前代模型，且不依赖递归和卷积，推动了机器翻译领域的变革。论文强调了注意力机制的重要性，并展示了其在现代硬件上的并行性优势，为后续大模型的发展奠定了基础。

【Transformer 与注意力机制】28｜原论文实验结果：为什么 28.4 BLEU 足以改写路线图

土法炼钢兴趣小组的博客 ·

Hugging Face发布FineTranslations，一个万亿标记的多语言平行文本数据集

Hugging Face发布FineTranslations，一个万亿标记的多语言平行文本数据集

InfoQ ·

从零开始构建神经机器翻译 – PyTorch重现7篇重要论文

从零开始构建神经机器翻译 – PyTorch重现7篇重要论文

freeCodeCamp.org ·

绝对初学者的5个有趣的自然语言处理项目

绝对初学者的5个有趣的自然语言处理项目

KDnuggets ·

JetBrains Academy 插件迎来 AI 驱动的学习功能

JetBrains Academy 插件迎来 AI 驱动的学习功能

The JetBrains Blog ·

迈向机器翻译：来自人类翻译研究的启示

迈向机器翻译：来自人类翻译研究的启示

Apple Machine Learning Research ·

阿里国际的AI翻译模型Marco-MT在2025年WMT机器翻译大赛中表现出色，获得6项冠军，超越多款顶尖模型，显示其通用翻译能力得到认可。该模型结合电商翻译经验与创新训练方法，显著提升翻译质量。

阿里国际AI翻译模型Marco霸榜WMT机器翻译大赛最难赛道，拿下六项冠军

量子位 ·

在线教程丨ACL机器翻译大赛30个语种摘冠，腾讯Hunyuan-MT-7B支持33种语言翻译

在线教程丨ACL机器翻译大赛30个语种摘冠，腾讯Hunyuan-MT-7B支持33种语言翻译

HyperAI超神经 ·

深入理解大模型 1：Transformer，大模型的基石

深入理解大模型 1：Transformer，大模型的基石

木鸟杂记 ·

AI 驱动的全球通信语言解决方案的进步

AI 驱动的全球通信语言解决方案的进步

实时互动网 ·

机器之心数据服务现已上线，提供高效稳定的数据获取服务，帮助用户轻松获取所需数据。

全球机器翻译比赛拿下30个语种第1名，腾讯混元翻译模型开源

机器之心 ·

最优语料感知训练用于神经机器翻译

最优语料感知训练用于神经机器翻译

Apple Machine Learning Research ·

通过像素级回退克服词汇限制

通过像素级回退克服词汇限制

Apple Machine Learning Research ·

Unbabel 推出 TOWER+：多语言 LLM 高保真翻译与指令遵循的统一框架

Unbabel 推出 TOWER+：多语言 LLM 高保真翻译与指令遵循的统一框架

实时互动网 ·

超越文本压缩：跨规模评估分词器

超越文本压缩：跨规模评估分词器

Apple Machine Learning Research ·