小红花·文摘 - 小红花技术领袖俱乐部

注意力机制起源于2014年Bengio实验室的研究，而非2017年Transformer论文。实习生Bahdanau提出了简化方案，灵感来自翻译过程中的信息检索。Karpathy在公开邮件中强调了命名对技术传播的重要性。

揭秘注意力机制真正起源！10年前3项研究几乎同时独立提出，背后故事细节被Karpathy晒邮件公开了

量子位 ·

被忽略的起点？Karpathy揭秘最初的注意力论文被Transformer光芒掩盖的故事

被忽略的起点？Karpathy揭秘最初的注意力论文被Transformer光芒掩盖的故事

机器之心 ·

流行的深度学习模型,其中的思想以及模型在后面其他任务中也经常使用,所以这里介绍一些常用好用的模型.主要介绍attention和transformer系列.

transformer family(一):from Bahdanau Attention to transformers

Sekyoro的博客小屋 ·