优化基于 Transformer 的网络用于深度学习地震处理工作流程
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
本文介绍了一种用卷积学习输入表示替换变形器的正弦位置嵌入的方法,并详细说明了其在提供长程关系方面的优势和优化特点。该方法在无额外语言模型文本下,在librispeech测试中取得了4.7%和12.9%的字错率。
🎯
关键要点
-
提出了一种用卷积学习输入表示替换变形器的正弦位置嵌入的方法。
-
该方法在提供长程关系方面具有优势和优化特点。
-
在无额外语言模型文本下,该方法在librispeech测试中取得了4.7%和12.9%的字错率。
➡️