谷歌在Gmail中部署新的矢量算法大幅度提高垃圾和钓鱼邮件的识别率

谷歌最近在 Google Colab 上开源了一个名为 RETVec 的新型多语言文本矢量化器,这个矢量化器已 […]

谷歌在Google Colab上开源了名为RETVec的多语言文本矢量化器,用于提升Gmail中垃圾邮件和钓鱼邮件的识别率。该矢量化器支持100多种语言,能够抵御字符级操作,并降低误报率。谷歌表示,在Gmail中应用RETVec后,垃圾邮件检测率提高了38%,误报率降低了19.4%。RETVec的紧凑表示形式使得模型具有更快的推理速度,降低了计算成本和延迟。矢量化是NLP中的一种方法,用于将词汇映射为数字表达,以进行进一步分析。

原文中文,约700字,阅读约需2分钟。发表于:
阅读原文