马格里布情感分析器的同形攻击
原文中文,约200字,阅读约需1分钟。发表于: 。研究通过在洲际海峡北美洲国家的不同阿拉伯方言中对同音异义词攻击对情感分析(SA)任务的影响,发现当数据以 “Arabizi” 书写时,同音异义词攻击导致 Transformer 分类的 F1 分数从 0.95 降低到 0.33,旨在凸显 LLM 的弱点并优先考虑道德和负责任的机器学习。
对于在不同阿拉伯语方言上训练的transformer模型进行的分析发现,单词形态在较低和中间层次上学习,句法依赖在较高层次上被捕获。嵌入层的神经元是一词多义的,而中间层的神经元仅适用于特定属性。