利用语言模型发现极端社交媒体上出现的编码反犹太仇恨言论趋势
📝
内容提要
本文提出了一种检测新兴编码仇恨化术语的方法,该方法在在线反犹太人言论的背景下进行了测试,主要通过对社交媒体平台上的帖子进行抓取并计算其在整个语料库中的频率,以过滤掉语法不连贯的表达和先前遇到过的表达,最后通过对已知的反犹太术语的语义相似性进行评估,并移除与之相距过远的表达,最终返回仅含有编码化仇恨表达的新兴反犹太术语。
🏷️
标签
➡️