Entendre:针对小众、边缘和极端社交媒体的社交机器人检测工具
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
该论文提出了一种基于深度神经网络的机器人检测方法,使用元数据作为辅助输入,通过CNN处理推文文本。作者还提出了一种基于合成少数过抽样的技术,生成适合深度CNN训练的大型标记数据集。作者在账户级别的机器人检测中应用了相同的架构,在小型和可解释特征以及最小训练数据的情况下,实现了几乎完美的分类准确度。
🎯
关键要点
-
该论文提出了一种基于深度神经网络的机器人检测方法。
-
使用元数据作为辅助输入,CNN处理推文文本。
-
提出了一种基于合成少数过抽样的技术,生成大型标记数据集。
-
从约3000个已标记的Twitter机器人样例中生成数据。
-
在账户级别的机器人检测中应用相同架构,取得几乎完美的分类准确度。
-
在小型和可解释特征及最小训练数据的情况下实现高分类精度(AUC > 96%)。
-
仅通过一个推文就能有效区分机器人与人类。
➡️