Entendre:针对小众、边缘和极端社交媒体的社交机器人检测工具

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

该论文提出了一种基于深度神经网络的机器人检测方法,使用元数据作为辅助输入,通过CNN处理推文文本。作者还提出了一种基于合成少数过抽样的技术,生成适合深度CNN训练的大型标记数据集。作者在账户级别的机器人检测中应用了相同的架构,在小型和可解释特征以及最小训练数据的情况下,实现了几乎完美的分类准确度。

🎯

关键要点

  • 该论文提出了一种基于深度神经网络的机器人检测方法。

  • 使用元数据作为辅助输入,CNN处理推文文本。

  • 提出了一种基于合成少数过抽样的技术,生成大型标记数据集。

  • 从约3000个已标记的Twitter机器人样例中生成数据。

  • 在账户级别的机器人检测中应用相同架构,取得几乎完美的分类准确度。

  • 在小型和可解释特征及最小训练数据的情况下实现高分类精度(AUC > 96%)。

  • 仅通过一个推文就能有效区分机器人与人类。

➡️

继续阅读