分析深度对话中的有害性:Reddit 案例研究
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
本文使用数据科学工具将原始文本转化为关键特征,并使用阈值法或学习算法对其进行分类,以监控攻击性网络对话。通过评估62个分类器,从19个算法组中提取特征并分析准确性和执行时间。脏词列表是最有预测性的评价攻击性评论的方法。基于树的算法提供最透明易懂的规则和特征的预测贡献。
🎯
关键要点
- 使用数据科学工具将原始文本转化为关键特征。
- 采用阈值法或学习算法对网络对话进行分类,以监控攻击性内容。
- 评估62个分类器,从19个算法组中提取特征并分析准确性和执行时间。
- 脏词列表是评价攻击性评论的最有预测性的方法。
- 基于树的算法提供透明易懂的规则和特征的预测贡献。
➡️