通过先进的数据增强技术提升加密互联网流量分类
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文介绍了一种名为ET-BERT的新型流量表示模型,通过在大规模未标记数据上进行预训练并在少量特定任务的有标签数据上进行微调,取得了在加密流量分类任务中显著的提高,尤其是在ISCX-Tor任务中达到了99.2%的F1分数。作者解释了预训练模型的强大原因,并分析了加密流量分类的边界能力,为未来的研究和应用提供了新的思路。
🎯
关键要点
- 提出了一种新型流量表示模型ET-BERT。
- ET-BERT在大规模未标记数据上进行预训练。
- 模型在少量特定任务的有标签数据上进行微调。
- 在五个加密流量分类任务上取得了最新成果。
- 在ISCX-Tor任务上达到了99.2%的F1分数。
- 作者解释了预训练模型的强大原因。
- 分析了加密流量分类的边界能力。
- 为未来的研究和应用提供了新的思路。
➡️