研究人员提出了一种适用于自然语言分类的保护方法CERT-ED,通过随机删除的方式进行实验。实验证明,CERT-ED在准确性和证书的基数方面优于现有的海明距离方法RanMASK。在各种威胁模型下,CERT-ED提高了实验鲁棒性。
我们提出了一种全面的方法,构建强大且实用的自然语言分类系统,适用于现实世界的内容审核。该系统通过内容分类、数据质量控制和主动学习等步骤,能够检测色情、仇恨、暴力、自残和骚扰等多种不良内容,创建高质量的内容分类器。
完成下面两步后,将自动完成登录并继续当前操作。