封闭词背后:创建和研究为波兰情色话语服务的forePLay注释数据集
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究推出了名为forePLay的波兰语情色内容检测数据集,包含超过24,000个标注句子。评估结果显示,专门的波兰语言模型在检测效果上优于多语言模型,为开发语言敏感的内容审核系统奠定了基础。
🎯
关键要点
- 本研究推出了名为forePLay的波兰语情色内容检测数据集。
- 该数据集包含超过24,000个带注释的句子。
- 评估结果显示,专门的波兰语言模型在检测效果上优于多语言模型。
- 该数据集为开发语言敏感的内容审核系统奠定了基础。
- 研究指出在形态复杂的语言中扩展内容检测能力的关键考虑。
➡️