Behind Closed Words: Creating and Investigating the forePLay Annotated Dataset for Polish Erotic Discourse
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了名为forePLay的波兰语情色内容检测数据集,包含超过24,000个带注释的句子。研究表明,专门的波兰语言模型在检测效果上优于多语言选项,为开发内容审核系统提供了重要框架。
🎯
关键要点
- 本研究提出了名为forePLay的波兰语情色内容检测数据集,包含超过24,000个带注释的句子。
- 研究表明,专门的波兰语言模型在检测效果上优于多语言选项。
- 该数据集的建立为开发具语言意识的内容审核系统提供了重要框架。
- 在形态复杂的语言中扩展内容检测能力时,需要考虑关键因素。
➡️