Behind Closed Words: Creating and Investigating the forePLay Annotated Dataset for Polish Erotic Discourse

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究提出了名为forePLay的波兰语情色内容检测数据集,包含超过24,000个带注释的句子。研究表明,专门的波兰语言模型在检测效果上优于多语言选项,为开发内容审核系统提供了重要框架。

🎯

关键要点

  • 本研究提出了名为forePLay的波兰语情色内容检测数据集,包含超过24,000个带注释的句子。

  • 研究表明,专门的波兰语言模型在检测效果上优于多语言选项。

  • 该数据集的建立为开发具语言意识的内容审核系统提供了重要框架。

  • 在形态复杂的语言中扩展内容检测能力时,需要考虑关键因素。

➡️

继续阅读