PoPreRo:一份用于预测罗马尼亚 Reddit 帖子受欢迎程度的新数据集

📝

内容提要

我们介绍了第一个来自 Reddit 的罗马尼亚帖子受欢迎度预测数据集 PoPreRo。PoPreRo 数据集包括来自罗马尼亚五个不同子论坛的多样化帖子示例,共计 28,107 个数据样本。除了我们的新数据集,我们还引入了一组可用作未来研究基准的竞争模型。有趣的是,排名靠前的模型在测试集上实现了 61.35% 的准确率和 60.60% 的宏 F1 得分,表明在 PoPreRo...

🏷️

标签

➡️

继续阅读