From Scarcity to Capability: Enhancing Fake News Detection in Low-Resource Languages Using Large Language Models
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究针对低资源语言(如孟加拉语)假新闻检测中的数据和工具不足,提出了BanFakeNews-2.0数据集,包含47,000条真实新闻和13,000条假新闻。通过先进的深度学习模型,检测精度显著提高,推动相关研究和应用的发展。
🎯
关键要点
-
假新闻的快速传播对全球构成重大挑战,尤其是在低资源语言(如孟加拉语)中。
-
低资源语言缺乏足够的数据集和检测工具,导致假新闻检测能力不足。
-
手动事实核查虽然准确,但成本高且速度慢,无法有效阻止假新闻的传播。
-
本研究提出了BanFakeNews-2.0数据集,包含47,000条真实新闻和13,000条假新闻。
-
通过使用先进的深度学习模型,假新闻检测的精度显著提高,超越了传统方法。
-
该研究推动了低资源语言假新闻检测相关研究和应用的发展。
🏷️