本文介绍了针对尼日利亚四种主要语言的情感数据集及其标注方法,评估了预训练模型和迁移策略,以改善低资源语言的情感分析。研究表明,简单模型在低资源环境下表现最佳,并提出了有效的恶意言论检测框架,以促进在线环境的安全与包容。
本研究提出了一种动态数据集生成和训练模型的方法,生成约40,000项新数据,显著提升了模型的鲁棒性和性能。通过构建多语言的GOTHate数据集,开发了HEN-mBERT模型,增强了恶意言论检测效果。同时,研究探讨了在有限数据情况下的仇恨言论检测,提出合成数据生成方法,显示出良好的模型性能。
本研究探讨大型语言模型在恶意言论检测中的能力与局限,提出新框架HARE,通过推理能力和提示策略提升检测性能。研究表明,包含目标信息和解释能显著提高模型效果,同时指出模型在分类和解释上的薄弱点,需开发安全技术以增强其鲁棒性。
该研究旨在通过对孟加拉语、阿萨姆语和古吉拉特语中的恶意言论进行检测,来促进包容性的在线空间。研究使用预训练的BERT和SBERT模型进行微调,并发现单语句BERT模型在孟加拉语方面表现最佳,但阿萨姆语和古吉拉特语的性能仍有改进的机会。
完成下面两步后,将自动完成登录并继续当前操作。