Enhancing Plagiarism Detection in Marathi with a Weighted Ensemble of TF-IDF and BERT Embeddings

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究提出了一种结合TF-IDF和BERT嵌入的加权集成方法,以提高马拉地语的抄袭检测准确性,能够有效捕捉文本的统计、语义和句法特征,具有良好的实际应用潜力。

🎯

关键要点

  • 本研究提出了一种结合TF-IDF特征表示和BERT句子嵌入的加权投票集成方法。

  • 该方法旨在提高马拉地语文本的抄袭检测准确性。

  • 研究表明,该方法能够有效捕捉文本的统计、语义和句法特征。

  • 该方法在低资源语言处理领域具有良好的实际应用潜力。

➡️

继续阅读