Enhancing Plagiarism Detection in Marathi with a Weighted Ensemble of TF-IDF and BERT Embeddings
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了一种结合TF-IDF和BERT嵌入的加权集成方法,以提高马拉地语的抄袭检测准确性,能够有效捕捉文本的统计、语义和句法特征,具有良好的实际应用潜力。
🎯
关键要点
-
本研究提出了一种结合TF-IDF特征表示和BERT句子嵌入的加权投票集成方法。
-
该方法旨在提高马拉地语文本的抄袭检测准确性。
-
研究表明,该方法能够有效捕捉文本的统计、语义和句法特征。
-
该方法在低资源语言处理领域具有良好的实际应用潜力。
➡️