本研究探讨现代希腊语在自然语言处理中的挑战,评估开放源与闭源语言模型在七个任务中的表现,并重新定义作者归属,提供高准确率的伦理问题证据。
本文介绍了一种作者归属方法——作者语言模型(ALMs),通过调整语言模型的困惑度来识别文档作者。基准测试显示,ALMs在Blogs50数据集上的宏平均准确率为83.6%,在CCAT50上为74.9%。短文本测试表明,Blogs50需要40个词元和CCAT50需要400个词元才能达到70%的准确率。
完成下面两步后,将自动完成登录并继续当前操作。