通过跨领域方法增强葡萄牙语变体识别

📝

内容提要

本研究解决了葡萄牙语变体识别中的不足,尤其是由于巴西葡萄牙语语料库的主导地位导致的语言偏见问题。我们提出了一种跨领域语言变体识别工具,采用变压器模型进行分类,并建立了 PtBrVarId 语料库以评估其有效性。研究结果表明,所开发的方法不仅适用于葡萄牙语,还能扩展到其他语言和变体,对未来相关研究具有重要影响。

➡️

继续阅读