Whisper模型在2022年引发了AI社区的关注,但对克里奥尔语等低资源语言的理解有限。作者尝试用Python训练模型,发现Whisper无法有效转录克里奥尔语,显示出低资源语言在AI应用中的挑战。呼吁数字化克里奥尔语资源,以促进其在AI中的使用。
本文介绍了Molyé语料库,该语料库结合了欧洲三种语言变体的刻板印象和法语基础克里奥尔语的早期证据。旨在促进将欧洲接触情景与克里奥尔语国家的关系进行未来研究。
完成下面两步后,将自动完成登录并继续当前操作。