PeLLE: 基于开放数据的巴西葡萄牙语编码器语言模型
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
为促进葡萄牙语的神经编码和数字化时代技术准备,我们开发了一种名为 Albertina PT-* 的基于 Transformer 的编码器,并在欧洲葡萄牙语和巴西葡萄牙语方言的领域设立了最先进的技术水平。我们免费分发 Albertina PT-PT 和 PT-BR 并采用最宽松的许可证,以推动对葡萄牙语言技术的研究和创新。
🎯
关键要点
- 开发了一种名为 Albertina PT-* 的基于 Transformer 的编码器。
- 在欧洲葡萄牙语和巴西葡萄牙语方言领域设立了最先进的技术水平。
- 借鉴 DeBERTa 强大模型,使用葡萄牙语数据集进行了预训练。
- 免费分发 Albertina PT-PT 和 PT-BR,采用最宽松的许可证。
- 推动对葡萄牙语言技术的研究和创新,支持在便携硬件设备上运行。
🏷️
标签
➡️