使用 GRIT 模型进行巴西葡萄牙语的图像字幕生成
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
该研究开发了用于巴西葡萄牙语的图像标题模型,采用了GRIT模型和Transformer生成更好的标题。通过调整GRIT模型在巴西葡萄牙语数据集上进行训练。
🎯
关键要点
- 该研究开发了用于巴西葡萄牙语的图像标题模型。
- 采用了GRIT模型,基于网格和区域的图像标题Transformer。
- GRIT模型是一种仅使用Transformer的神经架构。
- GRIT模型有效利用两个视觉特征生成更好的标题。
- 研究调整了GRIT模型以在巴西葡萄牙语数据集上进行训练。
➡️