Mukhyansh:面向印度语言的标题生成数据集
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文介绍了在ILSUM 2022数据集上使用不同预训练seq2seq模型微调的结果,PEGASUS模型在英文结果上表现最佳,IndicBART模型在印地语结果上表现最佳。对瓜拉提语进行了微调并重新运行了PEGASUS模型,使用ROUGE-1、ROUGE-2和ROUGE-4评估了推理成果。
🎯
关键要点
- 本文介绍了在ILSUM 2022数据集上使用不同预训练seq2seq模型微调的结果。
- PEGASUS模型在英文结果上表现最佳。
- IndicBART模型在印地语结果上表现最佳。
- 对瓜拉提语进行了微调并重新运行了PEGASUS模型。
- 使用ROUGE-1、ROUGE-2和ROUGE-4评估了推理成果。
➡️