Mukhyansh:面向印度语言的标题生成数据集
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文介绍了在ILSUM 2022数据集上使用不同预训练seq2seq模型微调的结果,PEGASUS模型在英文结果上表现最佳,IndicBART模型在印地语结果上表现最佳。对瓜拉提语进行了微调并重新运行了PEGASUS模型,使用ROUGE-1、ROUGE-2和ROUGE-4评估了推理成果。
🎯
关键要点
-
本文介绍了在ILSUM 2022数据集上使用不同预训练seq2seq模型微调的结果。
-
PEGASUS模型在英文结果上表现最佳。
-
IndicBART模型在印地语结果上表现最佳。
-
对瓜拉提语进行了微调并重新运行了PEGASUS模型。
-
使用ROUGE-1、ROUGE-2和ROUGE-4评估了推理成果。
🏷️