Mukhyansh:面向印度语言的标题生成数据集

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文介绍了在ILSUM 2022数据集上使用不同预训练seq2seq模型微调的结果,PEGASUS模型在英文结果上表现最佳,IndicBART模型在印地语结果上表现最佳。对瓜拉提语进行了微调并重新运行了PEGASUS模型,使用ROUGE-1、ROUGE-2和ROUGE-4评估了推理成果。

🎯

关键要点

  • 本文介绍了在ILSUM 2022数据集上使用不同预训练seq2seq模型微调的结果。
  • PEGASUS模型在英文结果上表现最佳。
  • IndicBART模型在印地语结果上表现最佳。
  • 对瓜拉提语进行了微调并重新运行了PEGASUS模型。
  • 使用ROUGE-1、ROUGE-2和ROUGE-4评估了推理成果。
➡️

继续阅读