用于科学论文自动摘要的俄语多模态数据集

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

该论文创建了一个多模态数据集,包含文本、表格和图形,并测试了现有的语言模型在自动文本摘要任务上的表现。实验使用了SBER的Gigachat和Yandex的YandexGPT两个语言模型。数据集包含420篇论文,可在指定的URL上获取。

🎯

关键要点

  • 该论文创建了一个俄语科学论文的多模态数据集。
  • 数据集包含文本、表格和图形。
  • 测试了现有的语言模型在自动文本摘要任务上的表现。
  • 实验使用了SBER的Gigachat和Yandex的YandexGPT两个语言模型。
  • 数据集包含420篇论文,可在指定的URL上获取。
➡️

继续阅读