用于科学论文自动摘要的俄语多模态数据集
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
该论文创建了一个多模态数据集,包含文本、表格和图形,并测试了现有的语言模型在自动文本摘要任务上的表现。实验使用了SBER的Gigachat和Yandex的YandexGPT两个语言模型。数据集包含420篇论文,可在指定的URL上获取。
🎯
关键要点
- 该论文创建了一个俄语科学论文的多模态数据集。
- 数据集包含文本、表格和图形。
- 测试了现有的语言模型在自动文本摘要任务上的表现。
- 实验使用了SBER的Gigachat和Yandex的YandexGPT两个语言模型。
- 数据集包含420篇论文,可在指定的URL上获取。
➡️