中文自然语言问题的自动数据可视化生成
原文中文,约300字,阅读约需1分钟。发表于: 。数据可视化已成为从大规模数据集中获取洞察力的有效工具。本研究提出了一种中文文本到可视化的数据集,并展示了我们对该问题的首次尝试。我们的模型集成了多语言 BERT 作为编码器,增强了跨语言能力,并将 $n$-gram 信息融入我们的词表示学习中。实验结果表明我们的数据集具有挑战性,并值得进一步研究。
该文介绍了任务视觉问题生成(VQG),旨在在展示图片后提出自然而引人入胜的问题。提供了三个数据集,通过训练和测试几种生成和检索模型来解决 VQG 这个任务。评估结果表明,尽管这样的模型为各种图像提出了合理的问题,但与人类性能的差距仍然很大。