该研究综述了自动化数字媒体消费、辅助技术和互动娱乐中视觉数据的重要性,讨论了生成引人入胜叙述的方法学、原理、优势和局限性。还涵盖了自动故事生成相关的任务,如图像和视频字幕以及视觉问题回答。对主要数据集和评估指标进行了分析,并提供了对其局限性的批评性观点。
完成下面两步后,将自动完成登录并继续当前操作。