本文综述了多模式自动摘要(MMS)研究,涵盖文本、图像、音频和视频等模式,讨论了评估指标、数据集及当前挑战。提出了多模式多媒体总结框架(MHMS),用于自动生成新闻封面和视频介绍,评估结果显示其在多个数据集上表现良好。此外,研究了胎儿生物测量和医疗对话摘要生成模型,推动了多模态摘要领域的发展。
完成下面两步后,将自动完成登录并继续当前操作。