MM-故事代理:利用多智能体范式生成沉浸式叙述故事书视频
📝
内容提要
本研究解决了儿童故事书内容吸引力不足、叙述表达性匮乏及缺乏开源评估基准的问题。我们提出并开源了MM-StoryAgent,通过多智能体框架结合大型语言模型和多样化专家工具,生成情节丰富、视觉和音频一致的沉浸式叙述故事书视频。实验结果表明,该系统显著提升了故事吸引力和叙述体验,对进一步开发和优化具有重要影响。
🏷️
标签
➡️