本研究提出了StoryAnchors框架,通过双向故事生成器和多事件标注,解决了长篇故事叙述中的一致性和丰富性问题。实验结果表明,该框架在叙述一致性和场景多样性方面优于现有模型。
本研究提出了一种名为Trelawney的方法,旨在解决因果语言模型训练中标记预测与人类写作推理过程的差异。通过重新排列训练数据,该方法在规划、算法推理和故事生成任务上显著提升了模型的能力。
本研究提出Toyteller系统,利用AI叙事克服传统故事叙述的局限。用户通过操控角色生成故事,发现玩具互动能有效表达复杂意图,但仅靠动作不足,建议结合语言等其他方式。
本研究提出了一种新生成方法DOME,结合动态层次大纲和记忆增强模块,解决了长篇故事生成中的情节连贯性和规划不足问题。实验结果表明,DOME在故事流畅性和整体质量上优于现有方法。
VisualQuest是一个互动AI应用,用户可以通过上传图片和语音控制故事进程。Universal-2模型将语音转录为文本,Llama模型则生成故事的下一段。
本研究分析了大型语言模型在地理知识方面的偏差,特别是对贫穷国家的旅行推荐和故事生成内容的不足。研究发现,旅行推荐缺乏多样性,故事内容多集中于困境与悲伤,强调了地理知识在语言模型输出中的重要性。
这是一个基于LLM的故事生成器,利用初始提示生成故事和插图,并通过Pinata的Files SDK进行存储和检索。系统包括Express API、简单前端和后台处理器,使用Redis管理生成过程。Pinata的File SDK用于文件共享和数据库,创建索引文件管理故事。前端通过API提交提示,使用Redis队列处理,完成后刷新故事列表,点击标题可查看内容。
本研究提出了一种创新的故事生成框架CCI,通过图像引导和多写作者模型,解决大语言模型在创意故事生成中人物多样性和细节不足的问题,提升了故事的创意性和生动性,展示了人机互动对文化发展的潜力。
本文介绍了利用GPT-4o的多模态能力生成故事的方法,并介绍了ImageTeller工具,用户可根据文学类型自定义故事发展。该工具提供高度互动的用户体验,实时调整故事内容和结构。
完成下面两步后,将自动完成登录并继续当前操作。