小红花·文摘

本文探讨了大型语言模型在视觉故事生成、叙事理解和法律教育中的应用，提出了提高叙述连贯性和情感深度的新方法。研究表明，结合图像和叙述可以创造高质量的故事，大型语言模型在创意写作中作为辅助工具具有潜力。

大型语言模型是否能够生成人类水平的叙述？

BriefGPT - AI 论文速递 ·

本文介绍了SEED图像标记器与多模态大型语言模型（MLLMs）的结合，提出了一种新方法用于视觉故事生成，显著提升叙述的连贯性和情感深度。同时，研究开发了SEED-Bench基准测试，以评估现有模型的局限性，推动多模态理解与生成的研究进展。SEED-X模型通过增强特性，缩小应用能力与真实世界适应性之间的差距，展示了在各领域的有效性。

SEED-Story：利用大型语言模型进行多模式长篇故事生成

BriefGPT - AI 论文速递 ·

本文探讨了多模态大型语言模型（MLLMs）的发展及其在视觉故事生成、图像理解和推荐系统中的应用。研究表明，结合文本和视觉信息的MLLMs能够生成高质量的故事和图像，提升可解释性和用户体验。文章回顾了相关技术、训练数据集及其在不同任务中的表现，为未来研究奠定基础。

多模态大型语言模型改进视觉叙述

BriefGPT - AI 论文速递 ·