卡哈尼:面向非西方文化的文化细腻视觉叙事管道
发表于: 。本研究解决了大型语言模型与文本到图像模型在生成故事时偏向全球北方文化的问题,导致非西方文化的故事难以获得文化共鸣。我们提出的卡哈尼视觉叙事管道利用现有模型,结合思维链和图像提示技术,更好地捕捉文化背景并生成生动的故事场景。用户研究结果显示,卡哈尼在文化适应性和视觉叙事质量上优于传统工具,体现了其在文化故事创作中的潜在影响。
本研究解决了大型语言模型与文本到图像模型在生成故事时偏向全球北方文化的问题,导致非西方文化的故事难以获得文化共鸣。我们提出的卡哈尼视觉叙事管道利用现有模型,结合思维链和图像提示技术,更好地捕捉文化背景并生成生动的故事场景。用户研究结果显示,卡哈尼在文化适应性和视觉叙事质量上优于传统工具,体现了其在文化故事创作中的潜在影响。