小红花·文摘

＜span class=“js_title_inner“＞京东零售广告创意：统一的布局生成和评估模型＜/span＞

京东科技开发者 ·

京东零售广告创意：统一的布局生成和评估模型

京东科技开发者 ·

MetaSpatial框架通过强化学习提升视觉语言模型在三维空间推理中的能力，采用规则奖励机制和多轮优化，显著改善布局生成质量，克服了传统模型在空间任务中的局限性。实验结果显示，MetaSpatial在多个指标上优于传统方法，具有广泛的应用潜力。

50条数据解锁空间智能，RL视觉语言模型3D空间推理框架MetaSpatial ｜西北大学

量子位 ·

本研究提出了LayoutVLM框架，旨在解决大型语言模型在生成符合物理规律的3D场景及遵循输入指令方面的不足。实验结果表明，LayoutVLM显著提升了布局生成的语义对齐效果。

LayoutVLM：通过视觉-语言模型的可微优化实现3D布局

BriefGPT - AI 论文速递 ·

本文介绍了多个文档布局分析数据集及其应用，如PubLayNet、LoRaLay和HJDataset。研究表明，结合布局感知和深度学习模型能有效提高文档信息提取的准确性，尤其在视觉丰富的文档中。此外，新框架READ和CLAY pipeline在布局生成和去噪方面也取得了进展。

RanLayNet：一种用于领域自适应和泛化的文档布局检测数据集

BriefGPT - AI 论文速递 ·

该研究探讨了扩散模型在条件布局生成中的应用，提出了基于Transformer的布局扩散模型（LayoutDM），能够生成高质量、多样化的图形设计布局。该方法结合领域专家知识和数据驱动生成器，改善了生成式机器学习建模，为设计师提供了新工具。

Desigen: 可控设计模板生成的流程

BriefGPT - AI 论文速递 ·

本文介绍了一种新的生成模型，用于布局生成。该模型利用最新的transformer architecture生成布局元素和计算布局元素之间的约束关系，分为三个步骤。通过有约束的优化方法实现布局优化，并与现有技术进行对比，证明了该方法不需要用户输入，能产生更高质量的布局，并具备新颖的有条件布局生成能力。

从文本描述生成图形布局的解析 - 放置方法

BriefGPT - AI 论文速递 ·