小红花·文摘

开卷视觉编程！GLM-5V-Turbo上线，一张草图搞定前端

量子位 ·

儿童编程的5种最佳语言：将游戏时间变为编程乐趣！

DEV Community ·

本文介绍了一种新的人-LLM交互框架Low-code LLM，用户可以通过低代码视觉编程实现复杂任务的结构化规划。该框架提高了生成结果的可控性，适用于视觉问答和表格处理等任务，并通过实验验证了其有效性。

我们能在不提示大型语言模型的情况下生成可视化程序吗？

BriefGPT - AI 论文速递 ·

本文提出了基于语言模型的视觉编程框架VPGen和VPEval，用于文本到图像生成和评估。VPGen通过三个步骤实现高保真度图像生成，VPEval提供人类相关性评估。研究还介绍了新型空间-语义地图引导扩散模型，显著提升生成质量和可控性，并提出改进的文本到图像生成方法，解决复杂场景生成中的布局理解问题。

IFAdapter：实例特征控制用于定向文本生成图像

BriefGPT - AI 论文速递 ·

自从将电视屏幕连接到计算机以来，视觉编程存在，但未进入主流编程社区。视觉编程工具缺乏文本语言的强大和灵活性，限制了其应用范围。toddle.dev是一个平台，通过强大的视觉界面构建复杂的Web应用程序。视觉编程可能成为软件开发的未来。

本文介绍了基于语言模型的可解释视觉编程框架VPGen和VPEval，旨在实现文本到图像的生成与评估。研究提出了ConceptBed数据集和评估指标CCD，分析了概念学习与组合性之间的权衡。此外，开发了T2I-CompBench基准测试，并提出GORS方法以提升生成能力。通过微调文本嵌入，实现低成本的多概念生成，并提出CompAgent方法以增强图像生成的可控性。最终评估显示，VQAScore在生成速度和准确性上优于其他指标。

ConceptMix：一个可控难度的组合图像生成基准

BriefGPT - AI 论文速递 ·

开卷视觉编程！GLM-5V-Turbo上线，一张草图搞定前端

Kimi 的一体化，Manus 的分层

儿童编程的5种最佳语言：将游戏时间变为编程乐趣！

我们能在不提示大型语言模型的情况下生成可视化程序吗？

IFAdapter：实例特征控制用于定向文本生成图像

toddle：在toddle中构建的视觉编程平台

ConceptMix：一个可控难度的组合图像生成基准