BriefGPT - AI 论文速递 ·

我们能在不提示大型语言模型的情况下生成可视化程序吗？

💡 原文中文，约1200字，阅读约需3分钟。

📝

内容提要

本文介绍了一种新的人-LLM交互框架Low-code LLM，用户可以通过低代码视觉编程实现复杂任务的结构化规划。该框架提高了生成结果的可控性，适用于视觉问答和表格处理等任务，并通过实验验证了其有效性。

🎯

🔎

Low-code LLM框架通过图形用户界面简化了用户与大型语言模型的交互，降低了编程门槛。用户无需编写复杂的提示即可实现复杂任务的结构化规划，这使得非专业人士也能参与到编程中，拓宽了技术的应用范围。

CRAFT框架通过创建和检索工具集，增强了大型语言模型在视觉语言和表格处理等任务中的能力。这种灵活性不仅提高了模型的准确性，还为处理复杂数据提供了新的思路，适合多种实际应用场景。

递归的视觉编程方法能够有效简化生成的代码，并提高问题解决能力。这种方法在管理复杂数据结构时表现出色，尤其适用于需要高效处理视觉问答任务的场景，显示出其在实际应用中的巨大潜力。

❓

Low-code LLM框架的主要优点包括可控的生成结果、用户友好的人-LLM交互和广泛的应用场景。

Low-code LLM通过将视觉问答问题视为模块化代码生成，并通过Python程序调用和组合视觉模型的输出来提高准确性。

CRAFT框架通过创建和检索工具集增强大型语言模型的能力，在视觉语言、表格处理和数学推理任务中实现显著性能改进。

Prompt Problems方法通过将问题转化为语言模型可理解的提示，帮助学生解决编程问题，提供了一种新的教授编程的方式。

PropTest策略的主要目标是生成用于测试可视化属性的代码解决方案，以提高可视化编程的性能和泛化能力。

递归的视觉编程方法通过简化生成的代码，提高问题解决能力和复杂数据结构的管理，经过实验验证了其有效性。

🏷️