DEV Community ·

🧠 图表转图：微调视觉语言模型以从图表中提取知识图谱

💡 原文英文，约800词，阅读约需3分钟。

📝

内容提要

使用Qwen2.5-VL模型结合PEFT和Neo4J，可以将流程图和技术图转换为兼容的JSON格式，便于AI系统处理和查询。该模型在节点和边的检测上显著提升，能够自动提取图形信息。

🎯

🔎

Diagram2Graph项目通过自动化将图形转换为结构化JSON，解决了传统手动提取的低效问题。这一技术不仅提高了数据处理的效率，还使得AI系统能够更好地理解和利用图形信息，推动了知识图谱的应用发展。

Qwen2.5-VL-3B模型在节点和边的检测上分别提高了14.2%和23.4%。这种显著的性能提升得益于使用了LoRA进行微调，表明针对特定任务的模型优化能够有效提升AI在复杂视觉信息处理中的准确性。

未来计划包括通过Cypher解析器实现Neo4J集成和为边缘设备量化模型。这将进一步拓展Diagram2Graph的应用场景，使其能够在更多实际环境中高效运行，尤其是在资源受限的设备上。

❓

Qwen2.5-VL模型可以将流程图和技术图转换为兼容的JSON格式，便于AI系统处理和查询。

Diagram2Graph项目旨在自动化图形到图的提取过程，提升图形信息的可用性。

Qwen2.5-VL-3B模型在节点检测上提高了14.2%，在边检测上提高了23.4%。

模型接受图像输入，提取节点、边和元数据，并输出结构化的JSON格式。

Qwen2.5-VL是针对特定任务微调的视觉语言模型，避免了API限制和高成本，同时减少了幻觉现象。

未来计划包括通过Cypher解析器进行Neo4J集成和为边缘设备量化模型。

🏷️