DEV Community ·

发票关键信息提取的实用方法（第二部分）

💡 原文英文，约1900词，阅读约需7分钟。

📝

内容提要

作者在第二部分探讨了使用开源LLM（如Qwen2 2B和LLaMA 3.1）进行发票关键信息提取的方法。尽管Qwen2在提取基本信息方面表现良好，但在处理长文本和细节时存在局限。结合LLaMA 3.1进行后处理可提高准确性。未来将专注于微调Qwen2VL模型，以提升提取精度和效率。

🎯

🔎

使用开源LLM（如Qwen2和LLaMA 3.1）进行发票信息提取，能够有效避免数据隐私问题。与依赖第三方服务的解决方案相比，开源模型允许用户在本地运行，从而对敏感数据保持完全控制。这对于处理涉及个人或商业机密的发票信息尤为重要。

结合Qwen2和LLaMA 3.1的策略，先用Qwen2提取原始信息，再用LLaMA 3.1进行后处理，能够显著提高提取的准确性。尽管Qwen2在基本信息提取上表现良好，但在长文本处理和生成有效JSON输出方面存在局限，后处理可以弥补这些不足。

未来将专注于微调Qwen2VL模型，以提升发票信息提取的精度和效率。针对收据数据进行专门的训练，可能是解决当前模型在细节提取上挑战的关键。这一过程将有助于提高模型在实际应用中的表现，尤其是在复杂发票的处理上。

❓

可以使用Qwen2 2B和LLaMA 3.1模型，先用Qwen2提取原始信息，再用LLaMA 3.1进行后处理以提高准确性。

Qwen2在处理长文本和生成有效JSON输出方面存在困难，尤其在细节提取上表现不佳。

LLaMA 3.1擅长处理长文本和多语言支持，可以作为后处理工具来验证和映射提取的值。

这两个模型在有限硬件资源下运行高效，适合进行发票信息提取。

未来将专注于微调Qwen2VL模型，以提高在收据数据上的提取性能。

PaddleOCR可以提升Qwen2的视觉能力，从而改善信息提取的准确性。

🏷️