如鱼饮水 ·

尝试使用PaddleOCR-VL

💡 原文中文，约7800字，阅读约需19分钟。

📝

内容提要

本文讨论了在WSL、Windows和Kaggle上部署PaddleOCR-VL的过程，指出了显存不释放和程序卡死等问题。作者分享了详细的安装步骤和代码示例，并提出了优化显存使用的方法。

🎯

🔎

在使用PaddleOCR-VL时，显存管理至关重要。文章提到显存不释放的问题，可能导致推理速度下降。建议在每次推理后手动进行垃圾回收和显存释放，以确保系统性能不受影响。

程序卡死的问题可能与模型缓存有关。文章中提到，删除缓存后可以改善情况，因此在遇到卡死时，尝试清理缓存可能是一个有效的解决方案。

在Kaggle上部署PaddleOCR-VL时，使用双卡进行推理需要采用多进程方式，而非简单指定设备。这一点对于提高推理效率非常关键，尤其是在处理大规模数据时。

❓

在WSL上部署PaddleOCR-VL需要安装特定版本的safetensors，并确认PaddleX版本。可以使用命令行安装相关依赖。

在Windows上部署时，常见的错误是kernel未注册，可以通过修改配置文件解决。

在Kaggle上使用PaddleOCR-VL时，建议选择GPU T4 x2，并使用多进程进行推理。

可以通过手动垃圾回收和设置环境变量来解决显存不释放的问题。

程序卡死可能与模型缓存有关，删除缓存后可能会改善情况。

使用生成器进行推理可以有效管理显存占用，避免一次性加载所有数据。

🏷️