Kernel Memory 中使用 PaddleSharp OCR

💡 原文中文,约2200字,阅读约需6分钟。
📝

内容提要

Kernel Memory支持使用OCR技术识别上传的图片中的文字。可以使用Azure Document Intelligence或自定义的OCR服务,如PaddleSharp OCR。在构建Kernel Memory时注册相应的OCR服务,然后可以自动调用OCR服务进行图片处理。代码实现已上传至GitHub。

🎯

关键要点

  • Kernel Memory支持使用OCR技术识别上传的图片中的文字。

  • 官方默认库提供Azure Document Intelligence的扩展服务。

  • 构建Kernel Memory时调用WithAzureAIDocIntel方法注册Azure服务。

  • 可以使用自定义的OCR服务,如PaddleSharp OCR。

  • 实现自定义OCR服务需实现IOcrEngine接口,包含ExtractTextFromImageAsync方法。

  • 使用PaddleSharp需要安装多个Nuget包。

  • 实现IOcrEngine接口的PaddleSharpOcrEngine类用于处理图片。

  • 注册自定义OCR服务后,处理图片时会自动调用PaddleSharp OCR服务。

  • 相关代码已上传至GitHub,提供了完整实现和参考链接。

🏷️

标签

➡️

继续阅读