Kernel Memory 中使用 PaddleSharp OCR
💡
原文中文,约2200字,阅读约需6分钟。
📝
内容提要
Kernel Memory支持使用OCR技术识别上传的图片中的文字。可以使用Azure Document Intelligence或自定义的OCR服务,如PaddleSharp OCR。在构建Kernel Memory时注册相应的OCR服务,然后可以自动调用OCR服务进行图片处理。代码实现已上传至GitHub。
🎯
关键要点
-
Kernel Memory支持使用OCR技术识别上传的图片中的文字。
-
官方默认库提供Azure Document Intelligence的扩展服务。
-
构建Kernel Memory时调用WithAzureAIDocIntel方法注册Azure服务。
-
可以使用自定义的OCR服务,如PaddleSharp OCR。
-
实现自定义OCR服务需实现IOcrEngine接口,包含ExtractTextFromImageAsync方法。
-
使用PaddleSharp需要安装多个Nuget包。
-
实现IOcrEngine接口的PaddleSharpOcrEngine类用于处理图片。
-
注册自定义OCR服务后,处理图片时会自动调用PaddleSharp OCR服务。
-
相关代码已上传至GitHub,提供了完整实现和参考链接。
🏷️
标签
➡️