当前位置:   article > 正文

快速部署OCR文字识别教程,简单易用_paddleocr源码下载

paddleocr源码下载

简介

PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库,助力开发者训练出更好的模型,并应用落地。本文介绍PaddleOCR的快速部署和识别测试,采用最新的识别模型,识别效果很好,平均置信度可达99%。

部署环境:Window10,CPU环境,Python3.10

1、下载PaddleOCR源代码

最新版本是2.7,共127M。源码下载地址如下:

PaddlePaddle/PaddleOCR

2、PyCharm打开OCR项目,创建python虚拟目录

3、设置源镜像为国内清华大学

为了后续安装依赖包下载速度更快这里修改python的镜像源。

pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple

4、安装PaddlePaddle框架

安装paddlepaddle最新版2.5.1

python -m pip install paddlepaddle==2.5.1 -i https://pypi.tuna.tsinghua.edu.cn/simple

5、安装项目依赖

pip install -r requirements.txt

6、测试OCR识别

检测+方向分类器+识别,第一次执行脚本会自动下载ppocr轻量级模型作为默认模型。

  1. from pprint import pprint
  2. from paddleocr import PaddleOCR
  3. ocr = PaddleOCR(use_angle_cls=True, lang="ch")
  4. img_path = './doc/imgs/ticket.jpg'#火车票
  5. result = ocr.ocr(img_path, cls=True)
  6. pprint(result)

总结

总的来说,PaddleOCR是一个功能丰富、高性能和易用的OCR工具库,适用于各种OCR任务的应用场景。它具有多种OCR任务支持、高性能和高效率、多语言支持、易用性和灵活性以及开源社区支持等优势。无论是个人开发者还是企业用户,都可以通过PaddleOCR快速构建和部署自己的OCR应用。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/代码探险家/article/detail/933574
推荐阅读
相关标签
  

闽ICP备14008679号