赞
踩
PaddleOCR是百度深度学习框架PaddlePaddle开源的OCR项目,旨在打造一套丰富、领先、且实用的OCR工具库,助力使用者训练出更好的模型,并应用落地。PaddleOCR包含丰富的文本检测、文本识别以及端到端算法。
你可能用到的网址:
PaddleOCR特性:
我用的是在 Pycharm 内自动安装,版本默认了当前最高,方便高效。
PaddleOCR提供的可下载模型包括推理模型、训练模型、预训练模型、slim模型,下载地址如下(官网入口):
我使用的是【PP-OCRv3】模型,下载到本地之后分别进行解压,创建一个models文件夹,把下载好的模型文件解压到该models文件夹中,并将models文件夹放入到PaddleOCR根目录下,如下所示:
文字模板不是必须的,在 draw_ocr() 方法中使用文字模板是为了提高图片的文字识别率。
因为是识别网络字体,所以我使用的是【SIMSUN.TTC】文字模板。SIMSUN.TTC 是一款很常见、实用的电脑字体,需要的小伙伴,百度【SIMSUN.TTC】就可以找到下载链接。
读取图片需要用到 OpenCV 的技术,然后利用 PaddleOCR 进行图片的文字识别,识别过程中可以自定义训练模型和文字模板,这会影响最终文字的识别率。
就用篇头展示的图片吧,这是京东商城某商品的介绍图。
- # _*_coding:utf-8_*_
- # 作者: Java Punk
- # 时间: 2022-10-09 14:49:45
- # 功能: 图片文字识别
-
- import cv2
- from math import *
- import numpy as np
- from PIL import Image
- from paddleocr import PaddleOCR, draw_ocr
-
- def img_match(img_address):
- # Paddleocr目前支持的多语言语种可以通过修改lang参数进行切换
- # 例如:`ch`, `en`, `fr`, `german`, `korean`, `japan`
- # 这里 use_angle_cls=False 为不使用自定义训练集
- ocr = PaddleOCR(use_angle_cls=False, lang="ch", use_gpu=False)
- # use_angle_cls=True使用训练模型,模型放在models目录下
- # ocr = PaddleOCR(use_angle_cls=True,lang="ch",
- # rec_model_dir='../models/ch_PP-OCRv3_rec_slim_infer/',
- # cls_model_dir='../models/ch_ppocr_mobile_v2.0_cls_slim_infer/',
- # det_model_dir='../models/ch_PP-OCRv3_det_slim_infer/')
- src_img = cv2.imread(img_address)
- h, w = src_img.shape[:2]
- big = int(sqrt(h * h + w * w))
- big_img = np.empty((big, big, src_img.ndim), np.uint8)
- yoff = round((big - h) / 2)
- xoff = round((big - w) / 2)
- big_img[yoff:yoff + h, xoff:xoff + w] = src_img
- # 文字识别
- matRotate = cv2.getRotationMatrix2D((big * 0.5, big * 0.5), 0, 1)
- dst = cv2.warpAffine(big_img, matRotate, (big, big))
- result = ocr.ocr(dst, cls=True)
- boxes = [line[0] for line in result]
- txts = [line[1][0] for line in result]
- scores = [line[1][1] for line in result]
- # simsun.ttc 是一款很常见、实用的电脑字体,这里作为识别的模板
- # 我们利用该模板进行文字识别
- im_show = draw_ocr(dst, boxes, txts, scores, font_path='../fonts/SIMSUN.TTC')
- im_show = Image.fromarray(im_show)
- img = np.asarray(im_show)
- # 展示结果
- cv2.imshow('img', img)
- cv2.waitKey(0)
- # 图片识别结果保存在代码同目录下
- # im_show.save('result.jpg')
- # 关闭页面
- cv2.destroyAllWindows()
- pass
-
- if __name__ == '__main__':
- print("———————————————————— start ————————————————————\n")
- # 图片路径自己设置,下面是我本地的路径,记得替换!!!
- img_match('../img/jd/goods_02.png')
- print("———————————————————— end ————————————————————\n")

最终识别率还不错。
大家可以自行练习不使用 lang="ch",训练模型和文字模板,或者只使用其中的几个看看效果怎样。
结论可以先告诉大家:文字的识别率会有不一样,当识别率低的时候,个别文字会被识别错误。
赞
踩
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。