当前位置:   article > 正文

模型:飞浆---用paddleocr实现身份证识别并对识别结果整合处理_身份证识别模型

身份证识别模型

本文用的python 3.7.16
借鉴了GitHub:https://github.com/Hammer-888/IDCard-OCR-Paddle

一、使用ocr读取身份证信息

import os
import sys
import cv2
from paddleocr import PaddleOCR

proj_path = os.path.dirname(os.path.dirname(os.path.dirname(os.path.abspath(__file__))))
sys.path.append(proj_path)

PaddleOCR = PaddleOCR(use_angle_cls=True, lang="ch")

def ocrRead(image_path):
    # 读取身份证图片,并使用ocr.ocr()方法进行文字检测和识别,返回一个包含文字信息的列表
    img = cv2.imread(image_path)
    result = PaddleOCR.ocr(img)
    return result

  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16

二、对ocr识别结果整合

import os
import sys
import re
import string

proj_path = os.path.dirname(os.path.dirname(os.path.dirname(os.path.abspath(__file__))))
sys.path.append(proj_path)

class IdCardStraight:

    def __init__(self, result):
        self.result = [
            i.replace(" ", "").translate(str.maketrans("", "", string.punctuation))
            for i in result
        ]
        self.out = {
   }
        self.res = self.out
        self.res["name"] = ""
        self.res["idcard"] = ""
        self.res["birthday"] = ""
        self.res["address"] = ""
        self.res["sex"] = ""
        self
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:【wpsshop博客】
推荐阅读
相关标签
  

闽ICP备14008679号