模型：飞浆---用paddleocr实现身份证识别并对识别结果整合处理_身份证识别模型

作者：运维做开发 | 2024-06-24 23:01:38

踩

身份证识别模型

文章目录

本文用的python 3.7.16
借鉴了GitHub：https://github.com/Hammer-888/IDCard-OCR-Paddle

一、使用ocr读取身份证信息

import os
import sys
import cv2
from paddleocr import PaddleOCR

proj_path = os.path.dirname(os.path.dirname(os.path.dirname(os.path.abspath(__file__))))
sys.path.append(proj_path)

PaddleOCR = PaddleOCR(use_angle_cls=True, lang="ch")

def ocrRead(image_path):
    # 读取身份证图片，并使用ocr.ocr()方法进行文字检测和识别，返回一个包含文字信息的列表
    img = cv2.imread(image_path)
    result = PaddleOCR.ocr(img)
    return result

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

二、对ocr识别结果整合

import os
import sys
import re
import string

proj_path = os.path.dirname(os.path.dirname(os.path.dirname(os.path.abspath(__file__))))
sys.path.append(proj_path)

class IdCardStraight:

    def __init__(self, result):
        self.result = [
            i.replace(" ", "").translate(str.maketrans("", "", string.punctuation))
            for i in result
        ]
        self.out = {
   }
        self.res = self.out
        self.res["name"] = ""
        self.res["idcard"] = ""
        self.res["birthday"] = ""
        self.res["address"] = ""
        self.res["sex"] = ""
        self
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23

声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：【wpsshop博客】