应用简介
健康码识别器是一款可以用来识别健康码图片的电脑软件,该软件可以帮助用户告别手工记录健康码信息的麻烦,采用了Python编写,可帮助大家自动识别健康码上的信息,并对信息进行自动的记录,此外,它也可以用于健康码以外的同类工作。
【主要功能】
调用百度【通用文字识别(标准版)】对图片进行ocr识别,将结果返回到【结果输出框】;
自定义正则表达式,从结果中获取需要的文本内容;(可设置在正则表达式返回的结果中选取第几个文本)
完成以上调试后,可将方案保存到本地的 '***.ff' 文件;
右键点击进度条,可对文件夹内的图片批量执行ocr、正则表达式获取,保存到Excel中。
【原理介绍】
1、申请百度OCR识别token,调用SDK对每张图片逐一识别,返回message;(软件中已使用我自己的token)
2、将百度OCR返回的列表转换为一个字符串,使用re正则表达式逐一获取姓名、截屏时间、末次核酸检测时间(人事部同事说只需要这几个信息);
3、使用dict和pandas将数据转存到Excel文件中。