Tesseract-OCR+pytesseract验证码环境搭建及简单demo操作实例

    xiaoxiao2022-12-07  40

    安装包

    安装包:https://pan.baidu.com/s/1WE_K-pWN53mHoHcimD0jVA  提取码:8fwj 

    环境:Anaconda3

    安装过程

    安装Tesseract

    解压文件,执行”tesseract-ocr-setup-4.00.00dev.exe”,默认安装,本文安装目录为”C:\Tesseract-OCR”。把”tessdata-master.zip”解压,把解压后的内容,拷贝到”C:\Tesseract-OCR\tessdata”目录下。

    安装完毕之后,设置环境变量:

    TESSDATA_PREFIX= C:\Tesseract-OCR\tessdata

    在Path中添加”C:\Tesseract-OCR”,进行上文操作之后,Tesseract-OCR安装完毕。

    安装pytesseract

    进入到pytesseract-0.2.6.tar.gz所在目录,执行命令”pip install pytesseract-0.2.6.tar.gz”。

    进入到pytesseract-0.2.6.tar.gz所在目录,执行命令”pip install pytesseract-0.2.6.tar.gz”。安装成功。

    修改/Anaconda3/Lib/site-packages/pytesseract/pytesseract.py中的代码:

    # CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY tesseract_cmd = 'tesseract'

    修改为类似如下,tesseract_cmd为Tesseract-OCR目录下的tesseract文件

    # CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY tesseract_cmd = r'C:\Tesseract-OCR\tesseract'

     

    测试

    验证图片:

    测试代码:

    # -*- coding: utf-8 -*- from PIL import Image import pytesseract imagepath="logo.png" text=pytesseract.image_to_string(Image.open(imagepath),lang='chi_sim') print(text)

    执行执行上述代码:

    WEL测试 认证博客专家 软件测试 性能测试 接口测试 一线的测试工作人员。喜欢专研并应用新的技术,用于提升测试效率。擅长:测试新人培训、测试进阶、接口测试、性能测试、问题定位、自动化、数据测试、渗透测试! 如果对测试感兴趣或者遇到一些难题,可以加我微信:Wel_Test,加时填好备注!
    最新回复(0)