环境
- python3.7
- windows10
- pycharm201802
1-下载并安装Tesseract:
- 下载Tesseract
Tesseract下载 - 安装Tesseract
不勾选Additional language data(download)选项 - 下载语言包
语言包下载下载eng和chi_sim即可。放入C:\Program Files (x86)\Tesseract-OCR\tessdata - 配置环境
在环境变量里新建 变量TESSDATA_PREFIX,值为C:\Program Files (x86)\Tesseract-OCR\tessdata
在path环境变量中加入C:\Program Files (x86)\Tesseract-OCR
2-下载相应的python类包
pip install pillow
pip install pytesseract
3-测试环境搭建是否成功
import pytesseract
from PIL import Image
image = Image.open("code.png")
print(pytesseract.image_to_string(image))