centos 安装tesseract
- 安装opencv
pip install opencv-python- yum install tesseract
会出现很多依赖库, 一直y- 安装pytesseract
pip install pytesseract
需要识别的图片图片
python code
import pytesseract
import cv2
image = cv2.imread("./1.jpg")
text = pytesseract.image_to_string(image, lang='eng') # 使用英文解析图片
print(text)
报错,错误提示如下,是因为缺少字库
下载字库
https://github.com/tesseract-ocr/tessdata
将缺少的字库eng.traineddate放到错误提示的路径下后,识别结果如下