-
tesseract-ocr pytesseract 설치Python 2017. 5. 19. 09:29
파이썬 참.. 설치가 만만치 않다. 멀 이렇게 설치하라고 하는게 많은건지..
그래도 반복하면 점점 익숙해지고 python 의 심연을 볼수 있는 날이 올수 있을거라 믿는다.
이번엔 OCR 설치!
tesseract-ocr 라는 걸 활용해서 문자 인식을 처리해야한다. 공식사이트
OS : ubuntu-16.04.2-desktop-amd64
1. 바이너리 설치
sudo apt-get install tesseract-ocr libtesseract-dev libleptonica-dev
2. 필수 라이브러리 설치
sudo apt-get install autoconf automake libtool pkg-config libpng12-dev libjpeg8-dev libtiff5-dev zlib1g-dev
sudo apt-get install libleptonica-dev
3. 파이썬 이미지 라이브러리 설치
python3.6 -m pip install Pillow
* 그런데 이부분이 문제가 되는 상황이 있었다.
PIL 라이브러리가 이미 설치되어있었고 제대로 동작하지 않아서 재설치했다.
에러 화면은 아래와 같이 이미지 라이브러리 임포트가 안되는 상황
검색해보니 삭제하고 재설치하라는 내용
http://stackoverflow.com/questions/25340698/importerror-cannot-import-name-imaging
그래서 위 에러 화면에 나온 경로에 가서
PIL , Pillow-3.1.2.egg-info 2개 파일 삭제 후 재설치!
이후 정상적으로 import 되는것 확인
실제 인식 테스트
vi Ocr.py
from PIL import Image
import pytesseract
print(pytesseract.image_to_string(Image.open('2.png')))샘플 인식 이미지 2.png
결과 화면
막상 적용해보니 OCR 인식률이 정말 엉망이다. ㅠㅠ
심지어 윈도우에서 인식 되던것이 리눅스에서는 안된다 -_- 머지..
암튼 애드온으로 더 트라이를 해봐야것다.
https://github.com/tesseract-ocr/tesseract/wiki/AddOns#tesseract-wrappers
'Python' 카테고리의 다른 글
CentOS 6.9 에 Python 3.6 설치하기 (0) 2019.09.12 python3 cx_Oracle 설치 (2) 2017.05.17 ubuntu 에 Python3 설치 (0) 2017.05.16 파이썬 + Django 설치 (0) 2017.04.29