ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • tesseract-ocr pytesseract 설치
    Python 2017. 5. 19. 09:29


    파이썬 참.. 설치가 만만치 않다.  멀 이렇게 설치하라고 하는게 많은건지.. 

    그래도 반복하면  점점 익숙해지고  python 의 심연을 볼수 있는 날이 올수 있을거라 믿는다. 



    이번엔 OCR 설치! 

    tesseract-ocr 라는 걸 활용해서 문자 인식을 처리해야한다.  공식사이트 

    OS : ubuntu-16.04.2-desktop-amd64

    1. 바이너리 설치 

    sudo apt-get  install  tesseract-ocr  libtesseract-dev libleptonica-dev


    2.  필수 라이브러리 설치 

    sudo apt-get install autoconf automake libtool pkg-config libpng12-dev libjpeg8-dev libtiff5-dev zlib1g-dev

    sudo apt-get install libleptonica-dev


    3. 파이썬 이미지 라이브러리 설치 

    python3.6 -m pip install Pillow

    * 그런데 이부분이 문제가 되는 상황이 있었다. 


    PIL 라이브러리가 이미 설치되어있었고 제대로 동작하지 않아서 재설치했다. 

    에러 화면은  아래와 같이  이미지 라이브러리 임포트가 안되는 상황

    검색해보니 삭제하고 재설치하라는 내용 

    http://stackoverflow.com/questions/25340698/importerror-cannot-import-name-imaging


    그래서 위 에러 화면에 나온 경로에 가서 

    PIL ,  Pillow-3.1.2.egg-info  2개 파일 삭제 후 재설치!


    이후 정상적으로 import 되는것 확인


    실제 인식 테스트 

    vi Ocr.py

    from PIL import Image
    import pytesseract
    print(pytesseract.image_to_string(Image.open('2.png')))


    샘플 인식 이미지 2.png



    결과 화면




    막상 적용해보니 OCR 인식률이 정말 엉망이다. ㅠㅠ

    심지어 윈도우에서 인식 되던것이 리눅스에서는 안된다 -_- 머지..



    암튼 애드온으로 더 트라이를 해봐야것다.


    https://github.com/tesseract-ocr/tesseract/wiki/AddOns#tesseract-wrappers




    'Python' 카테고리의 다른 글

    CentOS 6.9 에 Python 3.6 설치하기  (0) 2019.09.12
    python3 cx_Oracle 설치  (2) 2017.05.17
    ubuntu 에 Python3 설치  (0) 2017.05.16
    파이썬 + Django 설치  (0) 2017.04.29

    댓글

Designed by Tistory.