영상:  https://www.youtube.com/watch?v=L8q-KCbXybc

 

이거보고 따라하는거구요

윈도우즈는 환경이 좀 까다롭군요

시작 메뉴 열고  store 라고 치면 마소 스토어가 열립니다.

python3 를 검색해 설치합니다.

 

제 경우 python 2 버전 때문인지

python3 

pip3 

이런식으로 명령어에 3 을 붙여야 3으로 동작하네요

 

설치가 끝났으면 

 

Home

Tesseract Open Source OCR Engine (main repository) - UB-Mannheim/tesseract

github.com

여기로 가서 윈도우즈 64bit 용 tesseract 를 다운받아 설치합니다.

설치경로는

C:\Tesseract-OCR

여기로 했습니다.

 

환경변수에 등록해야하니 시작메뉴 열어 `환경` 이라고 치면

이런식으로 환경 변수 설정 메뉴가 있습니다.

 

요런 창이 열리는데 '고급' 에 가셔서

아래쪽에 '환경변수' 버튼을 누릅니다.

윈족에 Path 더블클릭

새로만들기 눌러 한칸 추가하고

설치파일 설치한 경로를 입력합니다.

저는

c:\Program Files\Tesseract-OCR

넣었다 안되서 

C:\Tesseract-OCR

여기로 다시 설치했는데 환경변수 등록을 안한게 문제였던거 같군요

추가로 한국어 를 인식할려면 언어팩을 설치해야합니다.

kor.traineddata

파일을 받을 수 있습니다.

C:\Tesseract-OCR\tessdata

폴더안에 넣어둡니다.

 

파이션은 영상에서처럼

pip3 install pytesseract
pip3 install Pillow
 
쳐서 설치합니다.
 
 

 

app.py 파일

import pytesseract
from PIL import Image

path = r'C:\Tesseract-OCR\tesseract.exe';
print(path);
pytesseract.pytesseract.tesseract_cmd = path;

a = Image.open('a.png');
r = pytesseract.image_to_string(a, lang='kor');
print(r);



전체코드 입니다.

 

.a.png 그림은  검색해서 가져왔음

결과는

PS C:\project\pantheon\py-mytesseract> python3 .\app.py
C:\Tesseract-OCR\tesseract.exe
애116           1791             [깃 0

영수증 상세

04을지로파인애비뉴점

2,000원

신한 신용카드 (0188)

승인 일시              2019-06-1117:41:08
30720911

[그

승(



부가세                                 181원
봉사료                                    0원
가맹점명                 ㅇ4을지로파인애비뉴점
사업자 번호                  232-21-00198

0100422088

한 0                               ~ -:빠

PS C:\project\pantheon\py-mytesseract> 

 

 

이것저것 해봤는데 영어랑 섞이면 잘 안되는군요

환경변수 등록하고 잘안되서 윈도우 재시작도 한번 해봤습니다.

참고

 

 


WRITTEN BY
SIDNFT
게임개발자에서 WEBGL 웹개발자로 전환중

,