Installation and Run
# 1. 가상환경 생성
python -m venv ppocr_env
# 2. 가상환경 활성화 및 환경 설치 (Windows)
ppocr_env\Scripts\activate
python -m pip install --upgrade pip
python -m pip install paddlepaddle
python -m pip install PPOCRLabel
# 3. PPOCRLabel 코드 다운로드
git clone https://github.com/PaddlePaddle/PPOCRLabel.git
cd PPOCRLabel
# 4. 실행
python PPOCRLabel.py
Run Recognition
PPOCRLabel의 AutoRecognition 사용 방법은 다음과 같다.
- 우상단 File > Open Dir > 데이터셋이 있는 폴더 선택: 해당 폴더에 있는 모든 이미지 파일을 File List에 불러온다.
- 우하단 Auto Recongtion 클릭: File List에 있는 모든 이미지에 Annotation을 진행한다. 데이터가 많을수록 시간이 오래 걸리니 기다리자. CPU로도 생각보다 괜찮은 속도가 나온다.
- cntrl+s 로 결과 저장: 1번에서 선택한 폴더에 Label.txt 파일로 저장된다.
PPOCRLabel을 이용한 OCR 데이터 Annotation (for Windows)
PaddlePaddle에서 제공하는 Annotation 프로그램 을 PPOCRLabel을 이용해 한국어 데이터에 직접 BBox를 만들어보자!
velog.io
'
'📚 Study > AI' 카테고리의 다른 글
EasyOCR 커스텀 데이터셋에서 finetuning 하기 (2) - pretrained weight로 먼저 실험 (0) | 2025.05.29 |
---|---|
EasyOCR 커스텀 데이터셋에서 finetuning 하기 (1) - EasyOCR 모델 구조 (1) | 2025.05.29 |
Diffusion Model 수학이 포함된 tutorial (1/2) (0) | 2024.07.17 |
[딥러닝과 설계] GAN (0) | 2024.07.11 |
[딥러닝과 설계] VAE(Variational AutoEncoder) (0) | 2024.07.10 |