https://github.com/JaidedAI/EasyOCR
GitHub - JaidedAI/EasyOCR: Ready-to-use OCR with 80+ supported languages and all popular writing scripts including Latin, Chines
Ready-to-use OCR with 80+ supported languages and all popular writing scripts including Latin, Chinese, Arabic, Devanagari, Cyrillic and etc. - JaidedAI/EasyOCR
github.com
EasyOCR์ด๋?
EasyOCR์ PyTorch ๊ธฐ๋ฐ์ ์คํ์์ค OCR(Optical Character Recognition) ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ก,
์ ์ธ๊ณ 80๊ฐ ์ด์์ ์ธ์ด๋ฅผ ์ง์ํ๋ฉฐ, ๊ฐ๋จํ ์ฝ๋ ํ ์ค๋ก ์ด๋ฏธ์ง ์ ํ ์คํธ๋ฅผ ์ฝ์ด๋ผ ์ ์๋ ๋งค์ฐ ์ง๊ด์ ์ธ OCR ๋๊ตฌ์ด๋ค.
ํ์ดํ๋ผ์ธ
์ ๊ทธ๋ฆผ์ EasyOCR์ end-to-end ํ์ดํ๋ผ์ธ์ ๋์ํํ ๊ฒ์ด๋ค.
1๏ธโฃ Pre-Process
: ์ด๋ฏธ์ง ํฌ๊ธฐ ์กฐ์ , ์์ ์ ๊ทํ ๋ฑ ๊ธฐ๋ณธ ์ ์ฒ๋ฆฌ ์ํ
2๏ธโฃ Detection (CRAFT)
: ํ
์คํธ๊ฐ ์ด๋์ ์๋์ง๋ฅผ ์ฐพ๋ ๋จ๊ณ
: ํ์ง๋ ์์ญ์ bounding box๋ก ์ถ๋ ฅ๋์ด recognition ๋จ๊ณ๋ก ์ ๋ฌ
3๏ธโฃ Mid-Process
: Bounding Box๋ฅผ ๊ธฐ์ค์ผ๋ก crop
: Recognition ๋ชจ๋ธ์ ๋ฃ๊ธฐ ์ํ ์ ๋ ฌ๊ณผ ๋ฆฌ์ฌ์ด์ง ์ํ
4๏ธโฃ Recognition (CNN + LSTM + CTC)
: cropped ์ด๋ฏธ์ง → ๋ฌธ์์ด๋ก ๋ณํ
: CNN > ์ด๋ฏธ์ง ํน์ง ์ถ์ถ, BiLSTM > ์ํ์ค ๋ชจ๋ธ๋ง, CTC > Connectionist Temporal Classification loss๋ก ํ์ต
5๏ธโฃ Decoder (Greedy or Beam Search)
: ์์ธก๋ ์ํ์ค๋ฅผ ๋ฌธ์์ด๋ก ๋ณํ
6๏ธโฃ Post-Process
: ์์ธก ๊ฒฐ๊ณผ ์ ๋ ฌํ๊ณ Confidence Threshold ์ ์ฉ
EasyOCR์์ ์ปค์คํฐ๋ง์ด์ง ๊ฐ๋ฅํ ์์ญ์ ๊ทธ๋ฆผ์์ ํ์๋ ํ์ ๋ถ๋ถ์ผ๋ก, ์๋์ ๊ฐ๋ค.
๊ตฌ์ฑ ์์ | ๋ณ๊ฒฝ ๊ฐ๋ฅ ์ฌ๋ถ | ์ค๋ช |
Detection | ๊ฐ๋ฅ (CRAFT ์ธ ๋ชจ๋ธ ์ฌ์ฉ) | ํน์ ํ ๋ฐฐ๊ฒฝ์ด๋ ํ ์คํธ ์์น์ ๋ง๊ฒ ํ๋ ๊ฐ๋ฅ |
Recognition | ๊ฐ๋ฅ (Fine-tuning or custom ํ์ต) | ๋๋ถ๋ถ์ ์ปค์คํ OCR ์์ ์์๋ ์ด ๋ถ๋ถ๋ง ์์ |
Decoder | ๊ฐ๋ฅ | Greedy, BeamSearch, Attention ๊ธฐ๋ฐ ๋์ฝ๋ ๋ฑ ๊ต์ฒด ๊ฐ๋ฅ |
๋์ ๊ฒฝ์ฐ์๋, ์ผ๋จ Recognition ๋ถ๋ถ๋ง finetuningํด์ ๋ชจ๋ธ์ ์ฑ๋ฅ์ ์ฌ๋ฆด ์๊ฐ์ด๋ค.
+ ์ฐธ๊ณ ๋ก ์๋ ์ฑ๋ฅ์ด ๋ ์ข๋ค๊ณ ์๋ ค์ง paddleocr finetuning์ ์๋ํ๋๋ฐ ๋ฒ์ ์ ๋ฐ๋ผ ์ฝ๋๊ฐ ์ ๋์๊ฐ๋ ์ค๋ฅ๊ฐ ๋ง์ด ์๊ฒผ๋ค. ๊ทธ๋ฆฌ๊ณ document๋ ์ค๊ตญ์ด ์์ฃผ๋ก ๋์ด ์์ด์ ํฌ๊ธฐํ๋ค. ์ต์ํ tool์ธ pytorch๋ฅผ ์ฌ์ฉํ ์ ์๋ easyocr์ด ๋ ์ ํฉํ๋ค.
'๐ Study > AI' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
EasyOCR ์ปค์คํ ๋ฐ์ดํฐ์ ์์ finetuning ํ๊ธฐ (3) - recognition model train (0) | 2025.05.29 |
---|---|
EasyOCR ์ปค์คํ ๋ฐ์ดํฐ์ ์์ finetuning ํ๊ธฐ (2) - pretrained weight๋ก ๋จผ์ ์คํ (0) | 2025.05.29 |
Window์์ PPOCRLabel ์คํํ๋ ๋ฐฉ๋ฒ (0) | 2025.05.11 |
Diffusion Model ์ํ์ด ํฌํจ๋ tutorial (1/2) (0) | 2024.07.17 |
[๋ฅ๋ฌ๋๊ณผ ์ค๊ณ] GAN (0) | 2024.07.11 |