EasyOCR ์ปค์คํ ๋ฐ์ดํฐ์ ์์ finetuning ํ๊ธฐ (2) - pretrained weight๋ก ๋จผ์ ์คํ
chatgptํํ ๋ธ๋ก๊ทธ์ ์ฌ๋ฆด ocrํ๊ธฐ ์ข์ ์ด๋ฏธ์ง๋ฅผ ๋ง๋ค์ด ๋ฌ๋ผ๊ณ ํ๋ค.
import easyocr
reader = easyocr.Reader(['en']) # this needs to run only once to load the model into memory
result = reader.readtext("./EasyOCR/trainer/all_data/practice.png")
result
[([[125, 321], [793, 321], [793, 533], [125, 533]],
'STATION',
0.9997768703106611)]
๋ค์ ์ฝ๋๋ฅผ ์คํํด๋ณด๋ฉด,
(1) ๊ฒ์ถํ bounding box์ ์์น (2) ๊ฒ์ถํ text (3) Confidence Score
์ด๋ ๊ฒ ์ธ ๊ฐ์ ์ ์ ์๋ค.
์ด ๊ฒฝ์ฐ์๋ detection๊ณผ recognition ๋ชจ๋ ์ฝ๋์ ๊ตฌํ๋ pretrained weight๋ฅผ ์ฌ์ฉํ๋ค.
์์ ๊ฐ์ด ๋๋ฌด ๊ฐ๋จํ ์ด๋ฏธ์ง์ ๋ํด ์ํ๊ธธ๋, ์ง์ ์ฐ์ ์ด๋ฏธ์ง๋ก ์๋ํด๋ดค๋ค.
[([[358, 390], [799, 390], [799, 518], [358, 518]],
'Hollo Kitty',
0.8144684320052101),
([[491, 507], [659, 507], [659, 544], [491, 544]],
'123 SANRIO',
0.49120615698523307)]
๋๋ถ๋ถ ์ํ์ง๋ง, ์กฐ๊ธ์ ํ๋ฆฌ๋ ๊ฒ์ ๋ณผ ์ ์์๋ค.
๋ด๊ฐ ํ๋ ค๋ ๊ณผ์ ๋ ์ ์กฐ ๊ณต์ ๊ณผ์ ์์ ๋ถ๋์ ๊ฒ์ถํ๊ณ ์ถ์๊ธฐ ๋๋ฌธ์ ๋ ๋์ ์ ํ๋๊ฐ ํ์ํ๋ค.
๋ฐ๋ผ์ finetuning์ ํ๋ ๋ฐฉ๋ฒ์ ์๊ฐํ๋ค.