Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
code		code
README.md		README.md

Repository files navigation

데이터 제작 프로젝트

학습 데이터 추가 및 수정을 통한 이미지 속 글자 검출 성능 개선 대회

프로젝트 개요

주제
- OCR task는 글자 검출 (text detection), 글자 인식 (text recognition), 정렬기 (Serializer) 등의 모듈로 구성되지만, 본 대회에서는 '글자 검출' task 만을 해결
- 본 대회는 데이터를 구성하고 활용하는 방법에 집중하는 것을 장려하는 취지에서, 제공되는 베이스 코드 중 모델(EAST)과 관련한 부분을 변경하는 것이 금지
데이터
- 제공된 학습 데이터: 1510장
- 평가 데이터 : 크롤링된 이미지 300장

팀 구성

김도윤, 김형석, 박근태, 양윤석, 정선규 (총 5인)

프로젝트 상세 내용

데이터 셋 제작 → 학습 데이터의 양이 적었기에, ICDAR 17 5k, ICDAR19 5K 추가
Synthetic data set인 UnrealText로 pretrain 후, target data로 fine tuning
Multi-scale-crop training → 512~1024 사이로 random crop 후 512로 resize
다양한 글씨체, 글씨 변형에 대한 robustness 부여 위해 Elastic transform 사용

모델 개요

Model : EAST
Optimizer : Adam
Scheduler : MultiStepLr
Pretrained on Unrealtext

결과

	F1 score	순위
Public Leaderbord	0.6839	7/19
Private Leaderbord	0.6720	8/19

About

level2_dataannotation_cv-level2-cv-05 created by GitHub Classroom

Report repository

Releases

No releases published

Packages

No packages published

Languages

Jupyter Notebook 95.9%
Python 4.1%