📃 프로젝트 개요

합성데이터란 실제 환경에서 수집되거나 측정되는 것이 아니라 디지털 환경에서 생성되는 데이터셋으로, 최근 방대한 양질의 데이터셋이 필요해짐에 따라 그 중요성이 대두되고 있습니다. 이러한 합성데이터를 활용하여 자동차 탐지를 수행하여, 34가지의 자동차 세부모델까지 판별하는 AI 모델을 개발하는 대회입니다.

💾 데이터셋

전체 이미지 개수 : 9754장 (Training : 6481장, Test : 1700장)
34 class : chevrolet_malibu_sedan_2012_2016, chevrolet_malibu_sedan_2017_2019, ..., ssangyong_tivoli_suv_2016_2020
이미지 크기 : (1920, 1040)

✏ 프로젝트 수행 방법

Data Preprocessing

StratifiedGroupKFold
Heavy Augmentation
Validation Augmentation for Synthetic data
```
💡 validation aug를 주어 실제 test data와 유사한 노이즈를 가지도록 하기
```
- 문제상황 : 합성 데이터로 train과 validation을 나누어 진행하여, test 데이터와 차이 발생
  1. 합성 데이터 그대로 학습을 진행하게 되면 2 에포크 정도만 돌아도 모든 score가 만점을 받게 된다.
  2. 이렇게 만점을 받아도 real 데이터인 test 데이터에서의 점수는 높지 않다.
- 아이디어 : validation과 test 데이터와의 간극을 좁힐 필요가 있다.
  1. 실제 데이터에서는 움직이고 있는 blur 된 차량 이미지들이 있다. ⇒ Blur 관련 aug를 추가
  2. 실제 데이터에서는 가로등에 의해 일부분이 가려진 차량 이미지들이 있다. ⇒ CoarseDropout aug를 추가
  3. 차량의 색상은 class label에 영향을 끼치지 않는다. ⇒ 색상 관련 aug를 추가

Modeling

Model
- Cascade RCNN
- Cascade Mask RCNN
Backbone
- Swin Transformer - Small
- ConvNeXt - Tiny
- Res2Net

🏆 프로젝트 결과

Ensemble

convnext	swin	res2net	Ensemble
0.954	0.963	0.955	0.992

Score

팀원 소개

황순영	이하정
swin, res2net modeling, ensemble	data preprocessing, convnext modeling

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

README.md

📃 프로젝트 개요

💾 데이터셋

✏ 프로젝트 수행 방법

Data Preprocessing

Modeling

🏆 프로젝트 결과

팀원 소개

Files

README.md

Latest commit

History

README.md

File metadata and controls

📃 프로젝트 개요

💾 데이터셋

✏ 프로젝트 수행 방법

Data Preprocessing

Modeling

🏆 프로젝트 결과

팀원 소개