- XGBoost + LightGBM : 조현상
- CatBoost : 강하운
데이터 분석 -> 레이블 인코딩 -> 적절한 모델 찾기 -> 베이지안 최적화 -> 스태킹 앙상블
- pandas를 사용해서 데이터 분석
- Null값과 Outlier 값 분석
- 기존 레이블 인코딩 튜닝
- XGBoost를 사용해서 각 피처에 중요도 확인
- 베이지안 최적화를 이용해서 하이퍼 파라미터 찾기
- 여러가지 모델과 스태킹
- 결측값 데이터를 깔끔하게 처리하지 못한 게 노이즈로 작용해서 점수를 떨어뜨렸던 거 같다.
- 다른 케글 고수분들이 한 데이터 드리블 방법을 보고 배울 것이다.