Skip to content

Latest commit

 

History

History
189 lines (132 loc) · 8.52 KB

README.md

File metadata and controls

189 lines (132 loc) · 8.52 KB

Review Assignment Due Date

효율적인 One-Class 이상치 탐지: 화학공정 데이터를 활용한 시각화

Team

1
2
3
가상민
신동혁
김도연
Github Github Github
4
5
6
7
김다운
서상혁
장호준
이소영
Github Github Github Github

0. Overview

Environment

  • AMD Ryzen Threadripper 3960X 24-Core Processor
  • NVIDIA GeForce RTX 3090
  • CUDA Version 12.2

Requirements

astunparse==1.6.3
attrs==23.1.0
brotlipy==0.7.0
dnspython==2.4.2
expecttest==0.1.6
fsspec==2023.9.2
hypothesis==6.87.1
joblib==1.3.2
jsonpointer==2.1
matplotlib==3.8.2
mkl-service==2.4.0
nbformat==5.9.2
pandas==2.1.4
pathlib==1.0.1
plotly==5.18.0
pyarrow==14.0.2
python-dateutil==2.8.2
python-etcd==0.4.5
scikit-learn==1.3.2
scipy==1.11.4
sortedcontainers==2.4.0
threadpoolctl==3.2.0
triton==2.1.0
types-dataclasses==0.6.6
tzdata==2023.4

1. Competiton Info

Overview

24시간 내내 운영되는 화학 공정은 이상이 발생하면 막대한 금전적 피해를 입을 수 있습니다. 공정 상태를 예측하고 대비책을 마련하는 것이 중요한 과제인데, 이를 위해서는 공정 데이터를 이해하고 이상 징후를 파악하는 것이 필수적입니다.

본 대회는 화학 공정 데이터를 이용한 이상 탐지(anomaly detection)를 수행하여, 공정 데이터에서 비정상적인 동작을 탐지하는 것을 목표로 합니다. 이를 통해 공정에서 발생할 수 있는 문제를 예측하고 대비할 수 있습니다.

본 대회에서 사용되는 입력 데이터와 출력 데이터는 모두 CSV 파일 형태로 제공됩니다. 입력 데이터로는 약 25만 개의 화학 공정 데이터가 제공되며, 이에 대응하는 약 7만 2천 개의 출력 데이터가 제공됩니다.

이상 탐지를 위한 알고리즘 개발은 화학 공정 분야에서 매우 중요한 과제이며, 이를 통해 공정의 안정성을 높이고 예기치 않은 문제를 예방할 수 있다는 점에서 큰 의미가 있습니다.

Evaluation Metric

본 대회에서는 정상과 이상에 대한 F1-Score 를 계산하여 모델의 성능을 평가합니다.

이상인 경우 : 1

정상인 경우 : 0

사용되는 정답 Label 은 위와 같으며, 실제 정답의 정상/이상과 모델의 정상/이상을 계산하여 F1 Score 를 산출합니다.

Accuracy Score 또한 리더보드에 참고용으로 제공되나, 등수 산정은 F1 Score 만을 기준으로 합니다.

image

2. Components

Directory

image

image

EDA

image

image

3. Dimension Reduction

차원 축소

image

image

4. Modeling

모델링

image

image

image

image

image

image

image

image

image

image

5. Result

사후분석

image

활용방안

image

  • Python Dash를 활용해 InterActive Dashboard를 구성하였습니다. 임시로 전체적인 사진만 업로드 했습니다.

Presentation

etc

Meeting Log

  • 전체적인 내용은 진행 Notion, 간트차트에서 확인하실 수 있습니다.
  • Apr 8 ~ May 2 : Online & Offline Meeting

Reference

  1. 화학 공정 데이터 칼럼 정보