Credit Score

Resumo.

O projeto tem como objetivo criar um modelo de machine learning para o score de crédito, abrangendo todo o pipeline de processamento dos dados. O processo envolve as seguintes etapas:

Dados do projeto: Trata-se de um problema de credit scoring para cartão de crédito, utilizando uma amostra de 15 safras coletadas entre janeiro de 2015 e março de 2016. O objetivo é prever se um cliente entrará em inadimplência ou não pagará suas dívidas. Os clientes inadimplentes são marcados como "maus" no conjunto de dados.

Exploração de dados: Os dados coletados são explorados para entender sua estrutura, distribuição, correlações e possíveis padrões. Isso envolve a análise estatística dos dados, a visualização de gráficos e a identificação de insights relevantes.

Limpeza e pré-processamento dos dados: Nesta fase, os dados são submetidos a um processo de tratamento que envolve lidar com valores faltantes, codificar variáveis categóricas, normalizar ou padronizar variáveis numéricas, identificar e tratar outliers, e outras transformações necessárias.

O modelo: Após o tratamento adequado dos dados, utilizou-se a ferramenta pycaret para o treinamento do modelo e ajuste de hiperparâmetros. O algoritmo de machine learning escolhido foi o Light Gradient Boosting Machine devido ao seu bom desempenho e baixo custo computacional.

O modelo apos treinamento:

Caso queira ler em detalhes todo o projeto está documentado em detalhes aqui.

Deploy do modelo: Após o treinamento, ajuste e validação do modelo, procedeu-se à implementação no Streamlit. Foi desenvolvida uma aplicação que recebe novos dados e realiza as previsões do modelo, retornando ao usuário um arquivo Excel.

streamlit-app_pycaret-2023-05-19-14-05-31.webm

Ao longo de todo o processo, é crucial monitorar as métricas de desempenho do modelo. O objetivo final é desenvolver um modelo de score de crédito confiável e preciso, capaz de tomar decisões embasadas nos dados disponíveis.

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
.ipynb_checkpoints		.ipynb_checkpoints
.gitattributes		.gitattributes
.gitignore		.gitignore
Desenvolvimento..ipynb		Desenvolvimento..ipynb
Final LGBM Model 19mai2023.pkl		Final LGBM Model 19mai2023.pkl
LICENSE		LICENSE
README.md		README.md
app_pycaret.py		app_pycaret.py
credit_scoring.ftr		credit_scoring.ftr
logs.log		logs.log
streamlit-app_pycaret-2023-05-19-14-05-31.webm		streamlit-app_pycaret-2023-05-19-14-05-31.webm

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Credit Score

Resumo.

O projeto tem como objetivo criar um modelo de machine learning para o score de crédito, abrangendo todo o pipeline de processamento dos dados. O processo envolve as seguintes etapas:

Quanto aos resultados:

Curva ROC.

Precision- Recal

Matrix de confusão.

About

Releases

Packages

Languages

License

sannlin9/Projeto-Credit-Score

Folders and files

Latest commit

History

Repository files navigation

Credit Score

Resumo.

O projeto tem como objetivo criar um modelo de machine learning para o score de crédito, abrangendo todo o pipeline de processamento dos dados. O processo envolve as seguintes etapas:

Quanto aos resultados:

Curva ROC.

Precision- Recal

Matrix de confusão.

About

Topics

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages