Skip to content

Latest commit

 

History

History

05-Riesgo de Obesidad (Python)

Detección del Riesgo de Obesidad: Análisis y Modelado Predictivo

Introducción

Este proyecto de Kaggle explora la detección del riesgo de obesidad basándose en varias características. Se utilizan diferentes modelos y técnicas de análisis de datos para mejorar la precisión de las predicciones.

Metodología y Contenido del Repositorio

  • Obesidad_KM_RF_1: Jupyter Notebook utilizando clustering no supervisado Kmeans y Random Forest.
  • Obesidad_KM_FE_RF_2: Jupyter Notebook que incluye Kmeans y Random Forest, con ingeniería de características adicional.
  • Obesidad_KM_FE_CB_3: Jupyter Notebook empleando Catboost en lugar de Random Forest, manteniendo las mejoras anteriores.
  • Obesidad_KM_FE_CB_VA_4: Jupyter Notebook como el anterior, pero añadiendo nuevas variables aportadas por expertos en salud.
  • train.csv: Dataset de entrenamiento utilizado en los análisis.

Enfoque

Cada notebook refleja una evolución en el análisis, desde técnicas básicas hasta la incorporación de mejoras y conocimientos específicos del campo de la salud.

Resultados

  • Comparación de diferentes modelos y técnicas para la detección del riesgo de obesidad.
  • Mejora en la precisión de las predicciones a través de la ingeniería de características y el aporte de conocimientos específicos.

Obesity Risk Detection: Analysis and Predictive Modeling

Introduction

This Kaggle project delves into obesity risk detection based on various features. Different data analysis models and techniques are used to enhance the accuracy of predictions.

Methodology and Repository Contents

  • Obesity_KM_RF_1: Jupyter Notebook using unsupervised Kmeans clustering and Random Forest.
  • Obesidad_KM_FE_RF_2: Jupyter Notebook including Kmeans and Random Forest, with additional feature engineering.
  • Obesity_KM_FE_CB_3: Jupyter Notebook using Catboost instead of Random Forest, maintaining previous improvements.
  • Obesity_KM_FE_CB_VA_4: Jupyter Notebook similar to the previous, but adding new variables contributed by health experts.
  • train.csv: Training dataset used in the analyses.

Approach

Each notebook reflects an evolution in the analysis, from basic techniques to the incorporation of advanced improvements and specific health field knowledge.

Results

  • Comparison of different models and techniques for obesity risk detection.
  • Enhanced prediction accuracy through feature engineering and the incorporation of specific health-related insights.