Este proyecto de Kaggle explora la detección del riesgo de obesidad basándose en varias características. Se utilizan diferentes modelos y técnicas de análisis de datos para mejorar la precisión de las predicciones.
- Obesidad_KM_RF_1: Jupyter Notebook utilizando clustering no supervisado Kmeans y Random Forest.
- Obesidad_KM_FE_RF_2: Jupyter Notebook que incluye Kmeans y Random Forest, con ingeniería de características adicional.
- Obesidad_KM_FE_CB_3: Jupyter Notebook empleando Catboost en lugar de Random Forest, manteniendo las mejoras anteriores.
- Obesidad_KM_FE_CB_VA_4: Jupyter Notebook como el anterior, pero añadiendo nuevas variables aportadas por expertos en salud.
- train.csv: Dataset de entrenamiento utilizado en los análisis.
Cada notebook refleja una evolución en el análisis, desde técnicas básicas hasta la incorporación de mejoras y conocimientos específicos del campo de la salud.
- Comparación de diferentes modelos y técnicas para la detección del riesgo de obesidad.
- Mejora en la precisión de las predicciones a través de la ingeniería de características y el aporte de conocimientos específicos.
This Kaggle project delves into obesity risk detection based on various features. Different data analysis models and techniques are used to enhance the accuracy of predictions.
- Obesity_KM_RF_1: Jupyter Notebook using unsupervised Kmeans clustering and Random Forest.
- Obesidad_KM_FE_RF_2: Jupyter Notebook including Kmeans and Random Forest, with additional feature engineering.
- Obesity_KM_FE_CB_3: Jupyter Notebook using Catboost instead of Random Forest, maintaining previous improvements.
- Obesity_KM_FE_CB_VA_4: Jupyter Notebook similar to the previous, but adding new variables contributed by health experts.
- train.csv: Training dataset used in the analyses.
Each notebook reflects an evolution in the analysis, from basic techniques to the incorporation of advanced improvements and specific health field knowledge.
- Comparison of different models and techniques for obesity risk detection.
- Enhanced prediction accuracy through feature engineering and the incorporation of specific health-related insights.