Se provee de un dataset que contiene la base de datos geográfica del año 2018. El dataset contiene datos geográficos de los consumidores y de todos los activos de la distribuidora. Uno de los mayores desafíos de esta industria es conocer los impulsores de la Calidad de Servicio que permitan la toma de dicisiones eficientes sobre los costos operativos e inversiones. El objetivo de este proyecto es que el estudiante a lo largo de las materias de la diplomatura identifique y aplique diferentes técnicas de análisis/procesamiento de los datos que generen información relevantes para la toma de decisiones.
Visualizacion de funciones de densidad de probabilidad de diferentes variables.
Matrices de correlacion.
Diagramas de caja para deteccion de Outliers.
Introduccion a la visualizacion en mapas.
Visualizacion basica de realciones y grafos.
El formato del dataset nos permite aplicar los siguientes conceptos:
Carga de datos: Codificaciones, Caracteres Especiales, formatos.
Clasificacion de tipos de variables en continuas, ordinales y categoricas.
Metodos de normalizacion de variables continuas.
Codificacion de variables ordinales y categoricas.
Imputacion de valores invalidos y outliers.
Adicionamiento de datos externos.
Agregacion de datos.
Interpretacion y analisis conceptual del dataset.
Métodos básicos de codificación de relaciones espaciales
Métodos de selección de variables univariados, multivariados e intrínsecos a un modelo.
Partición de datos para Training, Test y Validation. Cross Validation.
Evaluación de modelos: Baselines, tipos de error.
Consolidación de un dataset consumible para los modelos.
Aplicación de diversas técnicas de ML sobre el dataset generado.
Métodos de selección de variables y reducción de dimensionalidad.
Definicion, interpretación y ajuste de hiperparametros.
Metodos de ajuste de hyperparameters GridSearch, Random, Bayesiana
Interpretabilidad de los modelos.
Métodos de clusterización de datos para reduccion de variables.
Implementacion de regresor basado en KNN
Codificacion de variable de salida en categorias.