-
Notifications
You must be signed in to change notification settings - Fork 1
4 La Estructura
chekos edited this page May 8, 2019
·
1 revision
Este tutorial te guiará en el processo de un proyecto de análisis de datos típico utilizando datos del Censo de Estados Unidos que adquirimos de IPUMS. Está dividido en 2 notebooks:
0 Preparación de Datos
1 Análisis de Datos
En el primer notebook vas a:
- Trabajar con archivos de datos de comprimidos.
- Adquirir estadísticas descriptivas de alto nivel de sus datos.
- Eliminar columnas.
- Eliminar filas (indexación booleana).
- Trabajar con datos categóricos.
- Trabajar con datos ponderados.
- Usar la biblioteca pathlib de python, para que tu código sea más reproducible en todas las plataformas.
- Desarrollar un flujo de trabajo de preparación de datos reproducible para proyectos futuros.
Además de eso, en el segundo notebook vas a:
- Juntar datos.
- Aprender sobre
.groupby()
- Aprender sobre las secciones transversales
.xs()
- Aprender sobre tablas pivote/dinámicas (
pivot_table
) y tablas cruzadas (crosstabs
) - Desarrollar un flujo de trabajo de análisis de datos reproducible para proyectos futuros.