Skip to content

4 La Estructura

chekos edited this page May 8, 2019 · 1 revision

Este tutorial te guiará en el processo de un proyecto de análisis de datos típico utilizando datos del Censo de Estados Unidos que adquirimos de IPUMS. Está dividido en 2 notebooks:

0 Preparación de Datos
1 Análisis de Datos

En el primer notebook vas a:

  • Trabajar con archivos de datos de comprimidos.
  • Adquirir estadísticas descriptivas de alto nivel de sus datos.
  • Eliminar columnas.
  • Eliminar filas (indexación booleana).
  • Trabajar con datos categóricos.
  • Trabajar con datos ponderados.
  • Usar la biblioteca pathlib de python, para que tu código sea más reproducible en todas las plataformas.
  • Desarrollar un flujo de trabajo de preparación de datos reproducible para proyectos futuros.

Además de eso, en el segundo notebook vas a:

  • Juntar datos.
  • Aprender sobre .groupby()
  • Aprender sobre las secciones transversales .xs()
  • Aprender sobre tablas pivote/dinámicas (pivot_table) y tablas cruzadas (crosstabs)
  • Desarrollar un flujo de trabajo de análisis de datos reproducible para proyectos futuros.

analizando datos censales con pandas

Clone this wiki locally