Tutorial introductorio a Pandas.
Este tutorial está basado en los tutoriales de Brandon Rhodes y Joris Van den Bossche, la estructura y el contenido del mismo es una mezcla de ambos. La mayor diferencia son los conjuntos de datos a utilizarce y que este tutorial está en castellano.
Para que ya tengan su ambiente de trabajo preparado, dejo aquí los requerimientos mínimos.
El requerimiento para realizar este taller es tener un ambiente con python3 y las siguientes librerías:
- JupyterLab o Jupyter Notebook
- pandas
- matplotlib
Primero antes que nada, cloná este repositorio. Lo podés hacer descargando el zip o si tenés instalado git ejecutar en la consola:
git clone https://github.com/akielbowicz/pynorte-tutorial-pandas.git
cd pynorte-tutorial-pandas
Si no tenés python instalado, te recomiendo bajarte miniconda
Una vez instalada:
Si estás en Windows, abrí la consola de miniconda desde la barra de inicio.
Si estás en un ambiente Unix, abrí la una consola de tu preferencia.
En esa consola cambiá de directorio a donde clonaste el repositorio y ejecutá
conda env create --name pynorte-tutorial-pandas --file environment.yml
Una vez que termine de instalar todo, tenés que activar el ambiente de conda ejecutando:
Alguno de estos comandos ( depende del ambiente y la consola ):
conda activate pynorte-tutorial-pandas
source activate pynorte-tutorial-pandas
activate pynorte-tutorial-pandas
Una vez activado hay que abrir Jupyter ejecutando:
jupyter lab
Se va a abrir un navegador y ya podemos empezar a probar cosas.
Para los usuarios de Windows seguramente hay una forma un poco más sencilla ejecutar JupyterLab instalando la versión completa de Anaconda.
Los datos a utilizarce en el taller fueron descargados del Portal de Información de Ciencia y Tecnología Argentino en la fecha de 23/04/2019.
Los tres conjuntos de datos son:
Producciones Científico Tecnológicas