Skip to content

EglimarRamirez/Analisis-de-trafico-aereo-dashboard-con-powerbi-Series-de-tiempo-y-LSTM

 
 

Repository files navigation

S14-27-N-Data-Bi

ANÁLISIS DE TRÁFICO AÉREO 📊

Brindar información útil para optimizar rutas, Visualizar tráfico frecuente, horarios pico y destinos mas buscados.

ACTIVIDADES:

  • Ingeniería de datos:

Etapa donde se desarrolla la extraccion, tranformacion y disponibilizacion de los datos

Los conjuntos de datos considerados para el presente caso de estudio se obtienen de la pagina oficial del departamento de transporte de Estados Unidos: https://www.transportation.gov/policy/aviation-policy/us-international-air-passenger-and-freight-statistics-report. En total 7 dataset's que corresponden a informacion concerniente a vuelos de pasajeros, vuelos de carga, asientos por vuelo, pasajeros por vuelo, aeropuertos, aerolineas, estados USA. Se realizan las transformaciones necesarias en Python para cada uno de los diferentes conjuntos de datos. Para la creacion del dataWarehouse alojado en BigQuery se comienza con el modelamiento de la base de datos, creando el esquema de cada tabla y carganado a la plataforma cloud la data ya transformada. Finalmente para disponibilizar los datos al equipo se realizan consultas en lenguaje SQL y se comparte tanto un notebook en python como el archivo con las configuraciones de acceso a dichas consultas al conjunto de datos alojado en BigQuery. En el caso del acceso a BigQuery mediante PowerBi se comparten las instrucciones de como realizar la conexion junto con el archivo de las configuraciones de acceso

  • Análisis de datos: El análisis exploratorio y estádistico de datos permite identificación e interpretación de conclusiones generales del conjunto de datos, como:
    ¿Qué muestra el análisis de TA durante el año de la pandemia?
    ¿Cuál es el aeropuerto con más salidas?
    ¿Cuál es el destino más frecuentado?
    ¿Cuáles son las rutas más frecuentadas por vuelos de carga comercial?
    ¿Cuáles son las rutas con mayor cantidad de vuelos?

  • Ciencia de datos: Generación de un modelo de predicción para el número de pasajeros. aplicando el modelo estadístico SARIMA y LSTM de Machine learning.

  • Visualización de datos: Como resultado del análisis se observa que:
    Durante la pandemia hubo un descenso de vuelos.
    Que en el análisis del año 2023 hay menos vuelos que en 2022, pero puede ser porque falta un trimestre.
    Que las salidas de vuelos de LA son más que en NY pero este último tiene más pasajeros.
    El destino con mayor afluencia de pasajeros es la zona de Europa y Caribe.
    Hay muy pocos vuelos a países de África y China e Indonesia.
    No hay vuelos comerciales de USA a Bolivia ni Venezuela.
    Para la visualización de datos, se utilizó el dataWarehouse alojado en BigQuery para analizar y presentar los datos más relevantes de la base. Esto incluyó la identificación de los aeropuertos de origen y destino, la cantidad de vuelos por aeropuerto de origen y destino, así como la cantidad de pasajeros y los destinos más visitados. La creación del tablero de visualización se llevó a cabo en Looker Studio, mientras que la representación geoespacial de los aeropuertos se realizó en Power BI, Dashboard Power-BI.


TECNOLOGÍAS USADAS


EQUIPO

Nombre Rol GitHub LinkedIn
Harlan Tonguino Data Engineer GitHub LinkedIn
Eglimar Ramirez Machine Learning Developer GitHub LinkedIn
Gabriela Sastre Project Manager/Data & BI Analyst GitHub LinkedIn
Isabel Marquinez Data & BI Analyst GitHub LinkedIn

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Jupyter Notebook 100.0%