Saltar al contenido

M08- Big Data Bang: explosionando las rutas aéreas para predecir un caos en alto vuelo..!

Tutor: Noelia Ferrero

Descripción

Objetivo:

Gestión de los recursos Aeroportuarios, analizar y determinar puntos críticos de saturación en el Aeroparque Jorge Newbery.

 

Descripción:

De la misma manera que el Big Bang (o Gran Explosión en español), intenta interpretar el punto inicial en el que se formó la materia, el espacio y el tiempo, trabajaremos en las distintas etapas en el ciclo de vida del desarrollo de un proyecto de Ciencia de Datos, para generar valor en función de nuestros datos cualitativos (materia y espacio), vs. nuestros datos cuantitativos (tiempo). Aunque estos términos suenen similares, la investigación de datos, cualitativa y la cuantitativa son dos métodos significativamente diferentes. Entender esa diferencia puede tener un gran impacto a la hora de analizar el éxito de una solución/producto basado en datos.

Dada la excelente ubicación geográfica, el Aeropuerto Jorge Newbery es estratégico para la explotación de empresas aéreas tanto nacionales, como internacionales. Luego de la pandemia del Covid 2020 se decretó que el mismo volvería a ser un aeropuerto internacional (destinos del Mercosur y países de Sudamérica). Es por esto, que se han incrementado exponencialmente sus operaciones, pero su infraestructura para soportar este incremento no ha acompañado. Luego de la época de confinamiento, se reconstruyó la única pista que este aeródromo posee, pero esa obra no es suficiente, ya que la terminal de pasajeros ha permanecido prácticamente sin grandes incrementos de su capacidad.

Este tema es interesante porque...

Se realizará el estudio de los datos provistos por el explotador aéreo existente a fin de prever los picos de capacidad de todos los subsistemas que integran al aeropuerto en sí y así evitar saturaciones de los mismos, permitiendo una gestión soportada en datos.

El desarrollo de este proyecto, se abordará con un enfoque de triple impacto, el cual nos ayudará a:

– Lograr una visión 360° del modelo del negocio, interpretando minuciosamente las relaciones existentes entre las observaciones bajo análisis, las cuales, serán nuestro “timón” de dirección y profundidad, a la hora de estudiar los distintos recursos aeroportuarios.

– Evaluar los momentos clave y sus métricas. Conocidos los momentos en que los vuelos tienden a sufrir retrasos, se podrá analizar si hay alguna casuística que los origine, para informar “puntos de dolor” asociados a los motivos más negativos, como así también, posibles amenazas y debilidades. Además, en la medida que vallan surgiendo nuevas lecturas en los datos, se podrá innovar analizando y descubriendo las necesidades no cubiertas.

– Identificar posibles puntos de encuentro (meeting points) entre las distintas compañías aéreas, que permitan romper barreras en el diagramado de las rutas y trabajar con un enfoque transversal. Dicho enfoque, será clave, para comprender el orden de importancia en las variables que serán protagonistas a la hora de aplicar Ciencia de Datos en la predicción de un “valor-tiempo”.

Trataremos de responder algunas de las siguientes preguntas

Se procederá a formatear los datos existentes y proporcionar visualizaciones que respondan a las siguientes preguntas disparadoras:

 

1- Entendiendo el Customer Journey Map

– ¿Cómo varía el volumen total de arribos según el mes? ¿y por día de la semana?
– ¿Cómo varía el volumen de pasajeros por mes?
– ¿Existe alguna tendencia ó fluctuación cíclica en función de la estacionalidad? ¿Hay días especiales en el año?
– ¿Cual es la distribución de vuelos provenientes de los distintos orígenes?
– Durante un año, que cabecera es la que más se utilizó? ¿y que posición?

 

2- Traduciendo los retrasos

– ¿Qué porcentaje de vuelos experimentan un retraso de salida? Entre esos vuelos, ¿cuál fue el tiempo promedio de retraso (en minutos)?
– ¿Cómo varía el % de vuelos retrasados a lo largo del año?
– ¿Hay zonas geográficas que tienden a presentar más demoras que otras? ¿Se pueden predecir demoras por ruta? (retrasos por lugar de origen)
– ¿Se puede identificar algún patrón relevante que origine demoras?
– ¿Qué aerolíneas parecen ser más y menos confiables, en términos de salidas a tiempo?
– ¿Los datos más correlacionados con los retrasos, tienen a comportarse según su propia naturaleza? ¿y si sumamos un dataset con información asociada al pronóstico (viento y precipitación) para obtener la imagen completa?

 

3- Pensando futuras líneas de acción para trabajar la complejidad de las operaciones congestionadas

– ¿Se pueden mejorar las operaciones diarias del aeropuerto, en beneficio tanto de los pasajeros como del personal del aeropuerto?
– ¿Qué accionables de cara al futuro podemos pensar para trabajar con un inventario (stock) de recursos correlacionados?
– ¿Cuales son los data-driven insights más relevantes a la hora de aportar valor al negocio?

Integrantes del grupo 1
Sebastian Coca - Sabrina Gonzalez -
Joaquin Barrionuevo.
Integrantes del grupo 2
Francisco Brogiolo - Francisco Martín -
Miguel Cittadini - Marcelo Bianchi.