Saltar al contenido

M11- Caracterización del Comportamiento de los Pasajeros Regulares en el Sistema de Transporte Urbano de Pasajeros de Córdoba

Tutor: Néstor Grión
ngrion@gmail.com

Descripción

En la ciudad de Córdoba el Sistema Urbano de Pasajeros (STUP) alcanzó un máximo de 185 millones de cortes de boletos en el año 2016. El siguiente gráfico muestra el periodo 2015-2021. Se observa una leve disminución entre 2017 y 2019 y una fuerte caída del 69% en 2020 como consecuencia de la pandemia. Actualmente se encuentra en un periodo de recuperación.

Cantidad de Transacciones en el STUP de la ciudad de Córdoba
En millones

El registro anonimizado de las transacciones que se realiza permiten describir muchos aspectos del comportamiento de los diferentes tipos de usuarios. Por ejemplo, el siguiente gráfico muestra la cantidad de transacciones según el día de la semana.

Cantidad de Transacciones según tipo de usuario y días de viaje
En millones – Año 2019

En donde:

– BEG: Boleto Educativo Gratuito.
– BOS: Boleto Obrero Social
– Adultos Mayores: Boleto Adulto Mayor (BAM) y Tarifa Social Adultos
– Discapacidad: Ordenanza 11.876

Para estimar la demanda y planificar la oferta del transporte público resulta de gran valor disponer de modelos de comportamiento de los pasajeros regulares, definidos como aquellos que superan un umbral de viajes mensuales. El objetivo de este proyecto es realizar una caracterización básica y aplicar algunas técnicas de Aprendizaje Automático para modelizar el comportamiento de los usuarios.

Este tema es interesante porque...

Este proyecto es interesante porque contribuye a comprender y proyectar el comportamiento del usuario regular. Esto es valioso tanto para evaluar esquemas de precios diferenciales como para planificar y adecuar la oferta del sistema.

Trataremos de responder algunas de las siguientes preguntas

– Diferenciar comportamiento según tipo de usuario (Común, BEG, etc.)
– Establecer patrones de viaje de los pasajeros regulares (distribución de horas y días de la semana, líneas y corredores más usados, etc.). Identificar subgrupos según comportamiento.
– Proyectar comportamiento agregado para la próxima semana.

Datos

Si querés inspeccionar una muestra del conjunto de datos, lo encontrarás en https://github.com/ngrion/stup_cba. El dataset cuenta con las siguientes variables:

– Fecha
– Empresa
– Coche
– Tarjeta
– Contrato
– Linea
– Sentido
– Latitud
– Longitud

Cada fila refiere a una transacción (corte de boleto). Relevantes para este proyecto se considera la fecha, la línea y sentido, el tipo de contrato, y un ID anonimizado de la tarjeta.
Los datos son provistos por la Secretaría de Transporte y la Dirección de Datos y Análisis Estadísticos de la Municipalidad de Córdoba.

Hitos de la Mentoría

Entrega 20/05 – Práctico de análisis y visualización, que consistirá en realizar una descripción general de los datos (cortes de boleto por tipo de usuario, líneas, día de la semana y hora, etc.)
Entrega 17/06 – Práctico de análisis exploratorio y curación de datos, que consistirá en: a) simplificar los tipos de usuarios, b) incorporar al dataset variables que clasifiquen el tipo de día (hábil, feriado, paro) y periodos de vacaciones (estudiantes). Y ver impacto en la cantidad de transacciones, c) identificar combinaciones de líneas-sentido con mayor frecuencia, d) identificar viajes combinados con mayor frecuencia (son los viajes consecutivos de una misma tarjeta en el periodo de una hora), e) identificar patrones de correlación temporal (los pasajeros regulares en una semana lo son o no en la siguiente).
Entrega 24/06 – Video de presentación intermedia del proyecto y dataset.
Entrega 29/07 – Práctico aprendizaje supervisado. El objetivo es utilizar una red neuronal para predecir el comportamiento de cada tarjeta regular (usuario común) en base al comportamiento de k semanas previas. Para ello se definirá primero una variable que contabiliza la cantidad de días hábiles por semana en que se utiliza la tarjeta (ajustado por días anormales).
Entrega 26/08 – Práctico aprendizaje no supervisado. El objetivo es aplicar algoritmos de clustering a los usuarios comunes regulares. Como variables se considerarán la cantidad de pasajes y día, tipo de días (hábiles, domingo y feriados) y la hora (hora inicial e intervalo entre primer y último viaje diario)
Entrega 23/09 – Video de presentación final de mentoría.
Jornadas 11/11 y 12/11 – Presentación de mentorías.

Integrantes del grupo 1
Juan A. Fraire - Ignacio Villagra Torcomian
Esteban Kocian.
Integrantes del grupo 2
Mauricio Caggia - Luciano Monforte
Alejandro Pittón.