Saltar al contenido

Análisis de series temporales

facilita: Ezequiel Medina

Motivación

Se propone una problemática interesante que utiliza datos reales de agencias de correos, y presenta una serie de desafíos frecuentes con las que se topa un data scientist a menudo. En este problema es crucial el uso de la estadística descriptiva y de clasificadores multiclase.

Descripción del problema o dataset

En este problema se trabajará sobre series temporales, con el objetivo principal de predecir el comportamiento de ciertas agencias de correo. El dataset es una muestra que representa un mes de datos de varios correos de Brasil. El dataset contiene aproximadamente 1 millón de envíos con 8 características principales.

Práctico de Análisis y Visualización

Objetivo y alcance:El objetivo principal de este práctico es aprender a extraer información útil de los datos, encontrar relaciones entre los features, y particularidades en ciertos períodos de tiempo. También se pretende aprender a hacer gráficos que faciliten la comprensión de características de interés, y también que faciliten las comparaciones entre distribuciones.Es importante para cumplir con los objetivos de este práctico aprender a hacer buenas particiones de datos y utilizar información externa para apoyarse en el análisis de este dataset.

Método:Realizar un reporte en formato de jupyter notebook en el cual se presente toda la información interesante del dataset, de forma clara y con gráficos apropiados. También se evaluará que se responda correctamente una serie de preguntas claves que se van a formular.Es importante que el informe sea detallado y bien explicado, para que cualquier persona pueda comprenderlo.