Saltar al contenido

M13- Búsqueda de Insights Para el Diagnóstico y Entendimiento del Rendimiento Académico

Tutora: Luz Pizarro
mluzpizarro@gmail.comluz.pizarro@mercadolibre.com

Descripción

El proyecto se trata del análisis de un dataset de rendimiento académico de estudiantes de nivel secundario de Argentina donde debe determinarse si existe relación entre diferentes features y el rendimiento obtenido por los estudiantes.
El proyecto se trata de identificar diferentes grupos o segmentaciones que puedan servir para entender mejor la heterogeneidad y el rendimiento académico lo que puede ser muy útil a la hora de diseñar planes dirigidos al sector.
Los datos son obtenidos de la evaluación Nacional Aprender 2019 del Ministerio de Educación de la Nación https://www.argentina.gob.ar/educacion/aprender2019. Corresponden a datos censales del rendimiento académico en lengua y matemática y 263 variables sobre las características de los estudiantes que pueden verse en este link: https://docs.google.com/spreadsheets/d/17v1-uvhWROuVgOVde0YV1ilGDyfuChC0/edit?usp=sharing&ouid=115073782459854273185&rtpof=true&sd=true.

Este tema es interesante porque...

Lo interesante es que los datos son reales y la posibilidad de encontrar patrones que expliquen resultados puede ser una guía para acciones o búsqueda de soluciones que incentiven el mejor rendimiento y la mejora de la calidad educativa o bien para efectuar un diagnóstico. Es clave detectar oportunidades de mejora en el rendimiento académico de los estudiantes de secundario ya que esto podría ser un condicionante sobre el futuro de las personas para la continuidad de los estudios o bien para mejoras en la calificación de las personas en el mercado laboral.
La posibilidad de utilizar técnicas de ciencia de datos en este tipo de análisis es muy interesante ya que tradicionalmente este tipo de problemas se ha resuelto con técnicas más tradicionales sobre las cuales también podríamos indagar.

Trataremos de responder algunas de las siguientes preguntas

– ¿Cómo fue el rendimiento académico de los alumnos de secundario del año 2019? ¿Hubo gran dispersión de datos? ¿Hubo grandes diferencias de resultados separando por grupos de acuerdo a diferentes características?
– ¿Cuáles son las principales variables o características de los alumnos que más influyeron en el rendimiento académico?
– ¿Existen grupos segmentados con determinadas características en torno a rendimiento y features que sirvan para predecir los resultados?

Datos

Si querés inspeccionar el conjunto de datos, lo encontrarás en: https://www.argentina.gob.ar/educacion/aprender2019.

Repo de la mentoria: https://github.com/mluzpizarro/Diplodatos2022.

Hitos de la Mentoría

Entrega 20/05 – Práctico de análisis y visualización, que consistirá en análisis visual de la estructura de los datos, por ejemplo entender participaciones de cada tipo de estudiantes en el total y como se distribuyen los rendimientos académicos, entre otras cosas.
Entrega 17/06 – Práctico de análisis exploratorio y curación de datos, que consistirá en evaluar la coherencia de los datos, los tipos de datos para cada columna, armar los dataframes juntando las diferentes tablas en una sola para el posterior tratamiento de los datos.
Entrega 24/06 – Video de presentación intermedia del proyecto y dataset.
Entrega 29/07 – Práctico aprendizaje supervisado, que consistirá en utilizar diferentes modelos de aprendizaje supervisado para segmentar los datos y compararlos mediante la elección de alguna métrica para evaluar el más conveniente sin descuidar en ningún momento la interpretación de los resultados.
Entrega 26/08 – Práctico aprendizaje no supervisado, que consistirá en utilizar modelos de aprendizaje no supervisado para segmentar los datos y comparar con lo encontrado en el práctico anterior.
Entrega 23/09 – Video de presentación final de mentoría.
Jornadas 11/11 y 12/11 – Presentación de mentorías.

Integrantes del grupo 1
Leandro Argüello - Alejandro Garay
Alfonsina Szpeiner.