M15- 2022

M15- Conocimiento Inteligente de las Personas Interesadas en Formarse en IA Aplicada

Tutora: Trinidad Fernández Tucci
trinidad.fernandez.tucci@mi.unc.edu.ar

Descripción

Objetivo principal: Conocimiento inteligente del participante, de sus aspectos demográficos, su perfil y de sus competencias adquiridas en el Programa multidisciplinario de IA aplicada de la UBA-IALAB, para sumar talentos y contribuir a la soberanía tecnológica de América Latina.
El Programa Multidisciplinario de IA aplicado tiene por objetivo contribuir a la formación multidisciplinaria de los actores involucrados en el ecosistema de la IA. La iniciativa ofrece diferentes trayectos de formación basados en el perfil de los estudiantes y sus intereses. Cuenta con una plataforma educativa automatizada y autogestionable. Los interesados en aplicar a las becas que el UBA-IALAB ofrece (CAF-UNESCO) completan un formulario con información de índole socioeconómica y demográfica. La plataforma educativa lleva registros del desempeño de los distintos trayectos disponibles.
El problema consiste en indagar sobre aspectos relativos a los participantes para mejorar su experiencia y las características de los distintos trayectos del programa. Así por ejemplo, interesa conocer su procedencia, sus intereses, su formación previa, su actividad laboral, sus capacidades y otros atributos que hacen al perfil, para alcanzar un mejor impacto del programa.
El data set crudo tiene más de 30 atributos (Profesión, Procedencia, Actividad Laboral, Conocimientos en programación, entre otros) y más de 7000 ejemplos.

Este tema es interesante porque...

El desarrollo de este proyecto puede contribuir a mejorar las experiencias de los participantes del programa (único en su género hispano hablante) en base a las respuestas o soluciones que se obtengan tanto de un trabajo preliminar de la visualización como de la implementación de modelos inteligentes que se podrán aplicar en el contexto de esta Diplomatura.

Trataremos de responder algunas de las siguientes preguntas

El Programa de Formación Multidisciplinario de Inteligencia Artificial, ofrece una la lógica de cursado y formación que se materializa básicamente en tres diferentes trayectos, según los conocimientos, experiencias e intereses de los participantes, a saber:

– Saben programar y quieren seguir perfeccionándose: Gobernanza de datos, gobernanza de IA, diseño y despliegue.
– No saben programar pero quieren aprender: start coding, gobernanza de datos, gobernanza de IA, diseño y despliegue.
– Quieren aprender de manera conceptual pero no les interesa programar: gobernanza de datos y gobernanza de IA.

En base a las respuestas de estos interrogantes y al perfil del participante, se pretende responder a algunas de las siguientes preguntas:

– ¿Qué relaciones se visualizan entre el perfil del estudiante o su desempeño laboral y el rendimiento en el programa ?
– ¿Qué asociaciones se pueden descubrir entre las características de los participantes que resulten de interés para mejorar su experiencia en el programa y predecir su comportamiento?
– ¿Cómo se puede caracterizar a los participantes, indagando similitudes de sus perfiles que emergen de los datos y que de otra manera no serían accesibles?
– ¿Cuáles son las características que impactan más significativamente en la continuidad y el sostenimiento del programa de formación?
– ¿Existen características que definen grupos de interesados por cursar el programa?
– ¿Es posible describir patrones de comportamiento de los participantes del programa basados en sus características?

Datos

Si querés inspeccionar el conjunto de datos, lo encontrarás en: Responses_DataSet_Diplo
El data set contiene información demográfica de los participantes como así también de su rendimiento en el programa y el perfil de cada persona (por ejemplo, campo laboral en el que se desempeña, estudios realizados, hobbies, conocimientos informáticos, entre otros atributos).
Respecto al rendimiento de cada participante, el data set detalla aquellas personas que cumplen con dos etiquetas principales: terminado o cursando. Esto quiere decir que, estas personas han terminado o se encuentran cursando determinado módulo especificado en el data set.

Hitos de la Mentoría

Entrega 20/05 – Práctico de análisis y visualización, que consistirá en un análisis estadístico descriptivo de los distintos atributos de la dataset sin olvidar examinar e interpretar los valores atípicos que se le puedan presentar. Indagar y desglosar variables que considere el alumno que pueden descubrir conocimiento relevante.
Entrega 17/06 – Práctico de análisis exploratorio y curación de datos, que consistirá en la realización de una fusión de conjuntos y/o registros de datos, selección de una muestra de un subconjunto de datos, agregación de registros, derivación de nuevos atributos, clasificación de los datos para el modelado, eliminación o sustitución de valores en blanco o ausente, división en conjuntos de datos de prueba y entrenamiento. Lo anterior teniendo en cuenta el dominio del problema y siempre pudiendo justificar las acciones tomadas.
Entrega 24/06 – Video de presentación intermedia del proyecto y dataset.
Entrega 29/07 – Práctico aprendizaje supervisado, que consistirá en caracterizar el perfil de los participantes del programa que tienen más módulos terminados en relación a los demás atributos que confirman el data set. Además, detectar patrones de comportamiento de los participantes que se encuentran cursando los módulos del programa. Identificar las variables que más influyen (condicionan) el mejor rendimiento del participante. Se requerirá además el diseño del modelo, los procesos, las métricas y la evaluación de su performance. Diferentes ensayos darán lugar a los procesos de entrenamiento y validación para generalizar, adecuando hiper parámetros de los modelos para optimizar su performance. Se aplicarán técnicas de regularización para disminuir la complejidad de los modelos y contribuir a una mejor interpretabilidad, descubrir atributos más significativos y atenuar la influencia de los menos relevantes.
Entrega 26/08 – Práctico aprendizaje supervisado, que consistirá en caracterizar el perfil de los participantes del programa que tienen más módulos terminados en relación a los demás atributos que confirman el data set. Además, detectar patrones de comportamiento de los participantes que se encuentran cursando los módulos del programa. Identificar las variables que más influyen (condicionan) el mejor rendimiento del participante. Se requerirá además el diseño del modelo, los procesos, las métricas y la evaluación de su performance. Diferentes ensayos darán lugar a los procesos de entrenamiento y validación para generalizar, adecuando hiper parámetros de los modelos para optimizar su performance. Se aplicarán técnicas de regularización para disminuir la complejidad de los modelos y contribuir a una mejor interpretabilidad, descubrir atributos más significativos y atenuar la influencia de los menos relevantes.
Entrega 23/09 – Video de presentación final de mentoría.
Jornadas 11/11 y 12/11 – Presentación de mentorías.

M15- Conocimiento Inteligente de las Personas Interesadas en Formarse en IA Aplicada

Integrantes del grupo 1Mariana Pereyra - Florencia Racciatti.

Integrantes del grupo 1
Mariana Pereyra - Florencia Racciatti.