M13- ¿Alguien para hablar? Procesamiento de Lenguaje Natural en foros sobre ansiedad y depresión.
Tutor: Patricio Ferreira
La ansiedad y la depresión son trastornos de salud mental que afectan a millones de personas en todo el mundo. Según la Organización Mundial de la Salud, se estima que el 5% de los adultos del mundo sufren de depresión y un porcentaje similar vive con trastornos de ansiedad.
En este proyecto de mentoría, nos centraremos en analizar conversaciones en foros de depresión y ansiedad de Reddit para comprender mejor cómo las personas se expresan sobre estas condiciones. Utilizaremos técnicas de Procesamiento de Lenguaje Natural y aprendizaje automático para analizar el contenido de posteos y comentarios, y construir modelos de clasificación de texto.
Trabajaremos con una base de datos construida para esta mentoría que contiene posteos y comentarios realizados en los foros (subreddit) de ansiedad y depresión en español. El dataset cuenta con 3029 entradas dónde puede encontrarse el contenido de las mismas, la fecha en que se produjeron, el usuario que las realizó y el foro específico en que fue realizada (depresión/ansiedad).
Este proyecto permitirá un primer acercamiento a una serie de innovaciones que comienzan a surgir a partir del entrecruzamiento de sistemas de Machine Learning y problemáticas vinculadas a la salud mental. Ejemplos de estas iniciativas son trabajos vinculados al diagnóstico automatizado de enfermedades a través de producciones textuales o el entrenamiento de chatbots terapéuticos.
– ¿Qué están buscando las personas que interactúan entre sí en foros de ansiedad y depresión?
– ¿Cómo nombran y describen sus padecimientos?
– ¿Qué temas son comunes a las publicaciones de ambos foros? ¿Qué temas las distinguen?
– ¿Podemos reconocer diferencias entre los posteos y los comentarios?
– ¿Qué técnicas de aprendizaje no supervisado pueden ayudarnos a responder estas preguntas?
– ¿Tenemos datos suficientes como para construir un modelo de clasificación que nos permita distinguir las entradas de cada foro?