Saltar al contenido

Materia obligatoria: Aprendizaje No Supervisado

Equipo Docente

– Valeria Rulloni
– Laura Alonso Alemany

Archivos de clases en: https://drive.google.com/drive/folders/1qJ8cYKJz_0-j-f-zvvr9RWFGLRj3H35L

Contenidos

Clustering
Embeddings
– Aprendizaje Semi-Supervisado
– Reglas de Asociación

Práctico entregable

Utilizar la base de jugadores “players_22.csv” disponible en la página de Kaggle https://www.kaggle.com/datasets/stefanoleone992/fifa-22-complete-player-dataset. Considerar que la base 2022 no tiene el mismo formato que la base vista en clase, a los nombres de las variables se les agregó una keyword para identificar a qué tipo de habilidad corresponde.

Con la nueva base, realizar un análisis análogo al que realizamos en el cursado de la materia con los datos FIFA2019. Realice comentarios en cada parte (verbose=True ;))

1- Análisis exploratorio de la base.
2- Evaluación visual e intuitiva de a dos variables numéricas por vez.
3- Uso de dos técnicas de clustering: por ejemplo k-medias, DBSCAN, mezcla de Gaussianas y/o alguna jerárquica. Elección justificada de hiper-parámetros.
4- Evaluación y Análisis de los clusters encontrados.
5- Pregunta: ¿Se realizó alguna normalización o escalado de la base? ¿Por qué ?
6- Uso de alguna transformación (proyección, Embedding) para visualizar los resultados y/o usarla como preprocesado para aplicar alguna técnica de clustering.

Contenido orientativo de las clases que se darán durante 2023​

Ir a las clases en: https://github.com/DiploDatos/AprendizajeNOSupervisado