Saltar al contenido

M16- Análisis Inteligente de Jugadores de Reconocido Juego Electrónico

Tutor: Matías Nicolás Sosa
mnsosa@mi.unc.edu.ar

Descripción

Objetivo principal: este proyecto busca encontrar las relaciones entre las características socioeconómicas y el rendimiento de los jugadores/as de un famoso juego electrónico. Se puede referir al dataset como “UBA IALAB Gaming”. Dicho dataset fue otorgado por el Laboratorio de Innovación e Inteligencia Artificial de la Universidad de Buenos Aires.
Es de interés estudiar el comportamiento del jugador/a teniendo en cuenta sus dimensiones socioeconómicas, demográficas, etarias y de rendimiento competitivo.
Los datos son obtenidos de un juego Play 2 Earn, que involucra monedas virtuales las cuales son el objetivo del juego. Se quiere ver qué factores influyen en los resultados. El dataset cuenta con 4.404.492 ejemplos y 8 atributos.

Este tema es interesante porque...

Puede contribuir a las empresas que generan negocios a partir de este juego, como también a los jugadores que participan para tener mayores recompensas mediante el análisis de las tendencias que se puedan encontrar. Puede servir como estrategia de marketing. Es interesante también porque son datos crudos, reales.
Para los estudiantes de la diplomatura, este dataset es grande, con un problema sencillo de entender, y contiene errores comunes que se pueden encontrar en la práctica con facilidad.

Trataremos de responder algunas de las siguientes preguntas

– ¿Hay una correlación entre la edad y la cantidad de copas?
– ¿Qué tanto influye la cantidad de tiempo que juega un mismo id con la cantidad de copas ganadas?
– Que estudie o no, ¿influye en la cantidad de tiempo que juega? ¿Y la edad?
– ¿Se puede decir que hay factores que influyen en el rendimiento del jugador?
– ¿Influye el género?
– ¿Qué género le dedica más tiempo al juego?
– ¿Influye el país de procedencia respecto al tiempo de juego y las copas ganadas?
– ¿Cuál es el perfil de jugador que más tiempo pasa jugando?
– ¿Existe una incidencia respecto de si el jugador es de la capital de un país o del interior?

Datos

El dataset a trabajar es el siguiente: https://drive.google.com/file/d/14jAHU8n9BTvMI63cxOAgUv9uaGMyMxWH/view.
El mismo cuenta con más de 4 millones de muestras y 8 atributos, los cuales son: id, datetime, has_studies, gender, country, state, age, cups.
En algunos de estos atributos hay errores, los cuales deben ser curados para un correcto análisis. Ejemplo: en el atributo country aparecen “argentina” y “Argentina”, o también “Venezuela” y “de venezuela”, lo cual se interpretaría como dos países distintos, y esto debe ser corregido.
El atributo id hace referencia a un jugador específico. Éste está repetido dentro del dataset varias veces, porque se relaciona con el datetime, el cual toma datos cada cierta cantidad de tiempo y toma un registro de los jugadores activos en ese instante.
Por ejemplo, el jugador con el id: 2fca346db656187102ce806ac732e06a62df0dbb2829e511a770556d398e1a6e aparece 15746 veces, que son las veces que estuvo presente cuando se tomó registro de los jugadores activos.

Hitos de la Mentoría

Entrega 20/05 – Práctico de análisis y visualización, que consistirá en un análisis estadístico descriptivo de los distintos atributos de la dataset sin olvidar examinar e interpretar los valores atípicos que se le puedan presentar. Indagar y desglosar variables que considere el alumno que pueden descubrir conocimiento relevante.
Entrega 17/06 – Práctico de análisis exploratorio y curación de datos, que consistirá en la realización de una fusión de conjuntos y/o registros de datos, selección de una muestra de un subconjunto de datos, agregación de registros, derivación de nuevos atributos, clasificación de los datos para el modelado, eliminación o sustitución de valores en blanco o ausente, división en conjuntos de datos de prueba y entrenamiento. Lo anterior teniendo en cuenta el dominio del problema y siempre pudiendo justificar las acciones tomadas.
Entrega 24/06 – Video de presentación intermedia del proyecto y dataset.
Entrega 29/07 – Práctico aprendizaje supervisado, que consistirá en caracterizar el perfil de los jugadores en relación a los demás atributos. Además, detectar patrones de comportamiento de los jugadores. Identificar las variables que más influyen (condicionan) el mejor rendimiento del jugador. Se requerirá además el diseño del modelo, los procesos, las métricas y la evaluación de su perfomance. Diferentes ensayos darán lugar a los procesos de entrenamiento y validación para generalizar, adecuando hiper parámetros de los modelos para optimizar su performance. Se aplicarán técnicas de regularización para disminuir la complejidad de los modelos y contribuir a una mejor interpretabilidad, descubrir atributos más significativos y atenuar la influencia de los menos relevantes.
Entrega 26/08 – Práctico aprendizaje no supervisado, que consistirá en determinar e identificar si es posible enfrentar problemas de auto asociación o de reconocimiento, identificar y resolver, si es posible, problemas relacionados al descubrimiento en función de las similitudes detectadas. Identificar otro tipo de problemas relacionados al dominio. Además, también se profundizará en el diseño del modelo que se aplique, los procesos, las métricas y la evaluación de su performance. Esencialmente, modelos de clustering, usando métricas para optimizar los resultados.
Entrega 23/09 – Video de presentación final de mentoría.
Jornadas 11/11 y 12/11 – Presentación de mentorías.

Integrantes del grupo 1
Juan Cruz Bordon - Nicolás Ambrosis
Laura A. Feü.
Integrantes del grupo 2
Rocío Martínez - Nicolas Nazareno Rosales
Luis Federico Yurovich.