Saltar al contenido

Materia obligatoria: Análisis y Visualización de Datos

Materiales

Pueden encontrar las notebooks para trabajar en nuestro repositorio de github. Les recomendamos seguir las instrucciones en el README.md antes de la primera clase, para poder tener el entorno configurado y listo para trabajar.

Además, en el canal oficial de la diplomatura en YouTube, encontrarán una lista de reproducción de versiones anteriores dedicada a la materia.

Contenido orientativo de las clases que se darán durante 2023

Clase 1

Comenzamos esta primera clase hablando de lo que significa la Ciencia de Datos y cómo se relaciona con otros conceptos. Seguimos con una introducción a la probabilidad, las variables aleatorias, y las herramientas que nos brinda la estadística descriptiva. Vamos a ser cuidadosos a la hora de entenderlos, y sentar estos conceptos como bases fuertes sobre los que apoyar el resto del aprendizaje de esta diplomatura.

Como preparación, les dejamos estos videos (gentileza de Milagro Teruel) para ver antes de la clase:

01. ¿Qué es la ciencia de datos?
02. Introducción y objetivos de AyVD.
03. Cómo leer el dataset. [Opcional] 

El conjunto de datos que utilizaremos son las respuestas a la Escuesta Sysarmy de salarios de programadores. A lo largo de la clase, intercalaremos ejercicios y notebooks entre los otros contenidos, para interiorizar cómo se relaciona la teoría con los problemas que nos encontraremos como científicos de datos. Los materiales necesarios serán:

Filminas

Clase 1 – Introducción.
Clase 1 – Probabilidad y estadística.

Notebooks para Colab (para poder editarlas tienen que hacer una copia):

00. Inicios en Python.ipynb [Opcional]
01. Probabilidad.ipynb.
02. Datos y Modelos.ipynb.

Notebooks para JupyterLab: las pueden encontrar con nombres equivalentes en el repositorio de GitHub. Recuerden que la única diferencia es la forma de leer el archivo csv con los datos.

Clase 2

Filminas

Clase 2 – Datos y Modelos.

Notebooks para Colab (para poder editarlas tienen que hacer una copia):

02. Datos y Modelos.ipynb

Criterios de evaluación

Link al Trabajo práctico entregable parte 1 y parte 2. Tiene dos partes. La primera puedan completarla después de las primeras dos clases.

Se trabajarán en grupos de 4 a 5 personas (obligatoriamente). Cada grupo estará a cargo de un docente por un docente de práctico. Se mantendrá el grupo y el docente en las 5 materias obligatorias Les comunicaremos los grupos en breve por el slack.

Los trabajos deben ser entregados en notebooks a través de un repositorio (github o bitbucket), que puede ser público o privado. Se recomienda que dividan el código en distintas notebooks si es muy extenso. La notebook debe ser legible, y tener las respuestas en lenguaje natural. No es suficiente con calcular los valores y dejarlos por ahí. Las interpretaciones de los resultados son lo más importante.

Una vez terminado el práctico entregable en el repositorio, deben copiar el link, ponerlo en una planilla y avisar al docente designado para que pueda corregirlo.

El repositorio debe ser autocontenido, con indicaciones de librerías a instalar y links para descargar los datos utilizados.

Equipo docente

Docentes del Teórico

Valeria Rulloni (vrulloni@unc.edu.ar)
Laura Minuet (minuetlaura@gmail.com)

 

Docentes del Práctico

Aldana González Montoro
Facundo Godoy
(Juan) Nehuen González Montoro
Mario Agustín Sgró
(Mario) Alejando García
(Ana) Josefina Meirovich
Rocío Fonseca
Laura Montes

Bibliografía complementaria

Devore J. 2008. Probabilidad y Estadística para ingeniería y ciencias (7ma Edición) Cengage Learning.

Bonamente M. 2017 Statistics and Analysis of Scientific Data. 2nd Edition Springer

Alberto Cairo. 2016. The Truthful Art: Data, Charts, and Maps for Communication (1st ed.). New Riders Publishing, Thousand Oaks, CA, USA.

Cole Nussbaumer Knaflic. 2015. Storytelling with Data_ A Data Visualization Guide for Business Professionals, Wiley . Capítulos 2, 3 y 6.

Otros recursos

Les dejamos un par de links de material adicional que profundizan muchos de los temas vistos, y les ofrecen otras opiniones. (Sirven para esos momentos en los que la cabeza no les funciona más pero todavía quieren sentirse realizados estudiando para la diplomatura).

Bienvenidos al mundo de la estadística: charla TedEx Río de la Plata. Introducción al uso de la estadística en todos los ámbitos: desde la vida cotidiana hasta la toma de decisiones a nivel país.

Crash course statistics: este es un curso abierto bastante completo, con videos cortos y bastante entretenido de ver (y con producción profesional). Es complementario del contenido de la materia, por si necesitan reforzar conceptos.

The best stats you’ve ever seen: TedEd video de Hans Rosling. Presenta y analiza los datos de desarrollo mundial de Gap Minder (de una forma mucho más entretenida de lo que uno esperaría). En general todos los videos de Hans Rosling son entretenidos de ver.

Suéltame pasado — cuando la historia explica la estadística: charla TedEx Montevideo de Andrés Peri. Análisis del sistema educativo Uruguayo, comenzando por estadísticas descriptivas, siguiendo por análisis de posibles factores y finalizando en propuestas de acción.