11 abril, 2018

Análisis y Visualización de Datos

Materiales

Pueden encontrar las notebooks para trabajar en nuestro repositorio de github. Les recomendamos seguir las instrucciones en el README.md antes de la primera clase, para poder tener el entorno configurado y listo para trabajar.

Además, en el flamante canal oficial de la diplomatura en YouTube, tenemos una lista de reproducción dedicada a la materia.

Programa

Clase 1

Comenzamos esta primera clase hablando de lo que significa la Ciencia de Datos y cómo se relaciona con otros conceptos. Seguimos con una introducción a la probabilidad, las variables aleatorias, y las herramientas que nos brinda la estadística descriptiva. Vamos a ser cuidadosos a la hora de entenderlos, y sentar estos conceptos como bases fuertes sobre los que apoyar el resto del aprendizaje de esta diplomatura.

Como preparación, les dejamos estos videos para ver antes de la clase:

El conjunto de datos que utilizaremos son las respuestas a la Escuesta Sysarmy de salarios de programadores.  A lo largo de la clase, intercalaremos ejercicios y notebooks entre los otros contenidos, para interiorizar cómo se relaciona la teoría con los problemas que nos encontraremos como científicos de datos. Los materiales necesarios serán:

Clase 2

Clase 3

Clase 4

Videos opcionales

Criterios de evaluación

Link al Trabajo práctico entregable parte 1 y parte 2. Tiene dos partes. La primera puedan completarla después de las primeras dos clases.

Se trabajarán en grupos de 4 a 5 personas (obligatoriamente). Les comunicaremos las instrucciones para anotarse por slack.

Los trabajos deben ser entregados en notebooks a través de un repositorio (github o bitbucket), que puede ser público o privado. Se recomienda que dividan el código en distintas notebooks si es muy extenso. La notebook debe ser legible, y tener las respuestas en lenguaje natural. No es suficiente con calcular los valores y dejarlos por ahí. Las interpretaciones de los resultados son lo más importante.

Deben copiar el link y ponerlo en una planilla a definir una vez que los grupos estén conformados, para que podamos corregirlos.

El repositorio debe ser autocontenido, con indicaciones de librerías a instalar y links para descargar los datos utilizados.


Docentes

  • Valeria Rulloni (vrulloni arroba unc.edu.ar)
  • Milagro Teruel (mteruel arroba unc.edu.ar)
  • Aldana González Montoro
  • Georgina Flesia
  • Juan Nehuen González Montoro
  • Mario Agustín Sgró

Bibliografía complementaria

Devore J. 2008. Probabilidad y Estadística para ingeniería y ciencias (7ma Edición) Cengage Learning.

Bonamente M. 2017 Statistics and Analysis of Scientific Data. 2nd Edition Springer

Alberto Cairo. 2016. The Truthful Art: Data, Charts, and Maps for Communication (1st ed.). New Riders Publishing, Thousand Oaks, CA, USA.

Cole Nussbaumer Knaflic. 2015. Storytelling with Data_ A Data Visualization Guide for Business Professionals, Wiley . Capítulos 2, 3 y 6.


Otros recursos

Les dejamos un par de links de material adicional que profundizan muchos de los temas vistos, y les ofrecen otras opiniones. (Sirven para esos momentos en los que la cabeza no les funciona más pero todavía quieren sentirse realizados estudiando para la diplomatura)

    • Bienvenidos al mundo de la estadística: charla TedEx Río de la Plata. Introducción al uso de la estadística en todos los ámbitos: desde la vida cotidiana hasta la toma de decisiones a nivel país.
    • Crash course statistics: este es un curso abierto bastante completo, con videos cortos y bastante entretenido de ver (y con producción profesional). Es complementario del contenido de la materia, por si necesitan reforzar conceptos.
    • The best stats you’ve ever seenTedEd video de Hans Rosling. Presenta y analiza los datos de desarrollo mundial de Gap Minder (de una forma mucho más entretenida de lo que uno esperaría). En general todos los videos de Hans Rosling son entretenidos de ver.
    • Suéltame pasado — cuando la historia explica la estadística: charla TedEx Montevideo de Andrés Peri. Análisis del sistema educativo Uruguayo, comenzando por estadísticas descriptivas, siguiendo por análisis de posibles factores y finalizando en propuestas de acción.