17 marzo, 2021

Nivelación

En esta página podés encontrar un resumen con los temas que se espera que los estudiantes conozcan antes de comenzar a cursar esta Diplomatura. Para cada uno de ellos, agregamos links a recursos externos de cursos y ejercicios para repasarlos, y un cuestionario para evaluar tus conocimientos.

¿Qué nivel es necesario para cada uno de los temas?

Para maximizar el aprendizaje durante la Diplomatura, es recomendable estar familiarizado con cada una de las áreas listadas, aunque no es necesario un nivel experto de experiencia. Por ejemplo, un curso de estadística de nivel terciario es suficiente para el área de Estadística y Probabilidad. Tené en cuenta que, si bien se comienza cada materia con un repaso, no se dedica el tiempo suficiente para adquirir las habilidades desde un nivel inicial. Aprender a programar al mismo tiempo que los contenidos nuevos puede resultar difícil e incluso frustante, y consumir un tiempo considerable.

¿Qué puedo hacer si no estoy familiarizado con alguna de las áreas?

Te recomendamos que estudies los contenidos con algún curso o recurso externo previamente; de preferencia antes de comenzar a cursar. En caso de no ser posible, planificá dedicar el tiempo necesario durante el cursado.


Matemática

Vamos a repasar conceptos de álgebra y análisis matemático que nos van a servir como base de Análisis y Apredizaje Automático en la Diplomatura.

Temas:

  • Matrices
  • Derivadas
  • Integrales
  • Limites
  • Optimización
  • Sistema binario

Te compartimos un link para que accedas a información sobre matrices y las operaciones que se pueden realizar con ellas:

Aquí encontrarás una explicación de producto punto y vectores muy útil para que repases esos conceptos:

Si no te acordás de estos conceptos, te traemos dos videos explicativos de derivadas e integrales, para que los repases:

Video explicativo del concepto de límite, por si necesitas repasarlo:

Maximizar y Minimizar una función:

Por último, repasamos como convertir de decimal a binario, y viceversa:


Estadística

Los contenidos requeridos de estadística y probabilidad son teóricos. Uno de los aprendizajes centrales de esta Diplomatura es el análisis de datos en situaciones reales. Para ello, esperamos que tengas las bases y conocimientos fundamentales de estadística y probabilidad, a partir de los cuales construir habilidades prácticas de análisis. Entre ellos:

  • Estadística descriptiva. Variables aleatorias y sus tipos. Medidas de tendencia central y dispersión. Histogramas.
  • Teoría de la probabilidad. Probabilidad marginal, conjunta y condicional.
  • Estadística inferencial. Correlación entre variables aleatorias. Diferencias entre población y muestra. Estimadores puntuales e intervalos de confianza. Distribución normal.

El siguiente curso introductorio de Crash Course tiene subtítulos en español y explica con videos cortos y dinámicos una gran variedad de temas.

Para repasar estadística descriptiva y muestreo desde una perspectiva aplicada, les recomendamos:

  • Esta página con explicaciones interactivas, creada por Daniel Kunin mientras era estudiante en la Universidad de Brown.
  • El Manual de Estadística Básica desarrollado por el Dirección del Observatorio Argentino de Drogas de la Nación.

Programación

La programación es una herramienta fundamental de la Ciencia de Datos, ¡casi tanto como la estadística! Sin embargo, las habilidades técnicas que se utilizan son particulares a esta área, así que no es necesario ser un experto. En esta Diplomatura se espera que los alumnos tengan nociones básicas de programación en Python, y una introducción a la librería Pandas.

Esperamos que sepas manejar los siguientes conceptos de programación específicamente en Python:

  • Manejo de variables y flujo de ejecución
  • Funciones
  • Tipos de datos
  • Estructuras de datos y cómo iterarlas
  • Lectura y escritura de archivos
  • Listas por comprensión
  • [Avanzado pero deseable] Expresiones regulares, programación orientada a objetos y generadores

Para aprender más sobre Python, repasar, y sobre todo ¡practicar!, te recomendamos el excelente curso Curso introductorio de Python realizado por la rama estudiantil de la IEEE en el Instituto Tecnológico de Buenos Aires. Podés consultarlo en su repositorio de GitHub o directamente en sus notebooks de Google Colab.
También recomendamos el curso de programación básica en codeacademy, muy completo e interactivo, pero sólo disponible en inglés.

Pandas es una librería de manejo de datos en Python, que nos permite realizar operaciones muy similares a las que realizaríamos en una hoja de cálculo, pero de manera programática. Si bien profundizaremos en su uso y aplicaciones durante la Diplomatura, esperamos que los alumnos ya estén familiarizados con los conceptos más fundamentales. Entre ellos:

  • Lectura de archivos locales y remotos
  • Características de las estructuras de datos DataFrame y Series
  • Selección de datos a partir de índice (indexado), las columnas
  • Filtrado de valores.

Para repasar o comenzar a programar en Pandas, les compartimos este tutorial muy sintético pero completo de las operaciones más fundamentales.

También pueden visitar este Curso de manejo básico de Pandas realizado por datacarpentry, que cuenta con lecciones en formato notebook.


Entorno de Trabajo

Como científicos de datos, contamos con conjunto de herramientas generales y específicas que utilizaremos en casi todos proyectos. En esta Diplomatura usaremos:

  • Slack para comunicación
  • Git para control de versiones. Git es una herramienta muy completa, pero con conocer el flujo básico de trabajo (clonecommitpullpush) será suficiente.
  • GitHub para almacenar el contenido de las materias, en repositorios públicos.
  • Google Colab y Jupyter-lab para ejecutar notebooks de Python.

Algunos recursos que te recomendamos para aprender o repasar el uso de Git:


Soft Skills

Es importante que tengamos en cuenta que para convertirnos en Data Scientist, será beneficioso que repasemos la importancia de las habilidades blandas, tales como:

  • Conocimiento del negocio
  • Habilidades comunicacionales
  • Empatía y trabajo en equipo

Conocimiento del negocio

Muchas veces nos vamos a encontrar con clientes o product owners a los que tendremos que dirigirnos para explicarles sobre la riqueza de los datos, lo que podemos hacer con ellos, y no serán personas que conocerán sobre la ciencia de datos. Es importante que conozcamos sobre el negocio y la industria en la cual estaremos interviniendo y conseguir resultados positivos.

En este video, Erik Haller (Executive Vice President of Experian DataLabs) cuenta la importancia de convertirnos en Data Scientist con buenas soft skills:

Habilidades Comunicacionales

A lo largo de nuestro trabajo siempre vamos a estar comunicándonos con personas, ya sean compañeros de trabajo, Managers o clientes. Entonces es importante que busquemos como mejorar nuestras habilidades a la hora de hacerlo, y las conversaciones que tengamos nos ayuden a cumplir objetivos.

Te dejamos este video sobre como desarrolllar buenas habilidades comunicacionales:

Empatía y trabajo en equipo

La empatía es la capacidad de ponerse en el lugar de otra persona, una habilidad importante en cualquier espacio de trabajo. Nos puede ayudar a crear un buen ambiente laboral, una buena relación con compañeros y con clientes. Además, es uno de los pilares de la inteligencia emocional.

Les dejamos un videito para reflexionar sobre la importancia de desarrollar la empatía, valorar la diversidad, y saber trabajar todos en equipo: