M07- Análisis de Sentimiento en Noticias Financieras e Indicadores Financieros
Tutor: Matías Ramos
mramos.mdata@gmail.com
El objetivo principal de esta mentoría es conocer diferentes datos con los que se trabaja para tomar decisiones de inversión en los mercados financieros. Utilizaremos un dataset con los principales indicadores financieros y analizaremos la relación con el precio de la acción.
Trabajaremos además utilizando algunas técnicas de procesamiento de lenguaje natural, para analizar noticias financieras de ciertas entidades (acciones o criptomonedas) y mediante análisis de sentimiento clasificaremos los textos en positivo, negativo o neutral.
Desde siempre la información tuvo un papel muy importante en la toma de decisiones de inversión, en el último tiempo las noticias y las redes sociales empezaron a formar parte de estos análisis. Para procesar estos datos de manera más rápida y acertada, el software junto con la ciencia de datos, cumplen un rol cada vez más importante en el mundo financiero.
– ¿Podemos encontrar correlaciones en los indicadores financieros y el precio de la Acción?
– ¿Qué estrategias se utilizan para tomar decisiones con estos datos?
– ¿Qué algoritmos encontramos que funcionan mejor a la hora de clasificar sentimiento en lasnoticias financieras?
– ¿Podemos encontrar la entidad a la que se refiere una noticia y el sentimiento positivo o negativo utilizando solo el título de la noticia? ¿Cuánta precisión se pierde?
– ¿Qué patrones podemos encontrar dentro del lenguaje de las noticias financieras, que nos pueda aportar valor al momento de tomar decisiones financieras?
– ¿Qué patrones podemos encontrar en las noticias para mejorar los modelos de clasificación?
Si querés inspeccionar el conjunto de datos, lo encontrarás en https://drive.google.com/drive/folders/1-ZESpyeLrORGuuxY5HwwHoaq3FPTw9N2
Entrega 20/05 – Práctico de análisis y visualización,
– Se aprenderá a extraer medidas de tendencia central y medidas de dispersión, luego se visualizarán los diferentes índices financieros.
– Se verificará la cantidad de noticias x año
– Se visualizará la correlación entre indicadores
– Se observaran los gráficos generados, y sacar conclusiones de estos
Entrega 17/06 – Práctico de análisis exploratorio y curación de datos,
– Se verán los indicadores y las relaciones entre estos.
– Se aprenderá a trabajar en un repositorio git de manera colaborativa.
– Se analizaran outliers de los indicadores y de las noticias y cómo debemos trabajar con estos.
– Se curarán los datos de texto, utilizando lematización, stop-words, puntuaciones, mayúsculas, etc.
Entrega 24/06 – Video de presentación intermedia del proyecto y dataset.
Entrega 29/07 – Práctico aprendizaje supervisado,
– Se aprenderá a utilizar la herramienta scatter_matrix, y veremos correlaciones entre indicadores
– Se verán embeddings para representar palabras de las noticias.
– Se aprenderá a preparar los datos para entrenar modelos de clasificación.
– Se probarán diferentes algoritmos para clasificar noticias en positivas, negativas, neutrales.
– Se utilizará la herramienta GridSearch para encontrar parámetros óptimos a la hora de entrenar modelos.
– Se estudiarán las métricas para evaluar los modelos.
Entrega 26/08 – Práctico aprendizaje no supervisado,
– Se graficarán embeddings, y se utilizarán algoritmos de clusterización en noticias.
– Se utilizará un análisis de componentes principales para reducir la dimensionalidad de los indicadores financieros.
Entrega 23/09 – Video de presentación final de mentoría.
Jornadas 11/11 y 12/11 – Presentación de mentorías.