Saltar al contenido

M07- Análisis de Sentimiento en Noticias Financieras e Indicadores Financieros

Tutor: Matías Ramos
mramos.mdata@gmail.com

Descripción

El objetivo principal de esta mentoría es conocer diferentes datos con los que se trabaja para tomar decisiones de inversión en los mercados financieros. Utilizaremos un dataset con los principales indicadores financieros y analizaremos la relación con el precio de la acción.
Trabajaremos además utilizando algunas técnicas de procesamiento de lenguaje natural, para analizar noticias financieras de ciertas entidades (acciones o criptomonedas) y mediante análisis de sentimiento clasificaremos los textos en positivo, negativo o neutral.

Este tema es interesante porque...

Desde siempre la información tuvo un papel muy importante en la toma de decisiones de inversión, en el último tiempo las noticias y las redes sociales empezaron a formar parte de estos análisis. Para procesar estos datos de manera más rápida y acertada, el software junto con la ciencia de datos, cumplen un rol cada vez más importante en el mundo financiero.

Trataremos de responder algunas de las siguientes preguntas

– ¿Podemos encontrar correlaciones en los indicadores financieros y el precio de la Acción?
– ¿Qué estrategias se utilizan para tomar decisiones con estos datos?
– ¿Qué algoritmos encontramos que funcionan mejor a la hora de clasificar sentimiento en lasnoticias financieras?
– ¿Podemos encontrar la entidad a la que se refiere una noticia y el sentimiento positivo o negativo utilizando solo el título de la noticia? ¿Cuánta precisión se pierde?
– ¿Qué patrones podemos encontrar dentro del lenguaje de las noticias financieras, que nos pueda aportar valor al momento de tomar decisiones financieras?
– ¿Qué patrones podemos encontrar en las noticias para mejorar los modelos de clasificación?

Datos

Si querés inspeccionar el conjunto de datos, lo encontrarás en https://drive.google.com/drive/folders/1-ZESpyeLrORGuuxY5HwwHoaq3FPTw9N2

Hitos de la Mentoría

Entrega 20/05 – Práctico de análisis y visualización,

– Se aprenderá a extraer medidas de tendencia central y medidas de dispersión, luego se visualizarán los diferentes índices financieros.
– Se verificará la cantidad de noticias x año
– Se visualizará la correlación entre indicadores
– Se observaran los gráficos generados, y sacar conclusiones de estos

Entrega 17/06 – Práctico de análisis exploratorio y curación de datos,

– Se verán los indicadores y las relaciones entre estos.
– Se aprenderá a trabajar en un repositorio git de manera colaborativa.
– Se analizaran outliers de los indicadores y de las noticias y cómo debemos trabajar con estos.
– Se curarán los datos de texto, utilizando lematización, stop-words, puntuaciones, mayúsculas, etc.

Entrega 24/06 – Video de presentación intermedia del proyecto y dataset.
Entrega 29/07 – Práctico aprendizaje supervisado,

– Se aprenderá a utilizar la herramienta scatter_matrix, y veremos correlaciones entre indicadores
– Se verán embeddings para representar palabras de las noticias.
– Se aprenderá a preparar los datos para entrenar modelos de clasificación.
– Se probarán diferentes algoritmos para clasificar noticias en positivas, negativas, neutrales.
– Se utilizará la herramienta GridSearch para encontrar parámetros óptimos a la hora de entrenar modelos.
– Se estudiarán las métricas para evaluar los modelos.

Entrega 26/08 – Práctico aprendizaje no supervisado,

– Se graficarán embeddings, y se utilizarán algoritmos de clusterización en noticias.
– Se utilizará un análisis de componentes principales para reducir la dimensionalidad de los indicadores financieros.

Entrega 23/09 – Video de presentación final de mentoría.
Jornadas 11/11 y 12/11 – Presentación de mentorías.

Integrantes del grupo 1
Catalina Chavez - Federico Bosack
Franco Genolet - Marilina Trevisan.
Integrantes del grupo 2
Ani Salama - Pablo Nicolás Ramos
Víctor Rocco - Guillermo Alonso.