Saltar al contenido

Herramientas de Data Science para dosimetría en medicina nuclear

facilita: Pedro Pérez

https://github.com/pap84/diplodatos-mentoria

Motivación

Las imágenes de diagnóstico en medicina nuclear se producen por medio de la detección de los rayos x emitidos por radionucleidos incorporados al cuerpo. Estos radionucleidos son adheridos a moléculas llamadas carrier que transportan el elemento radiactivo a las zonas de interés para las cuales fueron diseñadas. Así, por ejemplo, hay moléculas carrier que se dirigen a zonas donde hay mayor concentración de glucosa. Estos radionucleidos se utilizan para dos propósitos generales: diagnóstico y tratamiento de diferentes patologías, entre ellas el cáncer.

La distribución de los radionucleidos en el cuerpo humano depende de varios factores, principalmente del metabolismo del paciente y de la molécula carrier. Por sus propias características, esta distribución no es homogénea ni tampoco se concentra completamente en la zona del cuerpo a la que se desea irradiar, e incluso varía en función del tiempo. Así por ejemplo, podremos encontrar un radionucleído concentrado en una zona tumoral, en una relación 4:1 con su concentración en el resto del cuerpo.

Esta técnica y sus aplicaciones, se encuentran en constante expansión y son cada día más utilizadas en pacientes de todo tipo de edades y características. Las energías de los rayos x de radionucleidos utilizados tradicionalmente para diagnóstico, no revisten mayores peligros para el paciente si es utilizada para estudios ocasionales. Pero la utilización de estos rayos para tratamiento (mayor energía y otras partículas como electrones o partículas alfa) o en controles de rutina periódicos puede implicar grandes depósitos de dosis en el cuerpo del paciente, pudiendo provocar consecuencias indeseables en órganos o tejidos más sensibles y que no necesitan ser tratados. Por esto, la dosimetría en medicina nuclear, constituye hoy una herramienta fundamental para conocer la energía impartida a cada órgano/tejido y poder así evaluar riesgos.

El presente proyecto propone el uso del análisis de clusters para aplicaciones en dosimetría 3D como método de automatización para la identificación de inhomogeneidades. Se asociarán vóxeles a volúmenes de interés de acuerdo a sus propiedades funcionales y se utilizarán técnicas de clustering para ello, pudiendo luego determinar mapas de actividad acumulada necesarios para realiza cálculos de dosimetría 2D y 3D.

Bibliografía introductoria

  1. The changing face of cancer diagnosis: From computational image analysis to systems biology. European Radiology (2018) 28:3160–3164.
  2. Machine Learning in Nuclear Medicine: Part 1—Introduction. Journal of Nuclear Medicine (2019) 60:451–458.
  3. Implementation of cluster analysis in 3D dosimetry for targeted radionuclide therapy. 2008 IEEE Nuclear Science Symposium Conference Record.

Descripción del problema

Es necesaria la estimación de distribuciones espaciales de dosis usando aproximaciones 3D basadas en vóxeles. Es necesario un análisis de clusters para aplicaciones de dosimetría 3D que automatice la forma de identificar inhomogeneidades por medio del agrupamiento de los vóxeles dentro del volumen de interés de acuerdo a su funcionalidad.

Se implementará, en un comienzo, la metodología de k-means y se aplicará a imágenes 3D y 4D de pacientes y simuladas. Se buscarán sub-regiones dentro de la región de interés cuyos vóxeles compartan determinadas características a los fines de producir mapas de actividad acumulada por medio del ajuste de centroides de clusters y utilizando la imagen clusterizada como mapa. Se identificarán, así mismo, zonas de exceso de ruido originado por errores de registración. Finalmente, se realizará un análisis de los beneficios y limitaciones del método propuesto y se estudiarán otras técnicas de Machine Learning que pueda abordar los límites planteados por la primera.

En imágenes médicas, la presentación de resultados de forma intuitiva es central para la comunicación con el médico. El físico médico debe ser capaz de presentar los resultados logrando proveer tanto información anatómica como metabólica en una misma imagen. En análisis y visualización se detectarán outliers, se definirán zonas de interés y se estudiarán formas de matching de imágenes anatómicas y metabólicas para su presentación.

En este campo será importante «limpiar» las imágenes de posibles efectos debido a ruido electrónico o efectos indeseados producto de las propiedades físicas de la radiación y algunas consecuencias geométricas.

Se utilizarán técnicas de aprendizaje automático para la definición de inhomogeneidades por medio de la clasificación de vóxeles.

Práctico de Análisis y Visualización

En imágenes médicas, la presentación de resultados de forma intuitiva es central para la comunicación con el médico. El físico médico debe ser capaz de presentar los resultados logrando proveer tanto información anatómica como metabólica en una misma imagen. En análisis y visualización se detectarán outliers, se definirán zonas de interés y se observarán características particulares de las imágenes.

En el presente proyecto realizaremos un trabajo de exploración sobre un conjunto de 2 imágenes de medicina nuclear a elección del/de la alumno/a. Cada imagen constituirá un dataset en sí mismo.

Dataset

Dataset 1

Encuentre una imagen 2D de medicina nuclear (puede ser de Cámara Gamma o un slice de una imagen de técnicas 3D). La imagen debe haber sido adquirida a distintos instantes de tiempo y debe ser anonimizada antes de su utilización. Se muestra a continuación, un ejemplo de serie de 3 instantes de tiempo en los que se adquirió la misma imagen.

Dataset 2

Encuentre una imagen 3D, también de medicina nuclear, tomada a distintos instantes de tiempo (4D).

Consideraciones generales

Ambos datasets deben corresponder a imágenes de medicina nuclear, es decir, obtenidas a partir de la detección de fotones provenientes de emisión de radionucleidos previamente suministrados a un paciente.

Ambos datasets deben encontrarse anonimizados y pertenecer, o bien a una base de datos pública para educación/investigación o a una clínica médica que las otorgue anonimizadas y con consentimiento escrito para estos fines (recomendable a los fines de poder contar con imágenes para el resto de las materias y poder discutir el dataset con quien las provéa, generalmente interesado/a en un estudio de estas características).

Consignas

Parte 1

Realice un análisis exploratorio sobre cada dataset.

  1. Encuentre en cada caso la distribución de los valores de cada pixel y su evolución en el tiempo.
  2. Realizar análisis de estadística descriptiva sobre los datos, tanto en una como en múltiples variables. Moda, media, mediana y desviación estándar de un producto en particular.
  3. Defina de alguna forma la información que pueda considerarse “ruido” y encuentre outliers.
  4. Existe alguna probabilidad condicional entre valores de pixels entre diferentes tiempos de adquisición? Conviene tomar valores de píxeles directamente o es preferible agruparlos en grupos? Justifique.
  5. Agrupe en un número que considere aceptable los datos de cada imagen y busque coeficientes de correlación entre grupos del mismo tiempo y grupos de distintos tiempos. Definido un conjunto de píxeles dentro de un grupo en la primera imagen, este grupo de píxeles debe pertenecer al mismo grupo en los tiempos siguientes.
  6. Defina un criterio para poder dividir los datos en cada imagen en sub-regiones que pueda considerar “homogéneas”.
  7. Grafique, en cada caso de los puntos anteriores, y realice la visualización que considere más óptima. Justifique la elección de la visualización.

Parte 2

A partir de los resultados obtenidos en la Consigna 1, diagramar una comunicación visual interactiva de los resultados describiendo los aspectos principales del dataset elegido (outliers, ruidos, sub-regiones homogéneas, etc.).

La comunicación debe estar apuntada a un público técnico pero sin conocimiento del tema particular, como por ejemplo, sus compañeros de clase.

Entrega

Utilice Plotly, Bokeh o Dash (recomendable) para presentar los resultados.
Deadline: 15 días posteriores al finalizar la materia de Análisis y Visualización.