Transformación Digital

Detección y Clasificación de Cáncer de Mama

noviembre 19, 2024

Índice de contenido

El cáncer de mama es una de las principales causas de muerte por cáncer en mujeres a nivel mundial. La Detección y Clasificación temprana es fundamental para mejorar las tasas de supervivencia, y la mamografía es una de las herramientas de diagnóstico más utilizadas. Sin embargo, la interpretación de las mamografías puede ser compleja y subjetiva, lo que puede llevar a errores en el diagnóstico.

En los últimos años, el aprendizaje profundo, una subdisciplina del aprendizaje automático, ha demostrado ser una herramienta poderosa en el análisis de imágenes médicas. Las redes neuronales convolucionales (CNN), en particular, han logrado resultados prometedores en la clasificación de imágenes y han sido aplicadas con éxito a la detección y clasificación del cáncer de mama.

Este estudio tiene como objetivo evaluar el desempeño de diferentes modelos de aprendizaje profundo en la tarea de detección y clasificación del cáncer de mama a partir de imágenes mamográficas. Se compararon varias arquitecturas de CNN, así como algoritmos de aprendizaje automático tradicionales, para determinar cuál ofrece el mejor rendimiento en términos de precisión y eficiencia.

Los resultados de este estudio podrían contribuir al desarrollo de herramientas de diagnóstico asistido por computadora más precisas y eficientes, lo que a su vez podría mejorar la detección temprana del cáncer de mama y mejorar los resultados para los pacientes.

Metodología de Detección y Clasificación de Cáncer de Mama

Para este estudio, se utilizaron dos conjuntos de datos: uno para la detección de cáncer de mama y otro para la clasificación de su grado de malignidad. Ambos conjuntos de datos constaban de imágenes mamográficas.

Para llevar a cabo este estudio, se implementó un enfoque experimental que involucró la aplicación de diversas técnicas de aprendizaje profundo a un conjunto de datos de imágenes mamográficas. Se emplearon cuatro arquitecturas de redes neuronales convolucionales profundas: VGG-16, VGG-19, MobileNet-V2 y DenseNet-121. Estas arquitecturas fueron utilizadas como clasificadores binarios para determinar la presencia o ausencia de un tumor maligno.

Para la clasificación del grado de malignidad, se evaluaron los siguientes algoritmos de aprendizaje automático: K-Nearest-Neighbors (KNN), Random Forest, Gradient Boosting y AutoML.

A continuación, se detallan los elementos clave de la metodología empleada:

Arquitecturas de Redes Neuronales Convolucionales:

- VGG-16 y VGG-19: Estas arquitecturas, propuestas por el Visual Geometry Group de la Universidad de Oxford, se caracterizan por su profundidad y por el uso casi exclusivo de convoluciones de 3×3 y capas de max-pooling. Su profundidad permite capturar características visuales altamente detalladas, lo que las hace adecuadas para la clasificación de imágenes médicas. En este estudio, se utilizaron como clasificadores binarios para determinar la presencia o ausencia de un tumor maligno.
- MobileNet-V2: Diseñada para dispositivos con recursos limitados, MobileNet-V2 emplea una arquitectura más eficiente que las redes VGG. Utiliza capas de convolución de profundidad separable y bloques invertidos con expansión para reducir el número de parámetros y las operaciones de cálculo. Su eficiencia la hace adecuada para aplicaciones en tiempo real, como la detección temprana de cáncer de mama.
- DenseNet-121: DenseNet conecta cada capa con todas las capas subsiguientes, permitiendo un flujo de información más denso y una reutilización más eficiente de las características. Esta arquitectura ha demostrado ser efectiva en diversas tareas de visión por computadora, incluyendo la clasificación de imágenes médicas.

Algoritmos de Aprendizaje Automático para la Detección y Clasificación de Cáncer de Mama

K-Nearest-Neighbors (KNN): Este algoritmo clasifica una nueva muestra asignándole la etiqueta de la mayoría de sus k vecinos más cercanos en el espacio de características. KNN es un algoritmo simple y efectivo, pero puede ser computacionalmente costoso para grandes conjuntos de datos.
Random Forest: Este algoritmo de ensamble construye múltiples árboles de decisión y toma la decisión final mediante votación. Random Forest es conocido por su alta precisión y su capacidad para manejar grandes conjuntos de datos con alta dimensionalidad.
Gradient Boosting: Este algoritmo construye modelos secuencialmente, donde cada nuevo modelo trata de corregir los errores del modelo anterior. Gradient Boosting es conocido por su alta precisión, pero puede ser computacionalmente costoso y propenso al sobreajuste.
AutoML: AutoML automatiza el proceso de selección de modelos, hiperparámetros y preprocesamiento de datos. Esta herramienta puede ser útil para explorar rápidamente una gran variedad de modelos y encontrar la mejor configuración para un problema específico.

Tareas de Clasificación:

- Clasificación binaria: Se utilizó para determinar la presencia o ausencia de un tumor maligno. Las arquitecturas VGG-16, VGG-19 y MobileNet-V2 fueron entrenadas para esta tarea.
- Clasificación multiclase: Se utilizó para clasificar el grado de malignidad del tumor. Los algoritmos KNN, Random Forest, Gradient Boosting y AutoML fueron evaluados para esta tarea.

Evaluación:

- - Métricas de evaluación: Se utilizaron métricas como precisión, recall, F1-score y curva ROC para evaluar el desempeño de los modelos.
  - Comparación de modelos: Se compararon los resultados de los diferentes modelos para identificar el modelo con mejor desempeño en cada tarea.

El análisis comparativo se realizó estandarizando el entorno de prueba con el mismo número de épocas y analizando los valores obtenidos en términos de precisión, tiempo de entrenamiento y F1-score.

Resultados

En cuanto a la detección de cáncer de mama, se encontró que DenseNet-121 fue el mejor clasificador. Sin embargo, para considerar casos sanos y diagnosticados, MobileNet-V2 mostró mejores resultados, aunque con una pequeña diferencia. Para la clasificación del grado de malignidad, Random Forest resultó ser el mejor clasificador.

Conclusiones

Las técnicas de aprendizaje profundo demostraron ser efectivas en la detección y clasificación del cáncer de mama. Entre las arquitecturas evaluadas, DenseNet-121 y MobileNet-V2 se destacaron en la detección, mientras que Random Forest fue superior en la clasificación del grado de malignidad.

Estos resultados sugieren que el uso de técnicas de aprendizaje profundo puede mejorar la precisión y eficiencia en el diagnóstico temprano del cáncer de mama, lo que es crucial para el tratamiento exitoso de esta enfermedad.

Referencias

La Cruz, A., Santacruz, C. A. D., Polo, L., & Severeyn, E. (2022, October). Breast Cancer Screening Using Deep Learning. In 2022 IEEE Sixth Ecuador Technical Chapters Meeting (ETCM) (pp. 1-6). IEEE.

Autor: Erika Severeyn Varela, Doctor en Ingeniería Biomédica. Profesora de los módulos: Introducción a la Ingeniería Biomédica, Electrónica e Informática Aplicada a la Biomedicina y Áreas Profesionales dentro de la Biomedicina, Herramientas para el Desarrollo de Proyectos en Biomédica.