RDBU| Repositório Digital da Biblioteca da Unisinos

DeepBatch: a hybrid deep learning model for an interpretable diagnosis of breast cancer in whole-slide images

Mostrar registro simples

Autor Zeiser, Felipe André;
Lattes do autor http://lattes.cnpq.br/1870564118351754;
Orientador Costa, Cristiano André da;
Lattes do orientador http://lattes.cnpq.br/9637121030877187;
Co-orientador Ramos, Gabriel de Oliveira;
Lattes do co-orientador http://lattes.cnpq.br/9281736089055094;
Instituição Universidade do Vale do Rio dos Sinos;
Sigla da instituição Unisinos;
País da instituição Brasil;
Instituto/Departamento Escola Politécnica;
Idioma en;
Título DeepBatch: a hybrid deep learning model for an interpretable diagnosis of breast cancer in whole-slide images;
Resumo CONTEXTO: Os avanços em estudos à nível molecular e de sequenciamento genético trouxeram significativos progressos no compreendimento do comportamento, tratamento e prognóstico do câncer de mama. No entanto, o diagnóstico do câncer de mama em estágios iniciais ainda é essencial para o sucesso no tratamento. Atualmente, o padrão ouro para o diagnóstico, tratamento e gerenciamento do câncer de mama é a análise histológica de uma seção suspeita. A histopatologia consiste na análise das características das lesões através de cortes de tecido corados com Hematoxilina e Eosina. Contudo, atualmente os patologistas são submetidos a altas cargas de trabalho, muito devido ao papel fundamental desempenhado pela análise histológica no tratamento do paciente. Neste contexto, aplicações que possam reduzir o tempo da análise histológica, fornecer uma segunda opinião, ou ainda apontar locais suspeitos como ferramenta de triagem podem auxiliar o patologista. OBJETIVO: Desse modo, vislumbramos dois desafios principais: o primeiro, como identificar regiões cancerígenas em Whole Slide Imaging (WSI) utilizando Deep Learning (DL) com uma precisão comparável as anotações do patologista, consideradas como padrão ouro na literatura. E, segundo, como um modelo baseado em DL pode fornecer um diagnóstico interpretável. A contribuição científica consiste em propor um modelo baseado em Convolutional Neural Networks (CNN) para fornecer uma segmentação refinada e multi-classe de WSI do câncer de mama. METODOLOGIA: A metodologia consiste em propor e desenvolver um modelo chamado de DeepBatch. O DeepBatch é dividido em quatro módulos: Preprocessing, ROI Detection, ROI Sampling e Cell Segmentation. Estes módulos são organizados de maneira a decodificar as informações aprendidas utilizando CNNs em previsões interpretáveis para os patologistas. O módulo de Preprocessing é responsável pela remoção do fundo e de ruído das WSI. No ROI Detection utilizamos a arquitetura convolucional U-Net para identificar regiões suspeitas em WSI de baixa ampliação. As regiões suspeitas identificadas são mapeadas de baixas ampliações pelo ROI Sampling para ampliações de 40×. As regiões em alta ampliação são então segmentadas pela Cell Segmentation. A segmentação é realizada utilizando uma ResNet50/U-Net. Para a validação do DeepBatch, utilizamos datasets de diversas fontes que podem ser utilizados em conjunto ou separadamente em cada módulo, conforme o objetivo do módulo. RESULTADOS: As avaliações realizadas demonstram a viabilidade do modelo. Avaliamos o impacto de quatro espaços de cores (RGB, HSV, YCrCb e LAB) para a segmentação multi-classe de WSI do câncer de mama. Utilizamos para o treinamento, validação e teste 205 WSI do câncer de mama. Para a detecção de regiões suspeitas pelo ROI Detection obtivemos uma IoU de 93.43%, acurácia de 91.27%, sensibilidade de 90.77%, especificidade de 94.03%, F1-Score de 84.17% e uma AUC de 0.93. Para a segmentação refinada das WSI pelo módulo de Cell Segmentation obtivemos uma IoU de 88.23%, acurácia de 96.10%, sensibilidade de 71.83%, especificidade de 96.19%, F1-Score de 82.94% e uma AUC de 0.86. CONCLUSÃO: Como contribuição, o DeepBatch fornece uma segmentação refinada das WSI do câncer de mama utilizando uma cascata de CNNs. Esta segmentação facilita a interpretação do diagnóstico pelo patologista, fornecendo com precisão as regiões consideradas durante a inferência da WSI. Os resultados indicam a possibilidade de utilização do modelo como um sistema de segunda leitura.;
Abstract CONTEXT: Advances in studies at the molecular and genetic sequencing have brought significant progress in understanding the behavior, treatment, and prognosis of breast cancer. However, the diagnosis of breast cancer in the early stages is still essential for successful treatment. Currently, the gold standard for breast cancer diagnosis, treatment, and management is a histological analysis of a suspected section. Histopathology consists of analyzing the characteristics of the lesions through sections of tissue stained with Hematoxylin and Eosin. However, pathologists are currently subjected to high workloads, mainly due to the fundamental role played by histological analysis in the treatment of the patient. In this context, applications that can reduce the time of histological analysis, provide a second opinion, or even point out suspicious locations as a screening tool can help the pathologist. OBJECTIVE: We envision two main challenges: the first, how to identify cancerous regions in Whole Slide Imaging (WSI) using Deep Learning (DL) with an accuracy comparable to the pathologist’s annotations, considered the gold standard in the literature. And second, how a DL-based model can provide an interpretable diagnosis. The scientific contribution consists in proposing a model based on Convolutional Neural Networks (CNN) to provide a refined and multi-class segmentation of WSI in breast cancer. METHODOLOGY: The methodology consists of proposing and developing a model called DeepBatch. The DeepBatch is divided into four modules: Preprocessing, ROI Detection, ROI Sampling, and Cell Segmentation. These modules are organized to decode the information learned using CNNs in interpretable predictions for pathologists. The Preprocessing module is responsible for removing background and noise from WSI. At ROI Detection, we use the U-Net convolutional architecture to identify suspicious regions in low magnification WSI. Suspected areas identified are mapped from low magnifications by ROI Sampling to 40× magnifications. Cell Segmentation then segments high-magnification areas. Segmentation is performed using a ResNet50/U-Net. To validate the DeepBatch, we use datasets from different sources that can be used together or separately in each module, depending on the module’s objective. RESULTS: The evaluations performed demonstrate the feasibility of the model. We assessed the impact of four-color spaces (RGB, HSV, YCrCb, and LAB) for multi-class segmentation of breast cancer WSI. We used 205 WSI of breast cancer for training, validation, and testing. For the detection of suspicious regions by ROI Detection we obtained a IoU of 93.43%, accuracy of 91.27%, sensitivity of 90.77%, specificity of 94.03%, F1-Score of 84.17%, and an AUC of 0.93. For the refined segmentation of WSI by the Cell Segmentation module we obtained a IoU of 88.23%, accuracy of 96.10%, sensitivity of 71.83%, specificity of 96.19%, F1 -Score of 82.94%, and an AUC of 0.86. CONCLUSION: As a contribution, DeepBatch provides refined segmentation of breast cancer WSIs using a cascade of CNNs. This segmentation helps the interpretation of the diagnosis by the pathologist, accurately presenting the regions considered during the inference of WSI. The results indicate the possibility of using the model as a second reading system.;
Palavras-chave Breast cancer; Histopathological images; Deep learning; Interpretable diagnosis; Convolutional neural network; Whole-slide image; Image segmentation; Câncer de mama; Imagem histopatológica; Aprendizado profundo; Diagnóstico interpretável; Redes neurais convolucionais; Segmentação de imagem;
Área(s) do conhecimento ACCNPQ::Ciências Exatas e da Terra::Ciência da Computação;
Tipo Dissertação;
Data de defesa 2020-07-31;
Agência de fomento CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior; CNPQ – Conselho Nacional de Desenvolvimento Científico e Tecnológico;
Direitos de acesso openAccess;
URI http://www.repositorio.jesuita.org.br/handle/UNISINOS/9355;
Programa Programa de Pós-Graduação em Computação Aplicada;


Arquivos deste item

Este item aparece na(s) seguinte(s) coleção(s)

Mostrar registro simples

Buscar

Busca avançada

Navegar

Minha conta

Estatística