13 de abril de 2026
Detecção Precoce de Melanoma com Redes Neurais Convolucionais
Thomas Jun Obara; Lauro Marques Vicari
Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.
O câncer de pele configura-se como uma das patologias de maior incidência em escala global, apresentando milhões de novos diagnósticos anualmente e representando um desafio persistente para os sistemas de saúde pública e privada. No cenário brasileiro, as estimativas apontam para a ocorrência de 704 mil novos casos entre os anos de 2023 e 2025, o que reforça a necessidade de estratégias diagnósticas mais eficientes e acessíveis (Santos et al., 2023). A pele, sendo o maior órgão do corpo humano, é composta por uma diversidade de células que, sob condições de crescimento descontrolado, podem originar neoplasias classificadas como benignas ou malignas. No grupo dos tumores epiteliais, a etiologia é multifatorial, envolvendo predisposições genéticas, fragilidades no sistema imunológico e, predominantemente, a exposição prolongada aos raios ultravioleta. Esta última causa é apontada como responsável por uma parcela que varia entre 50% e 90% dos diagnósticos registrados (Nanz et al., 2024).
Dentro do espectro das neoplasias malignas, o melanoma destaca-se pela sua agressividade intrínseca, rápido crescimento e elevado potencial de disseminação metastática para outros órgãos. Embora represente uma fração menor do total de casos de câncer de pele quando comparado aos carcinomas basocelular e espinocelular, o melanoma é responsável por aproximadamente 64% das mortes relacionadas a tumores cutâneos (Siegel et al., 2023). A letalidade desta doença está intrinsecamente ligada ao estágio em que é detectada. Quando o diagnóstico ocorre em fases iniciais, a taxa de sobrevida e a eficácia do tratamento aumentam consideravelmente, podendo reduzir a mortalidade em até 90% (Khan et al., 2019). Entretanto, a identificação precoce enfrenta obstáculos significativos devido à semelhança morfológica entre lesões malignas e benignas. O melanoma pode ser facilmente confundido com queratoses seborreicas pigmentadas ou nevos melanocíticos, o que desafia até mesmo profissionais experientes (Bozsányi et al., 2021).
Os métodos tradicionais de diagnóstico, como a biópsia, embora considerados o padrão-ouro pela precisão, apresentam limitações operacionais por serem procedimentos invasivos, onerosos e que demandam tempo considerável para a análise laboratorial (Kesztyüs et al., 2025). Além disso, a subjetividade na análise visual pode levar a inconsistências, gerando uma demanda excessiva por biópsias desnecessárias, o que eleva os custos hospitalares e o desconforto do paciente (McFerran et al., 2024). A dermatoscopia surge como uma alternativa não invasiva, utilizando equipamentos que ampliam a visualização das estruturas cutâneas, mas sua eficácia permanece dependente da curva de aprendizado do examinador e da disponibilidade de especialistas qualificados, recurso escasso em regiões remotas ou com infraestrutura médica limitada (Panfilo, 2012).
Nesse contexto, a integração de técnicas de aprendizado de máquina e visão computacional apresenta-se como uma fronteira promissora para a medicina moderna. As redes neurais convolucionais, em particular, demonstram uma capacidade superior no processamento de imagens médicas, permitindo a automação da triagem com alta precisão e agilidade (Das et al., 2021). Tais modelos são capazes de identificar padrões complexos em lesões cutâneas que muitas vezes passam despercebidos ao olho humano, servindo como ferramentas de suporte à decisão clínica. A evolução dessas tecnologias permite que algoritmos treinados em grandes bases de dados alcancem indicadores de desempenho comparáveis aos de especialistas, democratizando o acesso ao diagnóstico precoce e otimizando o fluxo de atendimento em unidades de saúde (Rahi et al., 2019).
A fundamentação metodológica para o desenvolvimento de um sistema de classificação automatizado exige uma abordagem experimental rigorosa, focada na validação de modelos de redes neurais convolucionais. O processo inicia-se com a seleção de uma base de dados robusta e representativa. A base HAM10000, disponibilizada pela International Skin Imaging Collaboration, constitui o pilar central deste estudo, contendo 10.015 imagens dermatoscópicas de lesões pigmentadas (Tschandl, 2018). Estas imagens, capturadas em diferentes contextos clínicos, são acompanhadas por metadados detalhados que incluem a classificação da lesão, o método de diagnóstico utilizado, informações demográficas como idade e sexo, além da localização anatômica da ocorrência. A diversidade da base permite que o modelo seja exposto a uma ampla gama de variações morfológicas, essenciais para a generalização do aprendizado.
As categorias de lesões presentes no conjunto de dados abrangem desde condições benignas, como o nevo melanocítico, a queratose seborreica, o dermatofibroma e as lesões vasculares, até condições malignas e pré-malignas, como o melanoma, o carcinoma basocelular e a queratose actínica. Um desafio crítico identificado na fase de exploração dos dados é o desbalanceamento acentuado entre as classes. A predominância de nevos melanocíticos em relação ao melanoma pode induzir o algoritmo a um viés de classificação, favorecendo a classe majoritária. Para mitigar este fenômeno e garantir que o modelo aprenda as características distintivas de cada patologia, implementa-se uma estratégia de balanceamento de carga.
O balanceamento é executado através de técnicas de reamostragem, estabelecendo um alvo de 3000 amostras para cada categoria principal. Para a classe melanoma e outras subclasses que possuem menos de 500 observações originais, aplica-se o upsampling, que consiste na criação de cópias das amostras existentes para aumentar a representatividade numérica. De forma inversa, para as subclasses com volume superior a 500 observações, utiliza-se o downsampling, selecionando um subconjunto aleatório para reduzir a quantidade de dados e evitar a sobreposição de informações redundantes. Esta distribuição equilibrada é fundamental para melhorar a capacidade de generalização do modelo e reduzir o risco de overfitting, onde a rede decora os dados de treinamento em vez de aprender as características intrínsecas das lesões.
A arquitetura do modelo baseia-se em redes neurais convolucionais implementadas através do framework TensorFlow, escolhido por sua eficiência em operações matemáticas complexas e otimização para processamento de imagens (Setiyono et al., 2024). O fluxo de dados dentro da rede segue uma estrutura sequencial de propagação direta, onde a imagem de entrada, redimensionada para 64 × 64 pixels para otimizar o custo computacional sem perda excessiva de detalhes, passa por sucessivas camadas de extração de características. As camadas convolucionais utilizam filtros progressivos de 64, 128 e 256 unidades, empregando kernels de tamanho 3 × 3. Estes filtros percorrem a matriz de pixels da imagem para detectar padrões locais, como bordas, texturas e variações cromáticas, que são fundamentais para a distinção entre tumores malignos e benignos (Musthafa et al., 2024).
Após cada operação de convolução, aplica-se a função de ativação ReLU, que introduz a não linearidade necessária para que o modelo interprete padrões complexos, evitando o problema do desaparecimento do gradiente durante o treinamento (Pandey et al., 2024). A redução da dimensionalidade dos dados é realizada por camadas de max pooling com janelas de 2 × 2 e strides de 2, que selecionam os valores máximos em cada região do mapa de características, preservando as informações mais relevantes e diminuindo a sensibilidade do modelo a pequenas variações na posição da lesão (Zafar et al., 2022). Para combater o overfitting, incorpora-se a técnica de dropout com uma taxa de 0,2, desativando aleatoriamente neurônios durante o treinamento para forçar a rede a desenvolver representações mais robustas.
O pré-processamento das imagens inclui a aplicação de zero-padding, adicionando bordas de pixels pretos ao redor da imagem original para preservar as informações contidas nas extremidades durante as convoluções (Younas et al., 2025). A fase final da arquitetura consiste em camadas totalmente conectadas, onde os mapas de características aplanados são processados por uma camada densa de 64 neurônios e, por fim, uma camada de saída com ativação softmax para calcular as probabilidades de classificação binária entre melanoma e não-melanoma. O treinamento é configurado com o otimizador Adam, que ajusta a taxa de aprendizado de forma dinâmica, e a função de perda binary crossentropy, adequada para problemas de classificação com duas classes. O processo é executado ao longo de 50 épocas com um tamanho de batch de 32, garantindo a estabilidade da convergência.
A avaliação do desempenho do modelo é realizada através de métricas rigorosas, sendo a acurácia, a sensibilidade, a especificidade e o F1-score os principais indicadores. A acurácia fornece uma visão geral da proporção de acertos totais, enquanto a sensibilidade, ou recall, é crucial no contexto médico por medir a capacidade do sistema em identificar corretamente os casos positivos de melanoma, minimizando os falsos negativos que poderiam comprometer a vida do paciente. A especificidade, por sua vez, avalia a precisão na identificação de lesões benignas, reduzindo a ocorrência de falsos positivos que geram ansiedade e custos desnecessários com procedimentos complementares. A curva ROC e o cálculo da área sob a curva (AUC) complementam a análise, demonstrando a capacidade discriminativa do modelo em diferentes limiares de decisão.
Os resultados obtidos revelam que o modelo alcançou uma acurácia de 90,5% no conjunto de teste, um valor significativo que demonstra a eficácia da arquitetura proposta e das técnicas de balanceamento aplicadas. A análise da evolução do aprendizado indica que a acurácia do treinamento apresentou um crescimento rápido nas épocas iniciais, mantendo uma trajetória ascendente consistente. Embora a curva de teste tenha exibido oscilações pontuais, o comportamento geral seguiu a tendência de convergência, sem evidências de sobreajuste. A função de perda também demonstrou uma redução progressiva, validando a escolha dos hiperparâmetros e do otimizador Adam para a estabilização do processo de treinamento.
No que tange à sensibilidade, o modelo atingiu a marca de 96% para a classe melanoma, um resultado de extrema relevância para a triagem clínica. Este valor indica que a vasta maioria dos tumores malignos foi corretamente identificada, o que é o objetivo primordial de uma ferramenta de diagnóstico assistido. A especificidade fixou-se em 84%, refletindo uma capacidade satisfatória de distinguir lesões benignas, embora com uma margem para aprimoramento na redução de falsos positivos. O F1-score de 0,91 para a classe positiva confirma o equilíbrio entre precisão e sensibilidade, consolidando o modelo como uma solução confiável para a detecção precoce.
A comparação sistemática com a literatura reforça a competitividade do algoritmo desenvolvido. Enquanto análises visuais realizadas por especialistas apresentam uma variação de acurácia entre 47% e 89% (Godoy et al., 2017), o modelo computacional superou o limite superior desta faixa. Diagnósticos dermatoscópicos tradicionais alcançam, em média, 87% de sensibilidade (Vestergaard et al., 2008), valor também superado pela solução baseada em redes neurais convolucionais. Além disso, o desempenho mostrou-se superior a implementações anteriores que utilizaram arquiteturas menos densas ou bases de dados menores, as quais atingiram acurácias entre 83% e 90% (Mukherjee et al., 2019).
A análise detalhada da matriz de confusão permite identificar os pontos de maior dificuldade para o algoritmo. Dos casos testados, houve 27 falsos negativos, situações em que o melanoma foi classificado como lesão benigna. Embora o número seja baixo em relação ao total, a redução deste indicador deve ser prioridade em desenvolvimentos futuros, dada a gravidade clínica de um diagnóstico omitido. Por outro lado, registraram-se 117 falsos positivos, onde lesões benignas foram rotuladas como melanoma. A investigação qualitativa destas imagens revelou que as queratoses seborreicas e os nevos melanocíticos são as subclasses que mais induzem o modelo ao erro. Isso ocorre devido a características morfológicas compartilhadas, como bordas irregulares e padrões de pigmentação heterogêneos, que mimetizam a aparência de um melanoma inicial.
Curiosamente, o modelo demonstrou uma precisão absoluta na distinção de lesões vasculares, não registrando nenhum falso positivo nesta categoria. Isso sugere que as características cromáticas e estruturais deste tipo de lesão são suficientemente distintas para a rede neural. A análise da curva ROC resultou em uma AUC de 0,9608, valor muito próximo da classificação perfeita. Este indicador atesta que o sistema possui uma excelente capacidade discriminativa em diversos limiares de decisão, permitindo que gestores de saúde ajustem o threshold conforme a necessidade: priorizando a sensibilidade absoluta em cenários de triagem inicial ou buscando um equilíbrio maior em contextos de diagnóstico confirmatório.
A eficiência operacional do modelo é outro ponto de destaque, com um tempo médio de processamento de 0,1042 segundos por imagem. Esta agilidade permite a execução em tempo real, o que abre caminho para a integração em dispositivos portáteis e aplicativos de telemedicina. A implementação de tais algoritmos em consultórios de atenção primária ou postos de saúde em regiões remotas pode revolucionar o fluxo de atendimento, permitindo que clínicos gerais realizem uma triagem qualificada e encaminhem apenas os casos suspeitos para especialistas, otimizando o uso dos recursos do sistema de saúde.
Apesar dos resultados promissores, o estudo reconhece limitações que devem ser endereçadas em pesquisas subsequentes. A base de dados, embora extensa, pode não representar toda a diversidade de fototipos de pele encontrados na população global, o que sugere a necessidade de inclusão de dados mais heterogêneos. Além disso, a exploração de arquiteturas mais profundas, como ResNet ou Inception, combinadas com técnicas de atenção visual, pode auxiliar na redução dos falsos positivos ao focar em detalhes microscópicos das bordas das lesões. O refinamento dos hiperparâmetros através de buscas exaustivas e a utilização de transfer learning também são caminhos viáveis para elevar ainda mais os indicadores de precisão.
O potencial de impacto social desta tecnologia é vasto. A democratização do acesso a ferramentas de diagnóstico de alta precisão contribui diretamente para a redução das desigualdades em saúde. Em um país de dimensões continentais como o Brasil, onde a concentração de especialistas em dermatologia ocorre majoritariamente em grandes centros urbanos, o uso de inteligência artificial para triagem pode ser o diferencial entre a cura e o agravamento da doença para pacientes em áreas desassistidas. A integração com sistemas públicos de saúde, como o SUS Digital, representaria um avanço significativo na vigilância epidemiológica do câncer de pele.
Conclui-se que o objetivo foi atingido, uma vez que o modelo de redes neurais convolucionais desenvolvido demonstrou alta eficácia na classificação de tumores malignos de pele, alcançando 90,5% de acurácia e 96% de sensibilidade. A metodologia de balanceamento de dados e a arquitetura sequencial com camadas de dropout e pooling mostraram-se adequadas para lidar com a complexidade das imagens dermatoscópicas. Os resultados validam a ferramenta como um instrumento robusto para triagem inicial, capaz de auxiliar profissionais de saúde na detecção precoce do melanoma e, consequentemente, contribuir para a redução das taxas de mortalidade associadas a esta patologia. O trabalho estabelece uma base sólida para futuras expansões tecnológicas, reforçando o papel transformador da ciência de dados na medicina contemporânea.
Referências Bibliográficas:
Bozsányi et al., 2021 [Referência completa não encontrada no documento original]
DAS, K.; COCKERELL, C. J.; PATIL, A.; PIETKIEWICZ, P.; GIULINI, M.; GRABBE, S.; GOLDUST, M. 2021. Machine learning and its application in skin cancer. International Journal of Environmental Research and Public Health 18(24): 13409.
GODOY, S. E.; HAYAT, M. M.; RAMIREZ, D. A.; MYERS, S. A.; PADILLA, R. S.; KRISHNA, S. Detection theory for accurate and non-invasive skin cancer diagnosis using dynamic thermal imaging. Biomedical Optics Express, v. 8, n. 4, p. 2301-2323, 22 mar. 2017.
KESZTYÜS, D.; BAE, H.; WILSON, C.; SCHÖN, M. P.; KESZTYÜS, T. 2025. Non-invasive infrared thermography for screening, diagnosis and monitoring of skin cancer. JDDG: Journal der Deutschen Dermatologischen Gesellschaft 23: 7-17.
KHAN, M. Q.; et al. 2019. Classification of melanoma and nevus in digital images for diagnosis of skin cancer. IEEE Access 7: 1–1.
MCFERRAN, E.; DONALDSON, S.; DOLAN, O.; LAWLER, M. 2024. Skin in the game: The cost consequences of skin cancer diagnosis, treatment and care in Northern Ireland. Journal of Cancer Policy 39: 100468.
MUKHERJEE, S.; ADHIKARI, A.; ROY, M. Malignant melanoma classification using cross platform dataset with deep learning CNN architecture. In: Advances in Intelligent Systems and Computing, 2019. p. 31-41.
MUSTHAFA, M M..; MAHESH, T. R.; VINOTH KUMAR, V.; GULUWADI, S. Enhanced skin cancer diagnosis using optimized CNN architecture and checkpoints for automated dermatological lesion classification. BMC Med Imaging 24, 201, 2024.
NANZ, L.; KEIM, U.; KATALINIC, A.; MEYER, T.; GARBE, C.; LEITER, U. 2024. Epidemiology of keratinocyte skin cancer with a focus on cutaneous squamous cell carcinoma. Cancers 16(3): 606.
PANDEY, A.; TEJA, M. S.; SAHARE, P. et al. 2024. Skin cancer classification using non local means denoising and sparse dictionary learning based CNN. Journal of Electrical Systems and Information Technology, v. 11, p. 36, 2024.
PANFILO, B. M. L. 2012. Técnicas de imagem para triagem de melanoma. Dissertação (Mestrado Profissional em Pesquisa e Desenvolvimento – Biotecnologia Médica) – Faculdade de Medicina de Botucatu, Universidade Estadual Paulista “Júlio de Mesquita Filho”, Botucatu, SP, Brasil.
RAHI, M.; KHAN, F.; MAHTAB, M.; ULLAH, A. K. M. A.; ALAM, M. G. R.; ALAM, M. A. Detection of skin cancer using deep neural networks. In: IEEE ASIA-PACIFIC CONFERENCE ON COMPUTER SCIENCE AND DATA ENGINEERING (CSDE), 2019, Melbourne. Anais… New York: IEEE, 2019. p. 1-7.
SANTOS, M. O.; LIMA, F. C. S.; MARTINS, L. F. L.; OLIVEIRA, J. F. P.; ALMEIDA, L. M.; CANCELA, M. C. 2023. Estimativa de incidência de câncer no Brasil, 2023-2025. Revista Brasileira de Cancerologia 2023.
SETIYONO, T.; GENTIMIS, T.; RONTANI, F.; DURON, D.; BORTOLON, G.; ADHIKARI, R.; ACHARYA, B.; HAN, K. J.; PITMAN, W. D. 2024. Application of TensorFlow model for identification of herbaceous mimosa (Mimosa strigillosa) from digital images. Smart Agricultural Technology, v. 7, p. 100400, mar. 2024.
SIEGEL, R. L.; MILLER, K. D.; WAGLE, N. S.; JEMAL, A. 2023. Cancer statistics, 2023. CA: A Cancer Journal for Clinicians 73(1): 17-48.
TSCHANDL, P. The HAM10000 dataset, a large collection of multi-source dermatoscopic images of common pigmented skin lesions. [Dataset]. Harvard Dataverse, 2018. Versão V4. DOI: 10.7910/DVN/DBW86T. Disponível em: https://doi.org/10.7910/DVN/DBW86T. Acesso em: 19 de março de 2025.
VESTERGAARD, M. E.; MACASKILL, P.; HOLT, P. E.; MENZIES, S. W. Dermoscopy compared with naked eye examination for the diagnosis of primary melanoma: a meta analysis of studies performed in a clinical setting. British Journal of Dermatology, v. 159, n. 3, p. 669-676, set. 2008.
YOUNAS, S.; SARGANO, A. B.; YOU, L.; HABIB, Z. 2025. Attention-Based Inception Residual CNN: Skin Cancer Diagnosis with Attention-Based Inception-Residual CNN Model. Information, v. 16, n. 2, p. 120, 2025.
ZAFAR, A.; AAMIR, M.; MOHD NAWIi, N.; ARSHAD, A.; RIAZ, S.; ALRUBAN, A.; DUTTA, A.K.; ALMOTAIRI, S. 2022. A comparison of pooling methods for convolutional neural networks. Applied Sciences 12(17): 8643.




























