Imagem Classificação não-supervisionada de ilhas de calor em Curitiba usando autoencoder e sensoriamento remoto

05 de março de 2026

Classificação não-supervisionada de ilhas de calor em Curitiba usando autoencoder e sensoriamento remoto

Diogo Filipe Sens; Daniel Amgarten Simão

Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.

A transição demográfica global ocorrida em 2008, quando a maior parte da população mundial passou a residir em centros urbanos, estabeleceu um marco crítico para a gestão do espaço geográfico (UN-HABITAT, 2008). Esse fenômeno de urbanização acelerada impõe desafios severos, caracterizados pela alteração profunda do ambiente natural, supressão de vegetação nativa e impermeabilização extensiva do solo. O planejamento urbano contemporâneo busca mitigar os efeitos negativos dessa expansão, visando garantir a habitabilidade e a resiliência das cidades diante da crise climática (Habitability, 2022). O ambiente urbano atua simultaneamente como o principal emissor de gases de efeito estufa e como a zona mais vulnerável aos seus impactos deletérios, o que exige estratégias de monitoramento precisas e escaláveis.

Nesse cenário, o avanço das tecnologias de informação e comunicação permite que gestores públicos adotem posturas assertivas por meio de ferramentas de análise de grandes volumes de dados e modelos preditivos baseados em aprendizagem de máquina (ENAP, 2021). A análise de dados espaciais georreferenciados surge como um instrumento fundamental para caracterizar os atributos do espaço urbano e identificar regiões que demandam intervenções prioritárias (Druck, 2004). O sensoriamento remoto via satélite destaca-se como uma fonte de dados essencial, oferecendo cobertura de grandes extensões territoriais em uma única captura, com revisitas regulares e registros em múltiplas bandas espectrais, do visível ao térmico (Meneses, 2012).

A cidade de Curitiba, reconhecida historicamente por seu planejamento urbano, formalizou em 2020 o Plano Municipal de Mitigação e Adaptação às Mudanças Climáticas, o PlanClima. Este documento identifica as ondas de calor como uma ameaça climática significativa para os cenários de 2030, 2050 e 2100, apontando que a suscetibilidade de uma região é influenciada pela geomorfologia, temperatura de superfície e proximidade a maciços vegetados (Curitiba, 2020). Abordagens tradicionais de classificação do uso do solo frequentemente utilizam pesos arbitrários para estimar vulnerabilidades térmicas (ICare & Consult, 2020). Todavia, a aplicação de modelos de redes neurais não-supervisionadas, como os autoencoders, oferece uma alternativa robusta para segmentar o território sem a necessidade de rotulação manual prévia, eliminando potenciais vieses humanos e permitindo a automatização do processo de análise para capturas futuras.

O desenvolvimento metodológico para a caracterização térmica e morfológica de Curitiba fundamenta-se no processamento de imagens brutas da constelação Landsat 9, coletadas via portal do Observatório Geológico dos Estados Unidos. A cena selecionada, identificada pelo código LC09L1TP220078202407282024072802T1, foi registrada em 28 de julho de 2024, apresentando ausência total de nuvens sobre o território municipal. O sistema de referência de coordenadas adotado foi o EPSG:32622 – WGS 84 / UTM zone 22N. Complementarmente, utilizou-se um Modelo Digital de Elevação proveniente do Instituto Água e Terra do Paraná, representando a sub-bacia do Alto Iguaçu, o qual foi recortado conforme os limites territoriais fornecidos pelo Instituto Brasileiro de Geografia e Estatística e submetido a um processo de redução de resolução para compatibilização com os 30 metros dos pixels do satélite.

O cálculo da Temperatura de Superfície Terrestre exige um pré-processamento rigoroso da banda térmica 11 do Landsat 9. Inicialmente, converte-se o valor digital do pixel em radiância de topo de atmosfera, utilizando fatores multiplicativos e aditivos de reescala fornecidos nos metadados da imagem. Na sequência, a radiância é convertida em temperatura de brilho, expressa em Kelvin, por meio de constantes de conversão termal específicas. Para que a temperatura de brilho reflita a realidade da superfície, é necessário calcular a emissividade da superfície, processo que depende da proporção de vegetação derivada do Índice de Vegetação de Diferença Normalizada (Sobrino, 2004). A fórmula final da temperatura de superfície incorpora a constante de Planck, a velocidade da luz e a constante de Boltzmann, resultando em um mapeamento térmico detalhado da cidade.

Além da temperatura, o estudo emprega índices espectrais por diferença normalizada para caracterizar a cobertura do solo. O Índice de Vegetação de Diferença Normalizada utiliza as bandas do infravermelho próximo e do vermelho para indicar o vigor vegetativo. O Índice de Água de Diferença Normalizada utiliza as bandas verde e infravermelho próximo para identificar corpos hídricos e umidade. Já o Índice de Área Construída de Diferença Normalizada baseia-se nas bandas de infravermelho médio para destacar superfícies edificadas e solo exposto (Alexander, 2020). A combinação desses índices permite a criação de máscaras booleanas que segmentam feições de interesse, facilitando a interpretação visual da estrutura urbana consolidada e a distribuição de fragmentos vegetados ao longo do território municipal.

A arquitetura computacional para a classificação não-supervisionada baseia-se na integração de um autoencoder com o algoritmo k-means. O autoencoder é uma rede neural projetada para a extração de características e redução de dimensionalidade, composta por um encoder, que comprime os dados de entrada em um vetor latente, e um decoder, que tenta reconstruir a imagem original (Nagar et al., 2024). O processo operacional inicia-se com o empilhamento dos canais correspondentes à temperatura de superfície e aos índices de área construída, vegetação e água, gerando uma matriz tridimensional de dimensões 1102 por 688 por quatro. Os dados são normalizados pelo método Standard Scaler, garantindo que a média seja zero e o desvio padrão seja um, evitando que variáveis com escalas maiores dominem o aprendizado do modelo.

A etapa de encoding reduz a dimensionalidade dos dados através de duas camadas densas com 16 e oito neurônios, respectivamente, atingindo um gargalo de dimensão três. Este espaço latente contém as características essenciais da morfologia e do comportamento térmico da cidade. O treinamento do autoencoder ocorre ao longo de 25 épocas, buscando minimizar o erro quadrático médio entre a entrada e a reconstrução. Uma vez treinado, o vetor latente serve como entrada para o algoritmo k-means. A definição do número ideal de agrupamentos é realizada pelo método do cotovelo, que analisa a inércia dos clusters para diferentes valores de k. Embora o valor k igual a dois tenha sido identificado inicialmente, optou-se por uma segmentação com k igual a cinco para permitir uma gradação mais detalhada das zonas de vulnerabilidade térmica.

Os resultados demonstram que a inclusão inicial do Modelo Digital de Elevação como variável de entrada enviesou a clusterização, fazendo com que o modelo respondesse predominantemente à topografia e ao relevo hipsométrico da cidade. Ao remover essa camada, o autoencoder passou a capturar com precisão a morfologia urbana e as nuances térmicas independentes da altitude. A análise estatística descritiva dos cinco clusters gerados revela distinções claras: o agrupamento com maior temperatura média atingiu 19,23 °C, enquanto o agrupamento mais frio registrou média de 16,08 °C, evidenciando uma amplitude térmica de 3,14 °C entre as diferentes zonas da cidade no momento da captura.

O cluster identificado com o índice quatro apresenta a maior vulnerabilidade, concentrando-se em áreas com elevado grau de impermeabilização e densidade edilícia. Espacialmente, este grupo corresponde ao centro expandido de Curitiba e aos eixos estruturais de transporte, onde a substituição de superfícies naturais por materiais asfálticos e de concreto favorece a retenção de calor. Em contrapartida, os clusters com menores temperaturas médias estão localizados nas periferias e em áreas de proteção ambiental, como as regiões do Passaúna e do Iguaçu, além de grandes parques e unidades de conservação. A distribuição de frequência das temperaturas em cada cluster, visualizada por gráficos de densidade, confirma a separação estatística robusta entre os grupos mais quentes e os mais frios.

A comparação dos resultados com o mapa de zoneamento e a infraestrutura viária municipal revela que o modelo foi capaz de identificar padrões de uso do solo sem qualquer informação prévia sobre a legislação urbanística. Observa-se que áreas de menor densidade populacional, como o bairro do Umbará, apresentam comportamentos térmicos distintos do núcleo central. Regiões como Cajuru, Sítio Cercado e Tatuquara, que possuem alta concentração de moradias e menor cobertura vegetal, foram corretamente classificadas em clusters de maior temperatura. A baixa sobreposição entre os intervalos de confiança das médias dos clusters extremos, com desvios padrão variando entre 0,70 e 1,41, valida a eficácia da segmentação baseada em padrões físicos reais presentes nas imagens de satélite.

A discussão dos dados aponta que a ocupação urbana domina o território de Curitiba com um alto grau de espraiamento, o que contribui diretamente para o fenômeno das ilhas de calor. A predominância da matriz urbana sobre as áreas naturais é quantificada pela contagem de pixels, onde o cluster de maior temperatura isoladamente contém mais de 220000 unidades de pixel. Essa constatação é fundamental para o direcionamento de políticas públicas, sugerindo que intervenções como a arborização urbana e a criação de infraestruturas verdes devem ser priorizadas nas zonas identificadas pelo modelo como termicamente críticas. A capacidade do autoencoder em captar características complexas, como o nível de impermeabilização e a presença de umidade, em um processo computacional de baixo custo, torna-o uma ferramenta valiosa para o planejamento urbano sustentável.

As limitações do estudo residem na natureza estática da captura de satélite, que representa um recorte temporal específico. Todavia, a metodologia proposta é altamente escalável e automatizável, permitindo a calibração de estimativas futuras e o monitoramento contínuo das mudanças climáticas locais. A integração de dados físicos puramente derivados de sensoriamento remoto com algoritmos de aprendizagem não-supervisionada demonstra que é possível obter diagnósticos precisos da vulnerabilidade urbana sem a dependência de bases de dados rotuladas complexas. Isso democratiza o acesso a ferramentas de suporte à decisão para gestores de cidades com diferentes níveis de maturidade tecnológica.

O uso de redes neurais para a classificação de feições captadas por imagens de satélite supera as abordagens tradicionais de processamento manual, que são intensivas em mão de obra e sujeitas a erros de interpretação. O esforço de automatizar a extração de características por meio de modelos leves busca tornar o instrumental urbanístico mais acessível tanto para a esfera pública quanto para a privada. A análise integrada dos índices espectrais e da temperatura de superfície terrestre fornece uma visão holística dos desafios ambientais associados ao avanço urbano, incluindo o risco de intensificação de ondas de calor e a redução da infiltração hídrica no solo.

A aplicação prática deste modelo em Curitiba reforça a importância de basear o planejamento territorial em evidências empíricas e dados quantitativos. A identificação de gradientes de transição urbano-rural e a localização exata de setores críticos permitem que as estratégias de mitigação sejam aplicadas de forma cirúrgica, otimizando o uso de recursos públicos. O sensoriamento remoto, ao permitir o imageamento de grandes extensões com alta resolução, consolida-se como o principal instrumento para a tomada de decisão assertiva no contexto das cidades inteligentes, especialmente no Sul Global, onde a urbanização rápida muitas vezes precede o planejamento formal.

Conclui-se que o objetivo foi atingido, uma vez que o modelo de autoencoder associado ao k-means segmentou com precisão o território de Curitiba em zonas de vulnerabilidade térmica distintas, utilizando apenas dados físicos de sensoriamento remoto. A metodologia demonstrou que a impermeabilização do solo e a densidade urbana são os principais vetores para a formação de ilhas de calor na cidade, identificando uma diferença superior a 3 °C entre áreas densamente construídas e fragmentos vegetados. A ferramenta desenvolvida apresenta baixo custo computacional e alta capacidade de automação, oferecendo aos gestores urbanos um mecanismo eficaz para o monitoramento climático e para o direcionamento de políticas de mitigação ambiental, validando a eficácia da aprendizagem de máquina não-supervisionada na análise de fenômenos urbanos complexos.

Referências Bibliográficas:

ALEXANDER, C. (2020). Normalised difference spectral indices and urban land cover as indicators of land surface temperature (LST). International Journal of Applied Earth Observation and Geoinformation.
CURITIBA. (2020). Plano Municipal de Mitigação e Adaptação às Mudanças Climáticas (PlanClima). Curitiba.
DRUCK, S.; CARVALHO, M. S.; CÂMARA, G.; MONTEIRO, A. M. V. (2004). Análise Espacial de Dados Geográficos. Brasília, EMBRAPA.
ESCOLA NACIONAL DE ADMINISTRAÇÃO PÚBLICA [ENAP]. (2021). Cidades Inteligentes: Conceitos e Aplicações. EvEx.
HABITABILITY. (2022). O Que É Planejamento Urbano e a Sua Importância para Cidades do Futuro? Disponível em: <https://dub.sh/gcVNzkO>.
ICARE & CONSULT. (2020). Avaliação de Risco Climático da cidade de Curitiba – Relatório Final. Curitiba.
MENESES, P. R.; ALMEIDA, T. (orgs.). (2012). Introdução ao Processamento de Imagens de Sensoriamento Remoto. Brasília.
NAGAR, S.; FARAHBAKHSH, E.; AWANGE, J.; CHANDRA, R. (2024). Remote sensing framework for geological mapping via stacked autoencoders and clustering. Advances in Space Research.
SOBRINO, J. A.; JIMÉNEZ-MUÑOZ, J. C.; PAOLINI, L. P. (2004). Land surface temperature retrieval from LANDSAT TM 5. Remote Sensing of Environment.
UNITED NATION HUMAN SETTLEMENTS PROGRAMME [UN-HABITAT]. (2008). State of World Cities Report 2008/9.

Resumo executivo oriundo de Trabalho de Conclusão de Curso de Especialização em MBA em Data Science, Inteligência Artificial e Analytics

Saiba mais sobre o curso, clique aqui

Quem editou este artigo

Você também pode gostar

Quer ficar por dentro das nossas últimas publicações? Inscreva-se em nossa newsletter!

Receba conteúdos e fique sempre atualizado sobre as novidades em gestão, liderança e carreira com a Revista E&S.

Ao preencher o formulário você está ciente de que podemos enviar comunicações e conteúdos da Revista E&S. Confira nossa Política de Privacidade