Imagem Modelo de aprendizado de máquina para a relação entre clima, poluição e doenças respiratórias

23 de fevereiro de 2026

Modelo de aprendizado de máquina para a relação entre clima, poluição e doenças respiratórias

Lucas Adriano Salles Silva; Huga Géssica Bento de Oliveira

Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.

Este estudo objetivou quantificar a relação entre internações mensais por doenças respiratórias em crianças de até 9 anos em Manaus, Amazonas, e variáveis ambientais (precipitação, temperatura, umidade e PM2.5) de janeiro de 2008 a dezembro de 2024. As doenças respiratórias, definidas como um conjunto de patologias que afetam as vias aéreas superiores e inferiores (OMS, 2025), constituem um dos maiores desafios para a saúde pública em escala global, com um impacto desproporcional sobre as populações mais vulneráveis, especialmente as crianças. Este grupo de doenças engloba um espectro amplo de condições, desde quadros leves e autolimitados, como resfriados comuns, até condições graves e potencialmente fatais, como pneumonia, bronquiolite e tuberculose (Figueiredo, 2009).

A classificação clínica as divide em infecções das vias respiratórias superiores (IVRS), que são mais frequentes e geralmente menos severas, e infecções das vias respiratórias inferiores (IVRI), como a gripe, a Covid-19, a pneumonia e a bronquiolite, que são as principais causas de hospitalização e mortalidade na população pediátrica (Silva-Filho et al., 2017). Segundo a Secretaria de Estado de Saúde (SES-AM, 2023), as internações por doenças respiratórias representaram 11,22% do total de hospitalizações, consolidando-se como a segunda principal causa de internação na rede pública. Uma análise da série histórica recente, entre 2019 e 2023, revela uma tendência preocupante: enquanto as internações por causas obstétricas, por exemplo, apresentaram uma redução, as hospitalizações por doenças respiratórias registraram um aumento expressivo de 14,91% em 2023 em comparação com o ano anterior.

Em Rio Branco, no estado do Acre, uma região também impactada por queimadas, demonstrou-se uma correlação positiva e estatisticamente significativa entre as concentrações de PM2.5 e o número de atendimentos de emergência por asma em crianças (Mascarenhas et al., 2008). No estado da Paraíba, um estudo utilizando um modelo de regressão linear múltipla confirmou que as variáveis de precipitação, temperatura e umidade foram preditores significativos para a incidência de infecções respiratórias agudas na população infantil (Azevedo et al., 2015). Em Santa Maria, no Rio Grande do Sul, um estudo sobre internações hospitalares concluiu que um modelo de regressão binomial negativo se ajustou melhor aos dados de contagem, reforçando a importância de se monitorar continuamente os fatores ambientais para subsidiar políticas públicas de saúde mais eficazes e proativas (Savian, 2020; Sacramento, 2020).

Este trabalho se caracteriza como uma pesquisa quantitativa, de delineamento ecológico e analítico (Koizumi, 1992), utilizando uma abordagem de série temporal para investigar a associação entre exposições ambientais e desfechos de saúde. A cidade, com uma população estimada em mais de 2 milhões de habitantes, representa um cenário epidemiológico complexo; desafios de uma metrópole em rápido crescimento se sobrepõem às particularidades do ambiente amazônico. Indicadores sociais, como a cobertura de saneamento adequado de apenas 49,19% e a urbanização adequada em somente 26,3% dos lares (IBGE, 2023), são fatores contextuais relevantes que podem modular a vulnerabilidade da população à dinâmica de saúde-doença. A metodologia para a coleta de dados foi estruturada em três fontes primárias. Os registros mensais de internações, que constituem a variável dependente do estudo, foram extraídos do Sistema de Informações Hospitalares do Sistema Único de Saúde (SIH/SUS), disponível publicamente na plataforma DATASUS.

Foram selecionadas todas as internações de crianças de 0 a 9 anos, residentes em Manaus, cujo diagnóstico principal se enquadrava no capítulo X da Classificação Internacional de Doenças (CID-10), referente a “Doenças do Aparelho Respiratório” (códigos J00-J99), no período de janeiro de 2008 a dezembro de 2024. Os dados climáticos, incluindo precipitação total mensal (mm), temperatura média mensal (°C) e umidade relativa do ar média mensal (%), foram obtidos junto ao Instituto Nacional de Meteorologia (INMET), a partir da estação meteorológica de Manaus. O tratamento inicial destes conjuntos de dados foi realizado em ambiente de programação Python, utilizando principalmente a biblioteca Pandas (McKinney, 2010; Van Rossum & Drake, 2009).

Este processo incluiu a limpeza dos dados, o tratamento de valores ausentes ou inválidos (seguindo as recomendações da documentação técnica do INMET, 2024) e a agregação dos dados diários em médias ou somas mensais, para garantir a compatibilidade temporal com os dados de internação. Dada a escassa cobertura de monitoramento de qualidade do ar em nível de superfície na região amazônica, os dados de poluição atmosférica, especificamente as concentrações de material particulado fino (PM2.5), foram obtidos por meio de uma abordagem de reanálise. Utilizou-se o conjunto de dados CAMS global reanalysis (EAC4), fornecido pelo Copernicus Atmosphere Monitoring Service (CAMS). Esta metodologia, que combina dados de satélite com modelos de transporte químico, é alinhada às recomendações do Ministério da Saúde do Brasil para estudos em áreas sem monitoramento terrestre (Ministério da Saúde, 2023) e é amplamente validada na literatura científica.

Foram extraídos os dados para as coordenadas geográficas de Manaus para todo o período do estudo (2008-2024), que foram subsequentemente agregados em médias mensais. Os arquivos originais, em formato NetCDF (AGRIMETSOFT, 2023), foram processados com o software Panoply (NASA EARTHDATA, 2025) para extrair as séries temporais de interesse. Um passo crucial no pré-processamento foi a conversão da unidade original de massa específica (kg/m³) para a unidade padrão utilizada pela Organização Mundial da Saúde (OMS, 2021) para qualidade do ar, microgramas por metro cúbico (µg/m³), realizada através da multiplicação dos valores por um fator de 10^9.

A análise estatística foi conduzida em etapas sequenciais. A primeira fase consistiu em uma Análise Exploratória de Dados (EDA), conforme proposto por Tukey (1977), que envolveu o cálculo de estatísticas descritivas (média, mediana, desvio padrão, mínimo, máximo) e a elaboração de gráficos, como séries temporais e boxplots mensais, para visualizar tendências, sazonalidades e a distribuição de cada variável. Em seguida, para avaliar a associação bivariada entre as variáveis ambientais e o número de internações, foi utilizado o coeficiente de correlação de Spearman. Esta escolha se justifica por ser um método não-paramétrico, adequado para dados que não seguem uma distribuição normal e para avaliar relações monotônicas, não necessariamente lineares (Pontes, 2010). Na etapa de modelagem inferencial, um passo preliminar foi a verificação de multicolinearidade entre as variáveis preditoras, utilizando o teste do Fator de Inflação da Variância (VIF).

Este teste indicou uma forte correlação entre PM2.5 e PM10, resultando na exclusão da variável PM10 do modelo final para evitar instabilidade nos coeficientes de regressão (Fávero, 2015). Considerando que a variável dependente (número de internações) é uma variável de contagem, foram testados dois modelos de regressão apropriados: o modelo de Poisson e o modelo Binomial Negativo. Um teste formal de superdispersão (Cameron, 1990), que avalia se a variância dos dados é significativamente maior que a média, indicou a presença de superdispersão. Este resultado confirmou a superioridade do modelo Binomial Negativo, que é mais flexível por incluir um parâmetro para acomodar essa variabilidade extra, sendo, portanto, o modelo escolhido para a análise final (Savian, 2020).

A análise do período de 17 anos, compreendendo 204 meses, registrou um total de 113.902 internações de crianças de 0 a 9 anos por doenças respiratórias em Manaus. Este número representa 64,46% de todas as internações por causas respiratórias na cidade, em todas as faixas etárias, destacando o enorme fardo que essas doenças impõem à população pediátrica. As estatísticas descritivas das variáveis ambientais revelaram uma baixa variabilidade para a temperatura média e a umidade relativa do ar, que se mantiveram relativamente constantes ao longo do ano, como é característico do clima equatorial. Em contraste, a precipitação apresentou uma altíssima variabilidade, com meses de seca extrema e outros de chuvas torrenciais, refletindo o bem definido regime pluviométrico amazônico (Vieira, 2020). A média mensal de internações foi de 558 casos, com um desvio padrão considerável, indicando grande flutuação mensal.

O pico de internações foi observado em maio de 2011, com 1.317 casos, enquanto um mínimo atípico de apenas 57 casos foi registrado em maio de 2020, um valor que possivelmente reflete o impacto das medidas de distanciamento social e o sub-registro durante a fase inicial da pandemia de COVID-19 (Orellana, 2020).

A análise visual da série temporal de internações confirmou a existência de um padrão sazonal extremamente marcante e regular. Este padrão coincide perfeitamente com o período conhecido regionalmente como “Inverno Amazônico”. Este achado robusto sugere que, no contexto de Manaus, a alta pluviosidade e a umidade elevada são os gatilhos ambientais dominantes para a morbidade hospitalar respiratória infantil, um comportamento distinto do observado em muitas regiões de clima temperado; o frio é o principal fator. Um dos resultados mais contraintuitivos e significativos do estudo foi a clara dissociação temporal entre os picos de poluição atmosférica e os picos de hospitalizações. As concentrações de PM2.5 atingem seus níveis mais elevados entre os meses de agosto e outubro, durante o “Verão Amazônico”, a estação seca.

Este período é caracterizado pela ocorrência de intensas queimadas florestais na região, que lançam grandes quantidades de fumaça na atmosfera, frequentemente cobrindo a cidade de Manaus (Marengo, 2018).

Paradoxalmente, é justamente nesses meses de maior poluição do ar que as internações infantis por doenças respiratórias atingem os seus níveis mais baixos de todo o ano, com medianas frequentemente inferiores a 300 casos mensais. Essa relação inversa foi confirmada estatisticamente pela análise de correlação de Spearman, que mostrou uma correlação negativa e estatisticamente significativa entre o número de internações e as concentrações de PM2.5 (r = -0,270; p < 0,001) e de PM10 (r = -0,271; p < 0,001). As demais variáveis climáticas (temperatura, umidade, precipitação), quando analisadas isoladamente na correlação bivariada, não apresentaram uma correlação estatisticamente significativa.

Este conjunto de achados sugere fortemente que, para o desfecho de hospitalização aguda em crianças, os agentes infecciosos virais que circulam predominantemente na estação chuvosa são um fator determinante muito mais forte do que a exposição à fumaça das queimadas na estação seca, um resultado que corrobora achados de estudos anteriores na região (Santos, 2023). O Modelo de Regressão Binomial Negativa, aplicado para analisar o efeito conjunto das variáveis, confirmou os achados da análise bivariada. O PM2.5 foi a única variável preditora que apresentou um efeito estatisticamente significante sobre o número de internações (p < 0,001). No entanto, o coeficiente associado a esta variável foi negativo (-0.0154), reiterando matematicamente a associação inversa: um aumento na concentração de PM2.5 está associado a uma pequena, mas estatisticamente significativa, diminuição no número de internações.

Este resultado, embora pareça paradoxal, provavelmente reflete a forte sazonalidade oposta entre a poluição por queimadas (pico na seca) e a circulação de vírus respiratórios sazonais (pico nas chuvas). O achado mais crítico e revelador do modelo, contudo, foi o valor do Pseudo R², que foi de apenas 0,006. Este valor, que pode ser interpretado de forma análoga ao R² em regressões lineares, indica que o conjunto de variáveis ambientais incluídas no modelo (precipitação, temperatura, umidade e PM2.5) explica menos de 1% (especificamente, 0,6%) da variabilidade total observada nas internações mensais. Esta baixa capacidade explicativa do modelo não deve ser vista como uma falha, mas sim como um resultado fundamental da pesquisa. Ele demonstra que, embora existam padrões sazonais claros e correlações estatísticas, as variáveis ambientais macroclimáticas e de poluição, por si sós, são insuficientes para prever a magnitude das flutuações nas hospitalizações pediátricas.

A vasta maioria da variação (mais de 99%) é provavelmente determinada por outros fatores não mensurados neste estudo. Entre eles, destacam-se a dinâmica de circulação de agentes etiológicos específicos (como surtos de VSR ou Influenza), a cobertura vacinal da população infantil, as condições socioeconômicas das famílias, a qualidade do ar no interior das residências e o acesso e a procura por serviços de saúde.

Conclui-se que o objetivo foi atingido, pois o estudo quantificou a relação e demonstrou que, apesar da forte sazonalidade coincidente com o regime de chuvas, o poder preditivo direto das variáveis ambientais testadas é muito limitado, apontando para a necessidade de investigações futuras que integrem dados de vigilância virológica e fatores socioeconômicos para uma compreensão mais completa do fenômeno.

Referências:
AGRIMETSOFT. What is an NC file (NetCDF). Disponível em: https://agrimetsoft. com/faq/What%20is%20an%20NC%20file%20%28NetCDF%29. Acesso em: 10 jun. 2025
AZEVEDO, J. V. V. de; SANTOS, C. A. C. dos; ALVES, T. L. B.; AZEVEDO, P. V. de; OLINDA, R. A. de. 2015. Influência do clima na incidência de infecção respiratória aguda em crianças nos municípios de Campina Grande e Monteiro, Paraíba, Brasil. Revista Brasileira de Meteorologia, 30(4), 467–477.
BRASIL. Ministério da Saúde. Secretaria de Vigilância em Saúde e Ambiente. Vigilância em Saúde Ambiental na Perspectiva da Agenda 2030. Boletim Epidemiológico, número especial, Brasília: Ministério da Saúde, jun. 2023. Disponível em: https://www. gov. br/saude/pt-br/composicao/svsa. Acesso em: 9 jun. 2025.
CAMERON, A. C.; TRIVEDI, P. K. Regression analysis of count data. 2nd ed. New York: Cambridge University Press, 2013. 411 p.
FÁVERO, L. P. (2015). Análise de dados: modelos de regressão com Excel, Stata e SPSS. Rio de Janeiro: Elsevier.
FIGUEIREDO, L. T. M. 2009. Pneumonias virais: aspectos epidemiológicos, clínicos, fisiopatológicos e tratamento. Jornal Brasileiro de Pneumologia, 35(9), 899–906.
INSTITUTO BRASILEIRO DE GEOGRAFIA E ESTATÍSTICA (IBGE). Amazonas: Manaus: Disponível em: https://cidades. ibge. gov. br/brasil/am/manaus/pesquisa/38/47001. Acesso em: 22 dez. 2025.
INSTITUTO NACIONAL DE METEOROLOGIA (INMET). Saiba como acessar os dados meteorológicos disponíveis no site do Inmet. Publicado em 26 jun. 2024; última modificação em 27 jun. 2024. Disponível em: https://portal. inmet. gov. br/noticias/saiba-como-acessar-os-dados-meteorológicos-disponíveis-no-site-do-inmet. Acesso em: 10 jun. 2025
KOISUMI, M. S. Fundamentos Metodológicos para a pesquisa em enfermagem. Ver Esc Enferm USP. v.26, n. especial, p. 33-47, 1992.
MARENGO, José A.; SOUZA JR., Carlos. Mudanças Climáticas: impactos e cenários para a Amazônia. São Paulo, dezembro de 2018.
MASCARENHAS, M. D. M.; Vieira, L. C.; Lanzieri, T. M.; Leal, A. P. P. R.; Duarte, A. F.; Hatch, D. L. 2008. Poluição atmosférica devida à queima de biomassa florestal e atendimentos de emergência por doença respiratória em Rio Branco, Brasil – setembro, 2005. J. Bras. Pneumol. 34(1): 42-46.
MCKINNEY, W. Data Structures for Statistical Computing in Python. In: Proceedings of the 9th Python in Science Conference, 2010.
NASA EARTHDATA. Panoply. Disponível em: https://www. earthdata. nasa. gov/data/tools/panoply. Acesso em: 10 jun. 2025.
OLIVEIRA, J. C. F.; Biometeorologia: Estudo de casos em Maceió, Alagoas. Maceió, Edufal, 2005.
ORELLANA, Jesem Douglas Yamall et al. 2020. Explosão da mortalidade no epicentro amazônico da epidemia de COVID-19. Cadernos de Saúde Pública [online]. v. 36, n. 7
ORGANIZAÇÃO MUNDIAL DE SAÚDE – OMS. 2025. Respiratory tract diseases. Disponível em: https://www. emro. who. int/health-topics/respiratory-tract-diseases/index. html. Acesso em: 16 mar. 2025.
ORGANIZAÇÃO PAN-AMERICANA DA SAÚDE (OPAS). Perguntas e respostas: revisão da Classificação Internacional de Doenças (CID). Disponível em: https://www. paho. org/pt/noticias/8-1-2018-perguntas-e-respostas-revisao-da-classificacao-internacionaldoencascid#:~:text=Atualmente%2C%20est%C3%A1%20em%20vigor%20a,43%C2%AA%20Assembleia%20Mundial%20da%20Sa%C3%BAde. Acesso em: 09 jun. 2025.
PONTES, Antonio Carlos Fonseca. Ensino da Correlação de Postos no Ensino Médio. In: 19o. Simpósio Nacional de Probabilidade e Estatística, 2010, Estância De São Pedro – SP. ANAIS DO 19o. SINAPE, 2010.
SACRAMENTO, Daniel S., Martins, Lourdes C., Arbex, Marcos A., Pamplona, Ysabely de A. P., Atmospheric Pollution and Hospitalization for Cardiovascular and Respiratory Diseases in the City of Manaus from 2008 to 2012, The Scientific World Journal, 2020, 8458359, 8 pages, 2020.
SAVIAN, M. C. B.; JACOBI, L. F.; ZANINI, R. R. Relationship between the number of hospitalizations due to respiratory diseases and climate variables in Santa Maria, RS. Ciência e Natura, [S. l.], v. 42, p. e53, 2020. DOI: 10.5902/2179460X40274. Disponível em: https://periodicos. ufsm. br/cienciaenatura/article/view/40274. Acesso em: 8 jun. 2025.
SECRETARIA DE ESTADO DE SAÚDE DO AMAZONAS. 2024. Relatório Anual de Gestão 2023. Manaus: SES-AM. Disponível em: https://www. saude. am. gov. br/wp-content/uploads/2024/09/ATUALIZADO-11-09-2024-RAG-2023-SES-AM. pdf. Acesso em: 16 mar. 2025.
SILVA Filho, E. B. da et al. 2017. Infecções respiratórias de importância clínica: uma revisão sistemática. Revista FIMCA, 4(1), 7-16.
TROMP, S. W. Biometeorology – the impact of the weather and climate on Human and their environment (animals and plants). Editor L. C. Thomas, Heyden & Son Ltd. 1980.
TUKEY, John W. Exploratory Data Analysis. Reading (MA): Addison‑Wesley, 1977. 688 p. (Addison-Wesley series in behavioral science).
VAN ROSSUM, G.; DRAKE, F. L. Python 3 Reference Manual. Scotts Valley, CA: CreateSpace, 2009.
VIEIRA, A. F. S. G., & D’avila Junior, J. C. M. (2020). PADRÕES PLUVIOMÉTRICOS DA CIDADE DE MANAUS-AM: 1986 A 2015. Boletim Paulista De Geografia, 1(102), 1–31. Recuperado de https://publicacoes. agb. org. br/boletim-paulista/article/view/1508
WORLD HEALTH ORGANIZATION. (2021). Air quality guidelines: global update 2021. https://www. who. int/publications/i/item/97892
WORLD HEALTH ORGANIZATION. (2024). Ambient (outdoor) air pollution. Disponível em https://www. who. int/news-room/fact-sheets/detail/ambient-(outdoor)-air-quality-and-health


Resumo executivo oriundo de Trabalho de Conclusão de Curso de Especialização em Data Science e Analytics do MBA USP/Esalq

Saiba mais sobre o curso; clique aqui:

Quem editou este artigo

Você também pode gostar

Quer ficar por dentro das nossas últimas publicações? Inscreva-se em nossa newsletter!

Receba conteúdos e fique sempre atualizado sobre as novidades em gestão, liderança e carreira com a Revista E&S.

Ao preencher o formulário você está ciente de que podemos enviar comunicações e conteúdos da Revista E&S. Confira nossa Política de Privacidade