11 de fevereiro de 2026
Comparação de modelos supervisionados para previsão de temperatura horária em Uberlândia
Raphael Yves Puntel; Miguel Ângelo Lellis Moreira
Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.
Esta pesquisa avalia e compara o desempenho de três modelos preditivos — Long Short-Term Memory (LSTM), Prophet e XGBoost Regressor — na estimativa da temperatura horária para a cidade de Uberlândia, Minas Gerais. Utilizando uma série temporal de dados meteorológicos do Instituto Nacional de Meteorologia (INMET) de 2014 a 2023, o estudo busca identificar a abordagem mais acurada para prever variações térmicas em um clima tropical com forte oscilação diária. A hipótese central é que o modelo LSTM, devido à sua arquitetura de rede neural recorrente projetada para capturar dependências temporais complexas, fornecerá precisão superior em relação às outras duas técnicas, que representam paradigmas de decomposição estatística e de aprendizado de máquina baseado em árvores de decisão.
A relevância de previsões climáticas precisas tem implicações diretas para múltiplos setores. Em ambientes urbanos, a antecipação da temperatura permite otimizar o consumo de energia, aprimorar serviços públicos e desenvolver políticas de saúde para mitigar os impactos de ondas de calor ou frio (Yu et al., 2021). No setor agrícola, importante para a economia de Uberlândia, a previsão de temperatura é uma ferramenta indispensável para o planejamento de plantio, gestão de irrigação e maximização da produtividade, minimizando perdas por eventos climáticos adversos (Sayeed & Rahman, 2020; Santos et al., 2021). A cidade de Uberlândia, localizada no Triângulo Mineiro, é caracterizada por um clima tropical de altitude com variações térmicas diárias significativas, tornando a previsão de temperatura uma ferramenta crítica de gestão de risco e otimização (Novais, Brito & Sanches, 2018).
Apesar da disponibilidade de dados, a aplicação de técnicas avançadas de modelagem preditiva em contextos regionais no Brasil ainda é um campo com potencial de exploração. Modelos estatísticos tradicionais, como o ARIMA, frequentemente falham com séries temporais que não atendem a pressupostos de estacionariedade, linearidade e normalidade dos resíduos, características comuns em dados climáticos, que são inerentemente ruidosos e não lineares (Islam et al., 2021). Em contrapartida, abordagens de aprendizado profundo e aprendizado de máquina oferecem maior flexibilidade para modelar padrões complexos. Estudos recentes demonstram que arquiteturas como LSTM e redes convolucionais capturam dependências temporais de longo e curto prazo com maior eficácia, superando modelos tradicionais em diversos cenários (Lara-Benítez et al., 2021).
Os três modelos foram escolhidos para abranger diferentes filosofias de modelagem. O LSTM representa o estado da arte em redes neurais recorrentes para dados sequenciais, projetado para aprender e memorizar padrões ao longo de extensos intervalos de tempo (BENIDIS et al., 2020). O Prophet, desenvolvido pelo Facebook, adota uma abordagem de decomposição estatística aditiva, separando a série em componentes de tendência, sazonalidade e feriados, o que o torna robusto para séries com fortes padrões cíclicos e resistente a dados faltantes (TAYLOR; LETHAM, 2017). O XGBoost Regressor, um algoritmo de gradient boosting, constrói um modelo como um conjunto de árvores de decisão fracas, sendo eficaz na captura de interações complexas e relações não lineares entre variáveis (CHEN; GUESTRIN, 2016).
A análise comparativa entre essas abordagens permite determinar o modelo mais acurado para a previsão de temperatura em Uberlândia e compreender as forças e fraquezas de cada metodologia diante das particularidades dos dados climáticos locais. Para complementar a análise quantitativa, o estudo desenvolveu um relatório interativo no Power BI. Esta ferramenta de visualização permite uma comparação dinâmica das previsões, facilitando a identificação de padrões de acerto e erro e tornando os resultados acessíveis a um público mais amplo, incluindo gestores e tomadores de decisão sem formação técnica em ciência de dados.
A metodologia foi estruturada em etapas sequenciais: aquisição e tratamento dos dados, seguido pela modelagem e avaliação comparativa. Os dados meteorológicos brutos do INMET, com registros horários de 1º de janeiro de 2014 a 31 de dezembro de 2023, além de dados de 2024 para validação, foram submetidos a um processo de Extração, Transformação e Carga (ETL) híbrido. No Power Query, a linguagem M foi usada para integrar tabelas anuais, substituir valores inválidos (-9999) por nulos, padronizar o formato decimal e converter tipos de dados. A conversão da hora UTC para horário local (00:00–23:00) também foi realizada nesta fase.
Em um ambiente Python, o tratamento foi aprofundado com a biblioteca Pandas. O tratamento de lacunas temporais, essencial para a continuidade da série, foi realizado com uma estratégia de preenchimento progressivo que combinou interpolação com médias móveis em janelas de 4 a 24 horas. Essa abordagem capturou tendências de curto prazo e padrões cíclicos, preenchendo dados faltantes de forma contextualizada. Após o tratamento, a base de dados final foi dividida em conjuntos de treino (70%) e teste (30%), utilizando a variável “TEMPERATURA DO AR – BULBO SECO (°C)” como alvo da previsão.
A avaliação do desempenho dos modelos foi quantitativa e qualitativa. As métricas estatísticas utilizadas foram o Erro Absoluto Médio (MAE), a Raiz do Erro Quadrático Médio (RMSE) e o Erro Percentual Absoluto Médio (MAPE), que oferecem diferentes perspectivas sobre os erros de previsão (Benidis et al., 2020). Além da avaliação no conjunto de teste completo, foi realizada uma análise focada na última semana da série (168 registros) e uma previsão para as 100 horas futuras, a partir de 1º de janeiro de 2024, para testar a capacidade de inferência dos modelos em dados novos. Os resultados foram consolidados em um painel interativo no Power BI para análise visual comparativa.
A análise exploratória da base de dados tratada revelou 87.648 registros horários contínuos. As temperaturas em Uberlândia, entre 2014 e 2023, variaram de 4,8°C a 38,2°C, com média de 23,59°C e desvio-padrão de 4,1°C, indicando considerável variabilidade térmica. O modelo Prophet capturou bem a sazonalidade anual e a tendência geral, mas sua abordagem de decomposição aditiva suavizou excessivamente as flutuações de curto prazo. Os gráficos de previsão mostraram que o Prophet tendia a subestimar os picos de temperatura diários e a superestimar os vales, comprometendo a precisão em previsões de curtíssimo prazo.
O modelo XGBoost Regressor apresentou desempenho superior ao do Prophet na captura de variações abruptas. Como um método baseado em árvores que aprende com os erros residuais, ele acompanhou as mudanças súbitas de temperatura com maior fidelidade. A análise visual da série prevista pelo XGBoost mostrou um alinhamento mais próximo aos valores reais, especialmente durante transições rápidas. Contudo, ainda foram observadas pequenas divergências nos pontos de temperatura mais extremos, sugerindo limitações para modelar perfeitamente eventos anormais. Sua performance reflete a eficácia de modelos de boosting em cenários de previsão climática, como observado por (Zhou et al., 2023).
O modelo Long Short-Term Memory (LSTM) destacou-se com o desempenho mais acurado. A análise gráfica de sua previsão revelou uma sobreposição quase perfeita com a série de temperatura real, tanto no conjunto de teste quanto na análise da última semana. A arquitetura da LSTM, com suas células de memória e portões de controle, permitiu ao modelo aprender e reter informações sobre dependências temporais de longo prazo, como padrões sazonais, ao mesmo tempo em que se adaptava com precisão às oscilações horárias. Essa capacidade de modelar relações não lineares e padrões cíclicos em múltiplas escalas de tempo foi o fator determinante para sua superioridade, corroborando achados de outros estudos em meteorologia (Oreshkin et al., 2020; Elabd et al., 2025).
A comparação quantitativa no conjunto de teste completo confirmou a superioridade do LSTM. O modelo alcançou um MAE de 0,79°C, um RMSE de 1,05°C e um MAPE de 3,67%. Em comparação, o XGBoost Regressor obteve 0,91°C (MAE), 1,22°C (RMSE) e 4,12% (MAPE), enquanto o Prophet registrou o desempenho mais modesto, com 1,23°C (MAE), 1,62°C (RMSE) e 6,01% (MAPE). Esses resultados indicam que o erro de previsão do LSTM foi significativamente menor. A baixa porcentagem de erro do LSTM (MAPE < 4%) evidencia um alto grau de confiabilidade para aplicações operacionais.
Para validar a aplicabilidade prática, um teste de inferência previu a temperatura para as primeiras sete horas de 1º de janeiro de 2024, um período fora do treinamento. Novamente, o LSTM demonstrou o melhor desempenho, com as menores diferenças absolutas em relação aos valores reais. Na primeira hora do dia (00h UTC), a diferença entre a previsão do LSTM e a temperatura real foi de apenas 0,03°C, enquanto o Prophet e o XGBoost registraram diferenças de 1,65°C e 0,04°C, respectivamente. Este teste reforçou a robustez e a capacidade de generalização do modelo LSTM.
A consolidação dos resultados no painel interativo do Power BI agregou valor ao estudo. A ferramenta permitiu a exploração dinâmica dos dados, com filtros por período e comparações lado a lado das curvas de previsão contra os valores reais. Essa camada de visualização transformou os resultados numéricos em insights acionáveis, facilitando a interpretação por diferentes públicos e destacando a superioridade do modelo LSTM em diversos cenários.
A principal contribuição desta pesquisa é a demonstração empírica de que um tratamento de dados rigoroso, com ferramentas como Power Query e Python, combinado com modelos avançados como o LSTM, pode gerar previsões de temperatura horária com alta precisão. O estudo confirmou a hipótese inicial de que a arquitetura LSTM superaria as abordagens de decomposição estatística (Prophet) e de boosting (XGBoost) em todas as métricas. O modelo capturou com fidelidade tanto as variações de curto prazo quanto os padrões sazonais, mostrando-se eficaz na previsão de mudanças abruptas de temperatura.
O estudo possui limitações que indicam direções para pesquisas futuras. A análise foi univariada, focando apenas na temperatura. A incorporação de variáveis exógenas, como umidade, radiação solar e velocidade do vento, em modelos multivariados poderia aumentar a acurácia. As previsões foram limitadas a horizontes de curto prazo devido a restrições computacionais, e a análise concentrou-se em uma única localidade, demandando validação em outros contextos climáticos. Trabalhos futuros poderiam explorar arquiteturas mais avançadas, como Transformers, ou modelos híbridos que combinem as forças de diferentes abordagens.
A investigação sobre a previsão de temperatura em Uberlândia revelou que, embora modelos como Prophet e XGBoost Regressor ofereçam resultados relevantes, a abordagem baseada em Long Short-Term Memory (LSTM) se estabelece como a técnica mais robusta e precisa para lidar com a complexidade dos dados climáticos horários. A capacidade do LSTM de aprender padrões temporais complexos o torna uma ferramenta poderosa para aplicações em meteorologia, agricultura e gestão de energia. Conclui-se que o objetivo foi atingido: demonstrou-se que o modelo Long Short-Term Memory (LSTM) apresenta acurácia superior na previsão de temperatura horária para Uberlândia em comparação com os modelos Prophet e XGBoost Regressor, validando a hipótese central da pesquisa.
Referências:
BENIDIS, K. et al. Neural forecasting: Introduction and literature overview. International Journal of Forecasting, v. 36, n. 1, p. 154–180, 2020.
BIANCHI, F. M.; LIVI, L.; ALIPPI, C. A comparative evaluation of LSTM networks and Echo State Networks on multivariate time series forecasting. Neurocomputing, v. 409, p. 340–350, 2021.
CHEN, T.; GUESTRIN, C. XGBoost: A scalable tree boosting system. In: Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. San Francisco: ACM, 2016. p. 785–794.
ELABD, S. et al. A novel hybrid deep learning model for long-term weather forecasting. IEEE Access, v. 13, p. 1-1, 2025.
INMET. Dados históricos anuais. Disponível em: <https://portal. inmet. gov. br/dadoshistoricos>. Acesso em: 10 jun. 2025.
ISLAM, A. R. M. T.; HASAN, M. M.; RAHMAN, M. A.; RAHMAN, M. M. Spatiotemporal trends in temperature and rainfall extremes in Bangladesh: an indicator-based approach using the Mann–Kendall test. Theoretical and Applied Climatology, v. 143, p. 785–802, 2021.
LARA-BENÍTEZ, P.; CARRANZA-GARCÍA, M.; RIQUELME, J. C. An experimental review on deep learning architectures for time series forecasting. International Journal of Neural Systems, v. 31, n. 3, p. 2130001, 2021.
NOVAIS, A. R.; BRITO, L. T.; SANCHES, L. Avaliação das relações entre intensidade, duração e frequência das precipitações máximas de 24 horas e equação de chuvas intensas para a cidade de Uberlândia-MG. Revista Brasileira de Climatologia, v. 24, p. 1-15, 2018.
ORESHKIN, B. N.; CARPOV, D.; CHAPADOS, N.; BENGIO, Y. N-BEATS: neural basis expansion analysis for interpretable time series forecasting. In: International Conference on Learning Representations (ICLR), 2020.
SANTOS, C. A. G.; SILVA, R. M.; OLIVEIRA, C. P.; LIMA, A. M. V. Precipitation and temperature extremes in Brazil: spatiotemporal trends and impacts. Theoretical and Applied Climatology, v. 143, p. 1059–1074, 2021.
SAYEED, A.; RAHMAN, M. M. Comparison of forecasting models for temperature and humidity: a case study in Dhaka, Bangladesh. SN Applied Sciences, v. 2, n. 2, 2020.
SILVA, J. P.; OLIVEIRA, M. R.; CARVALHO, L. C. Machine learning approaches for monthly temperature prediction in Brazilian capitals. arXiv preprint, arXiv:2505.11511, 2025.
TAYLOR, S. J.; LETHAM, B. Forecasting at scale. The American Statistician, v. 72, n. 1, p. 37–45, 2017.
YU, Y. et al. A survey on deep learning for smart city. Geo-spatial Information Science, v. 24, n. 3, p. 431-456, 2021.
ZHOU, X.; LI, C.; WANG, Y.; ZHANG, T. Comparison of average temperature prediction based on XGBoost and Prophet models. Energies, v. 16, n. 2, p. 227, 2023.
Resumo executivo oriundo de Trabalho de Conclusão de Curso de Especialização em Data Science e Analytics do MBA USP/Esalq
Saiba mais sobre o curso; clique aqui:




























