
30 de janeiro de 2026
Predição de atrasos de voos no Brasil com base em variáveis meteorológicas
Bruno Fonseca Taufner; Ricardo Franceli da Silva
Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.
Este trabalho analisou e previu o atraso de partidas em aeroportos brasileiros a partir de variáveis meteorológicas (METAR), empregando modelos de aprendizado de máquina para estimar a magnitude dos atrasos e interpretar a influência dos fatores climáticos. A investigação desenvolveu um sistema preditivo para quantificar o tempo de atraso de voos com base em condições atmosféricas, visando otimizar operações aéreas, a gestão aeroportuária e a experiência do passageiro. A pesquisa avaliou a capacidade de algoritmos de regressão baseados em árvores de decisão para capturar a relação entre clima e pontualidade, identificando o potencial e as limitações de uma abordagem focada exclusivamente em dados meteorológicos.
O transporte aéreo é um pilar da economia globalizada, indispensável para a mobilidade e o transporte de cargas. Conforme destacam Silva e Parra (2008), a aviação civil está ligada ao desenvolvimento econômico e tecnológico, catalisando a conectividade. No Brasil, a pontualidade é um desafio constante. Um estudo de Oliveira et al. (2021) com mais de 690 mil voos domésticos revelou que 15,1% apresentaram atrasos de chegada superiores a 15 minutos. O mesmo estudo demonstrou, via modelagem estatística, que variáveis como visibilidade reduzida, teto de nuvens baixo, precipitação e rajadas de vento aumentam expressivamente a probabilidade de atrasos.
Os impactos dos atrasos aéreos são multifacetados. De acordo com Britto, Dresner e Voltes (2012), os atrasos influenciam a demanda dos passageiros e elevam os custos operacionais das companhias, resultando em tarifas mais altas e redução do bem-estar do consumidor. Para as operadoras, geram despesas com remarcações, realocação de tripulações e compensações. Para os viajantes, a incerteza e a perda de tempo geram estresse e insatisfação, incentivando a busca por companhias com melhor histórico de pontualidade.
A mitigação dos atrasos representa um ganho sistêmico. Zou e Hansen (2014) argumentam que sua redução pode gerar benefícios bilionários anuais em economia tarifária, melhorando a saúde financeira das companhias e a acessibilidade ao transporte aéreo. Embora múltiplos fatores contribuam para os atrasos, as condições meteorológicas são uma causa primária. Um estudo de Wang et al. (2022) aponta que 47,46% dos atrasos analisados estavam relacionados a fatores climáticos adversos. No Brasil, a diversidade climática acentua essa complexidade, impactando as operações de pouso e decolagem.
Nesse contexto, modelos preditivos que estimam o tempo de atraso com base em variáveis meteorológicas oferecem benefícios tangíveis. A antecipação permite que companhias aéreas ajustem operações e reduzam custos (Zoutendijk; Mitici, 2021). Para gestores de aeroportos, a previsão apoia o gerenciamento da malha aérea e a alocação de recursos, minimizando gargalos e elevando a segurança (Oliveira et al., 2021). Passageiros se beneficiam de maior previsibilidade, o que melhora a experiência de viagem (Britto; Dresner; Voltes, 2012; Hatıpoğlu; Tosun, 2024). Estrategicamente, tais modelos podem subsidiar políticas públicas de infraestrutura e mitigação de riscos.
A metodologia deste trabalho foi estruturada para uma análise quantitativa, envolvendo coleta, integração e modelagem de grandes volumes de dados. Um desafio central foi o alinhamento espacial e cronológico dos dados do Voo Regular Ativo (VRA) da ANAC com as observações meteorológicas do Iowa Environmental Mesonet (IEM). O ambiente computacional foi desenvolvido em Python, utilizando bibliotecas como pandas, matplotlib, seaborn, scikit-learn e XGBoost.
Os dados operacionais foram extraídos da base VRA da ANAC, com mais de 15 milhões de registros de voos entre janeiro de 2010 e dezembro de 2024, focando em partidas do Brasil. Os dados meteorológicos (METAR) do IEM continham observações de superfície como temperatura, umidade e vento. A integração usou o código ICAO dos aeroportos como chave. Para a modelagem, foram empregados os algoritmos RandomForestRegressor e XGBoostRegressor, reconhecidos por sua robustez (Breiman, 2001; Géron, 2019). A avaliação foi conduzida com validação cruzada e métricas como Erro Médio Absoluto (MAE), Raiz do Erro Quadrático Médio (RMSE) e Coeficiente de Determinação (R²).
O tratamento dos dados de voos envolveu a consolidação cronológica dos arquivos da ANAC e a remoção de variáveis irrelevantes. Um identificador único (ID Voo) foi criado para remover duplicidades. A análise exploratória revelou um pico anômalo de atrasos em 1.440 minutos (24 horas), mitigado com o estabelecimento de um limite máximo de 1.320 minutos (22 horas). Foram criadas variáveis derivadas da data do voo para capturar padrões de sazonalidade, uma prática recomendada para enriquecer os preditores (Sternberg et al., 2016; Li e Jing, 2022).
O pré-processamento dos dados meteorológicos incluiu a exclusão de variáveis com mais de 10% de valores ausentes. As variáveis remanescentes, com menos de 2,5% de ausência, tiveram as linhas com dados faltantes removidas. A integração das bases foi feita convertendo os horários para uma granularidade horária. Para capturar a influência de condições antecedentes, foram criadas janelas de observação de até oito horas antes da decolagem. A modelagem foi conduzida com os algoritmos Random Forest Regressor (RFR) e XGBoost Regressor (XGBR), com hiperparâmetros otimizados. A interpretabilidade foi avaliada com a metodologia SHAP (SHapley Additive exPlanations) (Hatıpoğlu; Tosun, 2024).
A avaliação geral dos modelos revelou um desempenho preditivo robusto e semelhante entre o RFR e o XGBR. Ambos alcançaram um Coeficiente de Determinação (R²) médio superior a 0,90, indicando que mais de 90% da variabilidade nos atrasos foi explicada pelas variáveis. O MAE ficou em torno de 12 minutos, e o RMSE, próximo de 30 minutos. Esses resultados são expressivos, pois atrasos superiores a 15 ou 30 minutos são considerados críticos (Sternberg et al., 2016; Tavares, 2021). Um RMSE de 30 minutos situa-se em uma faixa de magnitude relevante.
A análise da distribuição dos resíduos mostrou que os erros estavam concentrados em torno de zero, compatível com um bom ajuste geral (Kuhn e Johnson, 2013). No entanto, a distribuição apresentou uma cauda longa, com erros extremos superando 1.200 minutos, refletindo atrasos severos e pouco frequentes. Esse padrão é consistente com a estrutura dos dados, onde 65,4% dos voos não registraram atraso. A predominância de atrasos nulos favorece a concentração dos resíduos, enquanto os outliers correspondem a eventos excepcionais (Borsky e Unterberger, 2019).
Contudo, o desempenho robusto é influenciado pelo desbalanceamento da variável de resposta. Ao restringir a análise apenas aos voos com atraso positivo (34,6% da amostra), o desempenho caiu expressivamente. O MAE subiu para aproximadamente 19 minutos, o RMSE ultrapassou 49 minutos e o R² caiu para cerca de 0,877. Essa deterioração evidencia uma redução na capacidade explicativa dos modelos ao prever a magnitude de atrasos reais, em vez de apenas acertar os casos de pontualidade.
O cenário tornou-se mais desafiador ao focar nos atrasos superiores a 15 minutos. Nesse subconjunto, o MAE aumentou para 25 minutos e o RMSE aproximou-se de 60 minutos, enquanto o R² caiu para 0,841. Esse resultado demonstra que, à medida que a análise se concentra nos eventos mais críticos, o erro médio dos modelos se aproxima da própria escala dos atrasos, comprometendo a utilidade das previsões para a tomada de decisão. A dificuldade em capturar atrasos longos é um fenômeno documentado na literatura (Zoutendijk e Mitici, 2021).
A principal razão para essa limitação reside na natureza dos dados. A modelagem, focada em variáveis meteorológicas e temporais, não contempla fatores determinantes para atrasos severos, como decisões operacionais, falhas técnicas ou congestionamento do tráfego aéreo (Borsky et al., 2019). A ausência dessas informações cria uma lacuna explicativa. O desbalanceamento da base de dados, com 65,4% de voos sem atraso, funciona como uma “muleta estatística”, inflando as métricas de desempenho globais e mascarando a dificuldade dos modelos em prever atrasos reais (Kuhn e Johnson, 2013).
A investigação sobre o impacto da janela temporal das variáveis meteorológicas revelou estabilidade no desempenho. A variação da janela de 0 a 8 horas antes da decolagem não produziu alterações significativas nas métricas. Tanto para o RFR quanto para o XGBR, o RMSE e o MAE permaneceram constantes, sugerindo que a informação das condições mais imediatas já era suficiente para o modelo atingir seu platô de desempenho. Em termos de eficiência, o XGBoost se mostrou significativamente mais rápido que o Random Forest.
De forma semelhante, a seleção de variáveis com SelectKBest demonstrou que um número reduzido de preditores já alcançava um desempenho próximo ao máximo. Aumentar as variáveis de 10 para 40 resultou em ganhos marginais de acurácia (RMSE caiu de 30,26 para 30,19 minutos), mas dobrou o tempo de processamento. Isso reforça a ideia de saturação informacional e a importância do equilíbrio entre complexidade e custo computacional (Géron, 2019). A robustez dos modelos foi confirmada por um tuning extensivo de hiperparâmetros, que mostrou métricas de desempenho estáveis, um comportamento esperado para ensembles de árvores (Breiman, 2001; Friedman, 2001).
A análise de interpretabilidade com SHAP confirmou os diagnósticos anteriores. Em ambos os modelos, a variável mais influente foi voo_realizado, um indicador do status da operação. As variáveis meteorológicas, como umidade e pressão, apresentaram contribuições médias muito inferiores. Esse achado revela que o alto desempenho global (R² > 0,90) estava mais associado à capacidade de distinguir entre voos realizados e cancelados do que a uma predição refinada da magnitude do atraso com base no clima. A análise SHAP corrobora que a ausência de variáveis operacionais limita severamente a capacidade dos modelos de explicar os atrasos mais críticos (Hatıpoğlu e Tosun, 2024).
Em conclusão, o estudo demonstrou que a aplicação de algoritmos de aprendizado de máquina, como Random Forest e XGBoost, permite capturar padrões gerais de pontualidade na aviação civil brasileira com alta acurácia no cenário agregado. Os modelos apresentaram desempenho preditivo robusto, com R² superior a 0,90 e erros médios contidos, validando a abordagem metodológica. A consistência dos resultados frente a variações na janela meteorológica, no número de variáveis e no tuning de hiperparâmetros atesta a robustez dos ensembles de árvores para essa tarefa (Breiman, 2001). No entanto, a investigação também expôs limitações críticas quando o foco se desloca para a previsão de atrasos de maior relevância operacional.
O desempenho dos modelos deteriora-se significativamente ao analisar apenas os voos que de fato atrasaram, especialmente aqueles com atrasos superiores a 15 minutos. Essa queda está ligada ao desbalanceamento da base de dados e à ausência de variáveis operacionais cruciais. A análise de interpretabilidade com SHAP reforçou que os modelos se apoiaram fortemente em indicadores do status do voo, com as variáveis meteorológicas desempenhando um papel secundário. Portanto, a principal contribuição deste trabalho reside em evidenciar que, embora a meteorologia seja um fator relevante, ela é insuficiente para explicar isoladamente a magnitude dos atrasos críticos. Para que os modelos preditivos tenham utilidade prática, é imperativa a incorporação de dados adicionais, como características das companhias aéreas e congestionamento da malha. Conclui-se que o objetivo foi atingido: demonstrou-se que, embora as condições meteorológicas influenciem os padrões gerais de pontualidade, sua capacidade preditiva para atrasos críticos é limitada sem a inclusão de variáveis operacionais adicionais.
Referências:
Agência Nacional de Aviação Civil [ANAC]. Voo Regular Ativo (VRA). Disponível em: https://www. gov. br/anac/pt-br/acesso-a-informacao/dados-abertos/areas-de-atuacao/voos-e-operacoes-aereas/voo-regular-ativo-vra. Acesso em: 15 jun. 2025.
Batista, G. E. A. P. A.; Monard, M. C. 2003. An analysis of four missing data treatment methods for supervised learning. Applied Artificial Intelligence 17(5–6): 519–533.
Borsky, S.; Unterberger, A. 2019. Bad weather and flight delays. Economics of Transportation 17.
Breiman, L. 2001. Random forests. Machine Learning 45(1): 5–32.
Britto, R.; Dresner, M.; Voltes, A. 2012. The impact of flight delays on passenger demand and societal welfare. Transportation Research Part E: Logistics and Transportation Review 48(2): 460-469.
Friedman, J. H. 2001. Greedy function approximation: a gradient boosting machine. Annals of Statistics 29(5): 1189–1232.
Géron, A. Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems. 2a. edição. Sebastopol: O’Reilly Media, 2019.
Hatıpoğlu, I.; Tosun, Ö. 2024. Predictive modeling of flight delays at an airport using machine learning methods. Applied Sciences 14: 5472.
Iowa Environmental Mesonet [IEM]. Download ASOS/AWOS/METAR Data. Disponível em: https://mesonet. agron. iastate. edu/request/download. phtml? network=CO_ASOS. Acesso em: 16 jun. 2025.
Kuhn, M.; Johnson, K. Applied Predictive Modeling. New York: Springer, 2013.
Lu, M.; Wei, P.; He, M.; Teng, Y. 2021. Flight delay prediction using gradient boosting machine learning classifiers. Journal of Quantum Computing 3(1).
Oliveira, M. de; Eufrásio, A. B. R.; Guterres, M. X.; Murça, M. C. R.; Gomes, R. de A. 2021. Analysis of airport weather impact on on-time performance of arrival flights for the Brazilian domestic air transportation system. Journal of Air Transport Management 91: 101974.
Silva, O. V.; Parra, C. S. 2008. A importância do transporte aéreo para o turismo e a economia mundial. Revista Científica Eletrônica de Turismo 5(9).
Sternberg, A.; Carvalho, D.; Murta, L.; Soares, J.; Ogasawara, E. 2016. An analysis of Brazilian flight delays based on frequent patterns. Transportation Research Part E: Logistics and Transportation Review 95: 282–298.
Tavares, L. G. 2021. Analyzing flight delay prediction under concept drift. Dissertação de Mestrado em Ciência da Computação. Centro Federal de Educação Tecnológica Celso Suckow da Fonseca, Rio de Janeiro, RJ, Brasil.
Wang, F.; Bi, J.; Xie, D.; Zhao, X. 2022. Flight delay forecasting and analysis of direct and indirect factors. IET Intelligent Transport Systems 16(7): 890-907.
Willmott, C. J.; Matsuura, K. 2005. Advantages of the mean absolute error (MAE) over the root mean square error (RMSE) in assessing average model performance. Climate Research 30(1): 79–82.
Zoutendijk, M.; Mitici, M. 2021. Probabilistic flight delay predictions using machine learning and applications to the flight-to-gate assignment problem. Aerospace 8: 152.
Resumo executivo oriundo de Trabalho de Conclusão de Curso de Especialização em Data Science e Analytics do MBA USP/Esalq
Saiba mais sobre o curso; clique aqui:






































