
19 de fevereiro de 2026
Análise de séries temporais para previsão de consumo de combustível em máquinas de construção
Renato Ribeiro Dos Santos; Edilson José Rodrigues
Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.
Esta pesquisa desenvolve e avalia modelos de previsão de consumo de combustível (ARIMA, SARIMA e SARIMAX) em máquinas da construção civil, utilizando dados de telemetria. O objetivo é criar uma ferramenta quantitativa para a gestão de frotas, visando otimizar custos operacionais, eficiência energética e reduzir o impacto ambiental. A investigação identifica padrões temporais e sazonais, avalia o impacto de variáveis exógenas na acurácia das previsões e preenche uma lacuna na literatura, que carece de estudos focados especificamente no contexto da construção pesada.
O setor da construção civil é um pilar para o desenvolvimento econômico (IBGE, 2023). No Brasil, as vendas de máquinas de construção cresceram 9% em 2024, com a “linha amarela” — escavadeiras, pás-carregadeiras e tratores — respondendo por 36,6 mil das 58,2 mil unidades comercializadas (Sobratema, 2024). Este crescimento, combinado com a redução da frota ociosa para 11%, intensifica as operações e a pressão sobre os custos operacionais; o combustível é um componente principal.
A gestão do consumo de combustível tem implicações econômicas e socioambientais. O consumo de diesel em máquinas pesadas é uma fonte significativa de emissões de dióxido de carbono (CO₂) (IPCC, 2023), e a otimização do seu uso alinha-se a metas de sustentabilidade e competitividade. Reduções de consumo, mesmo que marginais, podem gerar economias financeiras substanciais e diminuir o impacto ambiental. Estudos demonstram que uma redução de 5% no consumo médio pode representar economias anuais de milhões de reais para grandes frotas e mitigar a emissão de toneladas de gases de efeito estufa (Pasupathy et al., 2024).
A tecnologia de telemetria viabiliza essa otimização ao coletar continuamente dados operacionais como horas trabalhadas, temperatura de componentes e consumo de combustível (Fan & Fan, 2015). A análise de séries temporais oferece a metodologia para transformar esses dados brutos em previsões acionáveis. Modelos estatísticos como ARIMA (Autoregressive Integrated Moving Average) e sua extensão sazonal SARIMA são reconhecidos por sua capacidade de capturar tendências e dependências temporais em dados sequenciais (Box & Jenkins, 1976). Sua aplicação em dados de telemetria permite criar modelos preditivos para antecipar o consumo, otimizar o planejamento de abastecimento e identificar anomalias. Apesar da eficácia comprovada em outros domínios (Więcek, 2024), a aplicação específica em máquinas de construção civil permanece pouco explorada, justificando esta investigação.
O estudo utilizou um conjunto de dados de telemetria coletados de uma frota de 957 máquinas de construção civil ao longo de 12 meses. A base de dados bruta, com 191.553 observações e 36 variáveis, foi pré-processada através da agregação dos dados em uma frequência diária. Essa etapa consolidou as múltiplas medições diárias em um único valor médio, resultando em uma série temporal com 366 observações e 7 variáveis principais. A agregação diária padroniza a periodicidade, suaviza ruídos e torna padrões estruturais, como tendência e sazonalidade, mais evidentes (Chatfield, 2003). A variável-alvo selecionada para a previsão foi a “Taxa Média de Combustível” (l/hr).
A metodologia iniciou com uma análise exploratória, incluindo a decomposição da série temporal para isolar seus componentes de tendência, sazonalidade e resíduos. A estacionariedade, um pré-requisito para modelos da família ARIMA (Box & Jenkins, 1976), foi verificada com os testes estatísticos de Dickey-Fuller Aumentado (ADF) e Kwiatkowski–Phillips–Schmidt–Shin (KPSS). Como a série original se mostrou não estacionária, foi aplicada uma diferenciação de primeira ordem para estabilizar a média e a variância. A análise das funções de autocorrelação (ACF) e autocorrelação parcial (PACF) da série diferenciada foi crucial para a identificação preliminar dos parâmetros dos modelos.
Para a modelagem preditiva, foram implementados e comparados três modelos: ARIMA, SARIMA e SARIMAX. O modelo ARIMA serviu como linha de base. O modelo SARIMA foi empregado para incorporar a componente sazonal semanal (m=7), identificada na análise exploratória. O modelo SARIMAX (Seasonal Autoregressive Integrated Moving Average with eXogenous variables) foi desenvolvido para avaliar se a inclusão de variáveis operacionais externas poderia aprimorar a acurácia. A seleção das variáveis exógenas foi guiada pelo coeficiente de correlação de Pearson, que mede a associação linear entre a variável-alvo e variáveis como “Tempo Engrenado. Avanço 1 (hr)” e “Uso do Motor. Carga Alta (hr)” (Kleinbaum et al., 2013). A seleção automática de parâmetros para os modelos foi realizada pelo algoritmo Auto ARIMA, que busca a combinação ótima de ordens (p, d, q)(P, D, Q)[m] com base em critérios como AIC e BIC.
O desempenho dos modelos foi avaliado com as métricas Erro Absoluto Médio (MAE), Raiz do Erro Quadrático Médio (RMSE) e Erro Percentual Absoluto Médio (MAPE) (Willmott & Matsuura, 2005). A série temporal foi dividida em conjuntos de treino (primeiros 336 dias, ~92%) e teste (últimos 30 dias, ~8%). A qualidade estatística dos modelos foi inspecionada pela análise de resíduos, utilizando o teste de Ljung-Box para verificar a ausência de autocorrelação, o teste de Shapiro-Wilk para avaliar a normalidade e o teste ARCH-LM para investigar a homoscedasticidade. Toda a análise foi implementada em Python, com o suporte das bibliotecas pandas, statsmodels, matplotlib e seaborn.
A análise descritiva revelou uma variabilidade consistente no consumo de combustível, com outliers sinalizando dias de operação atípica. Embora a visualização da série temporal diária sugerisse estabilidade, os testes formais confirmaram sua natureza não estacionária. Os testes ADF (p-valor = 0,8651) e KPSS (p-valor = 0,0182) na série original indicaram a presença de uma raiz unitária, reforçando a necessidade de aplicar uma diferenciação de primeira ordem (d=1) para a correta aplicação dos modelos ARIMA (Box & Jenkins, 1976).
A decomposição aditiva da série temporal revelou uma tendência relativamente estável e, mais importante, uma componente de sazonalidade com um padrão cíclico claro de sete dias. Este resultado é consistente com o ritmo operacional da construção civil, com maior atividade em dias úteis e redução nos finais de semana. A componente de resíduos apresentou-se como um ruído branco, indicando que o modelo de decomposição capturou adequadamente as estruturas de tendência e sazonalidade. A confirmação dessa sazonalidade semanal foi fundamental para a decisão de utilizar modelos SARIMA.
Após a diferenciação, a análise das funções ACF e PACF sugeriu a presença de componentes autorregressivos. Com base nessas observações e utilizando o procedimento Auto ARIMA com sazonalidade semanal (m=7), o modelo selecionado foi o SARIMA(1,1,2)(2,0,1)[7]. A significância estatística de seus parâmetros confirmou a relevância das dependências temporais e sazonais. A análise dos resíduos deste modelo mostrou ausência de autocorrelação (teste de Ljung-Box com p-valor = 0,96), indicando que a estrutura temporal da série foi bem capturada.
O desempenho preditivo do modelo SARIMA univariado, avaliado no conjunto de teste de 30 dias, foi excelente. O modelo alcançou um MAE de 0,44 l/hr, um RMSE de 0,54 l/hr e um MAPE de 4,69%. Um erro percentual médio abaixo de 5% supera benchmarks de setores correlatos; erros entre 5% e 10% são comuns (Sakib et al., 2023; Więcek, 2024). A comparação gráfica entre valores reais e previstos mostrou que o modelo seguiu a tendência geral da série, validando-o como uma ferramenta robusta para previsões de curto prazo.
A investigação prosseguiu com a hipótese de que variáveis operacionais poderiam refinar as previsões. Foram ajustados múltiplos modelos SARIMAX, cada um incorporando uma das seis variáveis exógenas pré-selecionadas. Os resultados demonstraram um ganho de performance expressivo. O modelo SARIMAX que utilizou a variável “Tempo Engrenado. Avanço 1 (hr)” destacou-se como o de melhor desempenho, reduzindo as métricas de erro para um MAE de 0,146 l/hr, RMSE de 0,215 l/hr e um MAPE de apenas 1,57%. Este resultado representa uma redução do erro preditivo de mais de 60% em comparação com o modelo ARIMA padrão e de quase 50% em relação ao SARIMA univariado.
Outras variáveis, como “Uso do Motor. Carga Alta (hr)” e “Uso do Combustível do Motor. Carga Alta (l)”, também levaram a modelos SARIMAX de alta precisão, com MAPEs de 1,70% e 1,86%, respectivamente. Esses achados sublinham a importância de incorporar o contexto operacional na modelagem, pois variáveis que refletem a intensidade do trabalho da máquina possuem maior poder explicativo sobre o consumo. Em contrapartida, variáveis com relação menos direta, como “Tempo Engrenado. Marcha à Ré 1 (hr)”, resultaram em melhorias modestas.
A análise dos resíduos dos modelos SARIMAX confirmou a superioridade daqueles que utilizaram as variáveis mais relevantes. Os modelos com “Tempo Engrenado. Avanço 1”, “Uso do Motor. Carga Alta” e “Uso do Combustível do Motor. Carga Alta” produziram resíduos independentes e homoscedásticos, fortalecendo a validade estatística de suas previsões. Embora a violação do pressuposto de normalidade tenha persistido em alguns casos, essa é uma limitação comum em séries temporais do mundo real que não invalidou a utilidade prática dos modelos, dado o baixo erro de previsão. A comparação sistemática demonstrou que a abordagem SARIMAX, com variáveis exógenas pertinentes, oferece uma capacidade preditiva substancialmente superior.
A projeção do consumo para os 30 dias subsequentes, realizada com o melhor modelo SARIMAX, mostrou um comportamento coerente com o padrão histórico, com flutuações alinhadas à sazonalidade semanal e um intervalo de confiança de 95% relativamente estreito. Isso reforça a robustez do modelo para o planejamento de curto e médio prazo, permitindo que gestores de frota antecipem necessidades de abastecimento e identifiquem desvios. A capacidade de prever o consumo com um erro médio de apenas 1,57% representa uma ferramenta de gestão de alto valor.
Este estudo demonstrou a eficácia de modelos de séries temporais para a previsão do consumo de combustível em máquinas de construção civil. Os resultados evidenciaram que, embora o modelo SARIMA univariado já forneça previsões de boa qualidade, a incorporação de variáveis exógenas operacionais através de modelos SARIMAX eleva a acurácia a um nível significativamente superior. Variáveis que medem diretamente a intensidade de uso dos equipamentos, como o tempo em marcha de avanço e a operação em alta carga, provaram ser preditores poderosos, resultando em modelos com erro percentual médio inferior a 2%. Essas descobertas têm implicações práticas diretas para a gestão de frotas, oferecendo um método quantitativo para otimizar o planejamento de recursos, reduzir custos operacionais e promover práticas mais sustentáveis.
Como limitação, o estudo aponta a violação parcial do pressuposto de normalidade dos resíduos, o que sugere a existência de dinâmicas não lineares não totalmente capturadas. Trabalhos futuros poderiam explorar abordagens mais complexas, como modelos de aprendizado de máquina (e. g., LSTM, XGBoost), para verificar se é possível obter ganhos adicionais de acurácia. Não obstante, a pesquisa valida a telemetria como uma fonte de dados estratégica e os modelos de séries temporais como uma ferramenta analítica poderosa para o setor. Conclui-se que o objetivo foi atingido: demonstrou-se que a aplicação de modelos de séries temporais, especialmente SARIMAX com variáveis exógenas relevantes, permite prever com alta acurácia o consumo de combustível em máquinas de construção civil, contribuindo para uma gestão mais eficiente e sustentável.
Referências:
Berrar, D. 2019. Cross-validation. p. 542-545. In: Ranganathan, S.; Gribskov, M. Encyclopedia of Bioinformatics and Computational Biology. v.1. Academic Press, New York, NY, Estados Unidos.
Box, G. E. P.; Jenkins, G. M. 1976. Time Series Analysis: Forecasting and Control. Holden-Day, San Francisco, CA, Estados Unidos.
CHATFIELD, C. The Analysis of Time Series: An Introduction. 6. ed. Boca Raton: Chapman & Hall/CRC, 2003.
Fan, Q.; Fan, H. 2015. Reliability analysis and failure prediction of construction equipment with time series models. Journal of Advanced Management Science 3(3): 203-210.
IBGE. Contas Nacionais Trimestrais: Indicadores de Volume e Valores Correntes. Instituto Brasileiro de Geografia e Estatística, 2023.
IPCC. Climate Change 2023: Synthesis Report. Intergovernmental Panel on Climate Change. Geneva, 2023.
Kleinbaum, D. G.; Kupper, L. L.; Muller, K. E. 2013. Applied Regression Analysis and Other Multivariable Methods. Cengage Learning, Boston, MA, Estados Unidos.
PASUPATHY, S.; LI, J.; KUMAR, A. Fuel efficiency optimization in construction equipment using time series forecasting. Journal of Cleaner Production, v. 430, p. 1–12, 2024.
SAKIB, N.; AHMED, T.; HOSSAIN, M. Application of SARIMA models for fuel consumption prediction in heavy-duty vehicles. Energy Reports, v. 9, p. 210–223, 2023.
SILVA, J. R.; MORAES, F. A.; OLIVEIRA, P. A. Custos operacionais e consumo de combustível em máquinas pesadas: uma análise de eficiência. Revista Engenharia de Produção e Sistemas, v. 9, n. 2, p. 77–89, 2021.
SOBRATEMA. Estudo do Mercado Brasileiro de Equipamentos para Construção 2024–2026. São Paulo: Associação Brasileira de Tecnologia para Construção e Mineração, 2024.
WIĘCEK, M. Forecasting energy consumption using ARIMA and SARIMA models: a case study. Energies, v. 17, n. 4, p. 1–18, 2024.
Willmott, C. J.; Matsuura, K. 2005. Advantages of the Mean Absolute Error (MAE) over the Root Mean Square Error (RMSE) in Assessing Average Model Performance. Climate Research 30(1): 79-82.
Resumo executivo oriundo de Trabalho de Conclusão de Curso de Especialização em Data Science e Analytics do MBA USP/Esalq
Saiba mais sobre o curso; clique aqui:





































