Imagem Análise de séries temporais para previsão de consumo de combustível em máquinas de construção

19 de fevereiro de 2026

Análise de séries temporais para previsão de consumo de combustível em máquinas de construção

Renato Ribeiro Dos Santos; Edilson José Rodrigues

Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.

Esta pesquisa desenvolve e avalia modelos de previsão de consumo de combustível (ARIMA, SARIMA e SARIMAX) em máquinas da construção civil, utilizando dados de telemetria. O objetivo é criar uma ferramenta quantitativa para a gestão de frotas, visando otimizar custos operacionais, eficiência energética e reduzir o impacto ambiental. A investigação identifica padrões temporais e sazonais, avalia o impacto de variáveis exógenas na acurácia das previsões e preenche uma lacuna na literatura, que carece de estudos focados especificamente no contexto da construção pesada.

O setor da construção civil é um pilar para o desenvolvimento econômico (IBGE, 2023). No Brasil, as vendas de máquinas de construção cresceram 9% em 2024, com a “linha amarela” — escavadeiras, pás-carregadeiras e tratores — respondendo por 36,6 mil das 58,2 mil unidades comercializadas (Sobratema, 2024). Este crescimento, combinado com a redução da frota ociosa para 11%, intensifica as operações e a pressão sobre os custos operacionais; o combustível é um componente principal.

A gestão do consumo de combustível tem implicações econômicas e socioambientais. O consumo de diesel em máquinas pesadas é uma fonte significativa de emissões de dióxido de carbono (CO₂) (IPCC, 2023), e a otimização do seu uso alinha-se a metas de sustentabilidade e competitividade. Reduções de consumo, mesmo que marginais, podem gerar economias financeiras substanciais e diminuir o impacto ambiental. Estudos demonstram que uma redução de 5% no consumo médio pode representar economias anuais de milhões de reais para grandes frotas e mitigar a emissão de toneladas de gases de efeito estufa (Pasupathy et al., 2024).

A tecnologia de telemetria viabiliza essa otimização ao coletar continuamente dados operacionais como horas trabalhadas, temperatura de componentes e consumo de combustível (Fan & Fan, 2015). A análise de séries temporais oferece a metodologia para transformar esses dados brutos em previsões acionáveis. Modelos estatísticos como ARIMA (Autoregressive Integrated Moving Average) e sua extensão sazonal SARIMA são reconhecidos por sua capacidade de capturar tendências e dependências temporais em dados sequenciais (Box & Jenkins, 1976). Sua aplicação em dados de telemetria permite criar modelos preditivos para antecipar o consumo, otimizar o planejamento de abastecimento e identificar anomalias. Apesar da eficácia comprovada em outros domínios (Więcek, 2024), a aplicação específica em máquinas de construção civil permanece pouco explorada, justificando esta investigação.

O estudo utilizou um conjunto de dados de telemetria coletados de uma frota de 957 máquinas de construção civil ao longo de 12 meses. A base de dados bruta, com 191.553 observações e 36 variáveis, foi pré-processada através da agregação dos dados em uma frequência diária. Essa etapa consolidou as múltiplas medições diárias em um único valor médio, resultando em uma série temporal com 366 observações e 7 variáveis principais. A agregação diária padroniza a periodicidade, suaviza ruídos e torna padrões estruturais, como tendência e sazonalidade, mais evidentes (Chatfield, 2003). A variável-alvo selecionada para a previsão foi a “Taxa Média de Combustível” (l/hr).

A metodologia iniciou com uma análise exploratória, incluindo a decomposição da série temporal para isolar seus componentes de tendência, sazonalidade e resíduos. A estacionariedade, um pré-requisito para modelos da família ARIMA (Box & Jenkins, 1976), foi verificada com os testes estatísticos de Dickey-Fuller Aumentado (ADF) e Kwiatkowski–Phillips–Schmidt–Shin (KPSS). Como a série original se mostrou não estacionária, foi aplicada uma diferenciação de primeira ordem para estabilizar a média e a variância. A análise das funções de autocorrelação (ACF) e autocorrelação parcial (PACF) da série diferenciada foi crucial para a identificação preliminar dos parâmetros dos modelos.

Para a modelagem preditiva, foram implementados e comparados três modelos: ARIMA, SARIMA e SARIMAX. O modelo ARIMA serviu como linha de base. O modelo SARIMA foi empregado para incorporar a componente sazonal semanal (m=7), identificada na análise exploratória. O modelo SARIMAX (Seasonal Autoregressive Integrated Moving Average with eXogenous variables) foi desenvolvido para avaliar se a inclusão de variáveis operacionais externas poderia aprimorar a acurácia. A seleção das variáveis exógenas foi guiada pelo coeficiente de correlação de Pearson, que mede a associação linear entre a variável-alvo e variáveis como “Tempo Engrenado. Avanço 1 (hr)” e “Uso do Motor. Carga Alta (hr)” (Kleinbaum et al., 2013). A seleção automática de parâmetros para os modelos foi realizada pelo algoritmo Auto ARIMA, que busca a combinação ótima de ordens (p, d, q)(P, D, Q)[m] com base em critérios como AIC e BIC.

O desempenho dos modelos foi avaliado com as métricas Erro Absoluto Médio (MAE), Raiz do Erro Quadrático Médio (RMSE) e Erro Percentual Absoluto Médio (MAPE) (Willmott & Matsuura, 2005). A série temporal foi dividida em conjuntos de treino (primeiros 336 dias, ~92%) e teste (últimos 30 dias, ~8%). A qualidade estatística dos modelos foi inspecionada pela análise de resíduos, utilizando o teste de Ljung-Box para verificar a ausência de autocorrelação, o teste de Shapiro-Wilk para avaliar a normalidade e o teste ARCH-LM para investigar a homoscedasticidade. Toda a análise foi implementada em Python, com o suporte das bibliotecas pandas, statsmodels, matplotlib e seaborn.

A análise descritiva revelou uma variabilidade consistente no consumo de combustível, com outliers sinalizando dias de operação atípica. Embora a visualização da série temporal diária sugerisse estabilidade, os testes formais confirmaram sua natureza não estacionária. Os testes ADF (p-valor = 0,8651) e KPSS (p-valor = 0,0182) na série original indicaram a presença de uma raiz unitária, reforçando a necessidade de aplicar uma diferenciação de primeira ordem (d=1) para a correta aplicação dos modelos ARIMA (Box & Jenkins, 1976).

A decomposição aditiva da série temporal revelou uma tendência relativamente estável e, mais importante, uma componente de sazonalidade com um padrão cíclico claro de sete dias. Este resultado é consistente com o ritmo operacional da construção civil, com maior atividade em dias úteis e redução nos finais de semana. A componente de resíduos apresentou-se como um ruído branco, indicando que o modelo de decomposição capturou adequadamente as estruturas de tendência e sazonalidade. A confirmação dessa sazonalidade semanal foi fundamental para a decisão de utilizar modelos SARIMA.

Após a diferenciação, a análise das funções ACF e PACF sugeriu a presença de componentes autorregressivos. Com base nessas observações e utilizando o procedimento Auto ARIMA com sazonalidade semanal (m=7), o modelo selecionado foi o SARIMA(1,1,2)(2,0,1)[7]. A significância estatística de seus parâmetros confirmou a relevância das dependências temporais e sazonais. A análise dos resíduos deste modelo mostrou ausência de autocorrelação (teste de Ljung-Box com p-valor = 0,96), indicando que a estrutura temporal da série foi bem capturada.

O desempenho preditivo do modelo SARIMA univariado, avaliado no conjunto de teste de 30 dias, foi excelente. O modelo alcançou um MAE de 0,44 l/hr, um RMSE de 0,54 l/hr e um MAPE de 4,69%. Um erro percentual médio abaixo de 5% supera benchmarks de setores correlatos; erros entre 5% e 10% são comuns (Sakib et al., 2023; Więcek, 2024). A comparação gráfica entre valores reais e previstos mostrou que o modelo seguiu a tendência geral da série, validando-o como uma ferramenta robusta para previsões de curto prazo.

A investigação prosseguiu com a hipótese de que variáveis operacionais poderiam refinar as previsões. Foram ajustados múltiplos modelos SARIMAX, cada um incorporando uma das seis variáveis exógenas pré-selecionadas. Os resultados demonstraram um ganho de performance expressivo. O modelo SARIMAX que utilizou a variável “Tempo Engrenado. Avanço 1 (hr)” destacou-se como o de melhor desempenho, reduzindo as métricas de erro para um MAE de 0,146 l/hr, RMSE de 0,215 l/hr e um MAPE de apenas 1,57%. Este resultado representa uma redução do erro preditivo de mais de 60% em comparação com o modelo ARIMA padrão e de quase 50% em relação ao SARIMA univariado.

Outras variáveis, como “Uso do Motor. Carga Alta (hr)” e “Uso do Combustível do Motor. Carga Alta (l)”, também levaram a modelos SARIMAX de alta precisão, com MAPEs de 1,70% e 1,86%, respectivamente. Esses achados sublinham a importância de incorporar o contexto operacional na modelagem, pois variáveis que refletem a intensidade do trabalho da máquina possuem maior poder explicativo sobre o consumo. Em contrapartida, variáveis com relação menos direta, como “Tempo Engrenado. Marcha à Ré 1 (hr)”, resultaram em melhorias modestas.

A análise dos resíduos dos modelos SARIMAX confirmou a superioridade daqueles que utilizaram as variáveis mais relevantes. Os modelos com “Tempo Engrenado. Avanço 1”, “Uso do Motor. Carga Alta” e “Uso do Combustível do Motor. Carga Alta” produziram resíduos independentes e homoscedásticos, fortalecendo a validade estatística de suas previsões. Embora a violação do pressuposto de normalidade tenha persistido em alguns casos, essa é uma limitação comum em séries temporais do mundo real que não invalidou a utilidade prática dos modelos, dado o baixo erro de previsão. A comparação sistemática demonstrou que a abordagem SARIMAX, com variáveis exógenas pertinentes, oferece uma capacidade preditiva substancialmente superior.

A projeção do consumo para os 30 dias subsequentes, realizada com o melhor modelo SARIMAX, mostrou um comportamento coerente com o padrão histórico, com flutuações alinhadas à sazonalidade semanal e um intervalo de confiança de 95% relativamente estreito. Isso reforça a robustez do modelo para o planejamento de curto e médio prazo, permitindo que gestores de frota antecipem necessidades de abastecimento e identifiquem desvios. A capacidade de prever o consumo com um erro médio de apenas 1,57% representa uma ferramenta de gestão de alto valor.

Este estudo demonstrou a eficácia de modelos de séries temporais para a previsão do consumo de combustível em máquinas de construção civil. Os resultados evidenciaram que, embora o modelo SARIMA univariado já forneça previsões de boa qualidade, a incorporação de variáveis exógenas operacionais através de modelos SARIMAX eleva a acurácia a um nível significativamente superior. Variáveis que medem diretamente a intensidade de uso dos equipamentos, como o tempo em marcha de avanço e a operação em alta carga, provaram ser preditores poderosos, resultando em modelos com erro percentual médio inferior a 2%. Essas descobertas têm implicações práticas diretas para a gestão de frotas, oferecendo um método quantitativo para otimizar o planejamento de recursos, reduzir custos operacionais e promover práticas mais sustentáveis.

Como limitação, o estudo aponta a violação parcial do pressuposto de normalidade dos resíduos, o que sugere a existência de dinâmicas não lineares não totalmente capturadas. Trabalhos futuros poderiam explorar abordagens mais complexas, como modelos de aprendizado de máquina (e. g., LSTM, XGBoost), para verificar se é possível obter ganhos adicionais de acurácia. Não obstante, a pesquisa valida a telemetria como uma fonte de dados estratégica e os modelos de séries temporais como uma ferramenta analítica poderosa para o setor. Conclui-se que o objetivo foi atingido: demonstrou-se que a aplicação de modelos de séries temporais, especialmente SARIMAX com variáveis exógenas relevantes, permite prever com alta acurácia o consumo de combustível em máquinas de construção civil, contribuindo para uma gestão mais eficiente e sustentável.

Referências:
Berrar, D. 2019. Cross-validation. p. 542-545. In: Ranganathan, S.; Gribskov, M. Encyclopedia of Bioinformatics and Computational Biology. v.1. Academic Press, New York, NY, Estados Unidos.
Box, G. E. P.; Jenkins, G. M. 1976. Time Series Analysis: Forecasting and Control. Holden-Day, San Francisco, CA, Estados Unidos.
CHATFIELD, C. The Analysis of Time Series: An Introduction. 6. ed. Boca Raton: Chapman & Hall/CRC, 2003.
Fan, Q.; Fan, H. 2015. Reliability analysis and failure prediction of construction equipment with time series models. Journal of Advanced Management Science 3(3): 203-210.
IBGE. Contas Nacionais Trimestrais: Indicadores de Volume e Valores Correntes. Instituto Brasileiro de Geografia e Estatística, 2023.
IPCC. Climate Change 2023: Synthesis Report. Intergovernmental Panel on Climate Change. Geneva, 2023.
Kleinbaum, D. G.; Kupper, L. L.; Muller, K. E. 2013. Applied Regression Analysis and Other Multivariable Methods. Cengage Learning, Boston, MA, Estados Unidos.
PASUPATHY, S.; LI, J.; KUMAR, A. Fuel efficiency optimization in construction equipment using time series forecasting. Journal of Cleaner Production, v. 430, p. 1–12, 2024.
SAKIB, N.; AHMED, T.; HOSSAIN, M. Application of SARIMA models for fuel consumption prediction in heavy-duty vehicles. Energy Reports, v. 9, p. 210–223, 2023.
SILVA, J. R.; MORAES, F. A.; OLIVEIRA, P. A. Custos operacionais e consumo de combustível em máquinas pesadas: uma análise de eficiência. Revista Engenharia de Produção e Sistemas, v. 9, n. 2, p. 77–89, 2021.
SOBRATEMA. Estudo do Mercado Brasileiro de Equipamentos para Construção 2024–2026. São Paulo: Associação Brasileira de Tecnologia para Construção e Mineração, 2024.
WIĘCEK, M. Forecasting energy consumption using ARIMA and SARIMA models: a case study. Energies, v. 17, n. 4, p. 1–18, 2024.
Willmott, C. J.; Matsuura, K. 2005. Advantages of the Mean Absolute Error (MAE) over the Root Mean Square Error (RMSE) in Assessing Average Model Performance. Climate Research 30(1): 79-82.

Resumo executivo oriundo de Trabalho de Conclusão de Curso de Especialização em Data Science e Analytics do MBA USP/Esalq

Saiba mais sobre o curso; clique aqui:

Quem editou este artigo

Você também pode gostar

Quer ficar por dentro das nossas últimas publicações? Inscreva-se em nossa newsletter!

Receba conteúdos e fique sempre atualizado sobre as novidades em gestão, liderança e carreira com a Revista E&S.

Ao preencher o formulário você está ciente de que podemos enviar comunicações e conteúdos da Revista E&S. Confira nossa Política de Privacidade