Imagem Modelos preditivos para gestão de estoque com séries temporais na indústria de implementos

Tecnologia

10 de dezembro de 2025

Modelos preditivos para gestão de estoque com séries temporais na indústria de implementos

Autora: Mariana Prignacca — Orientadora: Vanessa Mesquita Blas Garcia

Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.

Este trabalho explora modelos de séries temporais da família Box-Jenkins e de suavização exponencial para prever a demanda de peças de reposição de implementos agrícolas, utilizando uma série univariada, discreta e estocástica. O objetivo é avaliar se essas abordagens podem dar suporte à otimização da gestão de estoque. A gestão de estoques de peças é um desafio estratégico, pois exige um equilíbrio entre garantir alta disponibilidade para evitar interrupções operacionais e minimizar custos excessivos de armazenagem (Dias, 2009; Ballou, 2006). Um estoque insuficiente pode causar paradas de produção e perda de confiança do cliente, enquanto o excesso imobiliza capital e gera despesas com manutenção e obsolescência (Arnold et al., 2011; Silver et al., 1998).

Essa dualidade torna o controle de estoques uma atividade estratégica que exige métodos de previsão de demanda e políticas de reposição robustas (Muckstadt, 2005; Sherbrooke, 2004). Na agroindústria brasileira, a complexidade é amplificada por desafios como capacidade de armazenagem limitada, deficiências na infraestrutura logística, forte sazonalidade da produção e escassez de dados históricos consistentes, fatores que comprometem a eficiência do planejamento (Appia, 2024; Folha Agrícola, 2025; Rodrigues e Ross, 2020). No setor de implementos para a cultura da cana-de-açúcar, a demanda por peças de reposição é influenciada pela sazonalidade da safra, gerando picos de demanda em períodos específicos.

A previsão de demanda é um pilar para o planejamento e controle de estoques (Love, 1979). Estimar com precisão as necessidades futuras permite otimizar os níveis de estoque e apoiar o planejamento de compras. As vendas ao longo do tempo formam uma série temporal, e a análise desses dados permite identificar padrões como tendências e ciclos sazonais, essenciais para estimativas futuras acuradas (Box et al., 2015). A análise de séries temporais busca prever o comportamento futuro por meio da observação de comportamentos passados, extraindo informações de dados ordenados cronologicamente (Nielsen, 2020).

Modelos preditivos clássicos como os da família Box-Jenkins e o método de Holt-Winters são amplamente utilizados para capturar padrões sazonais e tendências (Hamilton, 1994; Hyndman e Athanasopoulos, 2018). No entanto, a aplicação desses modelos em bases de dados com poucas observações está sujeita a falhas como o sobreajuste (overfitting), onde o modelo aprende o ruído aleatório em vez da estrutura de sinal subjacente (Oses, 2023). Esse desafio é comum em empresas com poucos registros históricos, pois modelos treinados com poucos dados falham em generalizar para novos dados (Géron, 2019).

Os modelos Box-Jenkins, como ARIMA e SARIMA, são ferramentas robustas para análise de séries temporais baseadas exclusivamente em dados históricos (Makridakis et al., 1998). Em contrapartida, os modelos de suavização exponencial capturam diretamente os componentes de nível, tendência e sazonalidade, oferecendo boa adaptação em cenários de demanda volátil, com valores baixos e presença de zeros, características comuns em estoques de peças (Makridakis et al., 2018). Modelos ARIMA exigem etapas adicionais de verificação de estacionariedade e diferenciação, o que aumenta a complexidade da modelagem (Brockwell e Davis, 2002). Nesse sentido, modelos de suavização exponencial, como o de Holt-Winters, podem ser mais eficazes em séries sazonais de baixa magnitude, fornecendo previsões mais estáveis.

O estudo caracterizou-se como uma pesquisa exploratória quantitativa, delineada como um estudo de caso. Foram aplicadas a metodologia Box-Jenkins e os métodos de suavização exponencial em uma base de dados secundária de uma empresa fabricante de implementos para o setor sucroenergético, localizada no interior de São Paulo. A série histórica compreendeu o período de março de 2022 a março de 2025, totalizando 37 observações mensais. Os dados foram extraídos do sistema Enterprise Resource Planning (ERP) da empresa. Por se tratar de dados quantitativos, as análises foram interpretadas numericamente, permitindo a construção de tabelas comparativas de erro para avaliação dos resultados (Turrioni e Mello, 2012; Godoy, 1995).

Para a previsão, foram comparadas duas famílias de modelos: Box-Jenkins (ARIMA e SARIMA) e suavização exponencial (Suavização Exponencial Simples – SES, método de Holt, método sazonal simples e Holt-Winters). A escolha foi fundamentada no desempenho competitivo desses métodos em séries com volume limitado de observações (Box et al., 2015; Hyndman e Athanasopoulos, 2018; Makridakis et al., 2018). Todas as etapas foram desenvolvidas em Python (versão 3.11.7), utilizando bibliotecas como Pandas, NumPy, matplotlib, statsmodels, pmdarima, scikit-learn, arch e scipy, alinhadas às práticas atuais para previsão de séries temporais (Joseph e Tackes, 2024).

O pré-processamento dos dados envolveu a seleção de um único produto, identificado pelo código ‘XBFHH’, escolhido por apresentar o maior número de transações. As vendas foram agrupadas em uma série temporal mensal, e meses sem registro de vendas foram preenchidos com o valor zero para garantir a continuidade da série (Nielsen, 2020). A estacionariedade foi verificada com os testes Augmented Dickey-Fuller (ADF) e Kwiatkowski-Phillips-Schmidt-Shin (KPSS), com nível de significância de 0,05. A decomposição da série em tendência, sazonalidade e resíduos foi realizada para auxiliar na compreensão de seu comportamento e na escolha entre modelos aditivos ou multiplicativos (Morettin e Toloi, 2006).

Para evitar o sobreajuste, a série foi dividida em conjuntos de treino (80% dos dados) e teste (20% restantes), mantendo a ordem cronológica (Tomiazzi et al., 2018). A modelagem Box-Jenkins foi conduzida de forma automatizada, utilizando a função auto_arima para buscar o menor critério de informação (AIC e BIC), e de forma manual, guiada pela análise das Funções de Autocorrelação (FAC) e Autocorrelação Parcial (FACP) (Dickey e Fuller, 1981). A modelagem de suavização exponencial testou os modelos SES, Holt e Holt-Winters. Após o ajuste, foi realizada uma análise diagnóstica dos resíduos para verificar se se comportavam como ruído branco, utilizando o teste de Ljung-Box para autocorrelação, o teste de Kolmogorov-Smirnov para normalidade (Stephens, 1974) e o teste ARCH para heterocedasticidade (Engle, 1982). O desempenho de cada modelo foi quantificado pelas métricas de Erro Quadrático Médio da Raiz (RMSE) e Erro Absoluto Médio (MAE) (Chai e Draxler, 2014; Willmott et al., 2009).

A análise da série de vendas do produto ‘XBFHH’ revelou alta volatilidade e comportamento esporádico. Com 37 observações, a série apresentou um desvio padrão (7,81) superior à média de vendas (5,30 unidades/mês) e uma amplitude de 0 a 36 unidades. A mediana de 2 unidades reforçou o caráter concentrado da demanda. O teste de Dickey-Fuller Aumentado (ADF) resultou em um p-valor de 0,51, indicando que a série é não estacionária e justificando a necessidade de diferenciação nos modelos ARIMA.

A decomposição aditiva da série revelou uma tendência de crescimento gradual a partir de 2023. O componente de sazonalidade apresentou um padrão visual, mas um teste estatístico indicou que não era estatisticamente significativo. O gráfico dos resíduos evidenciou um componente de ruído com alta variância, sinalizando que uma parte considerável da variabilidade dos dados é irregular, o que representa um desafio para a precisão dos modelos. A não estacionariedade confirmou a necessidade de diferenciação, enquanto a ausência de sazonalidade estatística e o forte ruído justificaram a comparação entre diversos modelos.

A análise comparativa de nove modelos distintos revelou que o modelo “sazonal simples (aditivo)” apresentou o melhor desempenho preditivo, com os menores valores de RMSE (9,13) e MAE (5,92). Em seguida, posicionou-se o modelo de “suavização exponencial simples (SES)”. Este resultado sugere que, para esta série curta e volátil, as abordagens de suavização mais simples foram mais eficazes. Em contrapartida, na família Box-Jenkins, os modelos ARIMA/SARIMA com parametrização manual alcançaram uma acurácia competitiva (RMSE de 9,24), próxima à dos melhores modelos de suavização. Já as versões com parametrização 100% automática apresentaram os erros mais elevados, com RMSE variando entre 11,99 e 15,22.

A superioridade da abordagem manual foi um achado central. A análise dos gráficos FAC e FACP da série de treino confirmou a não estacionariedade, indicando a necessidade de diferenciação (d=1). Após a diferenciação, a análise dos novos gráficos, guiada pelo princípio da parcimônia, sugeriu a escolha dos parâmetros p=1 e q=1 (Box et al., 2015). Em contraste, a abordagem automatizada convergiu para uma especificação mais complexa, como ARIMA(4,1,0), que teve um desempenho preditivo inferior. Isso ilustra que, em séries curtas e com alto ruído, a busca algorítmica por um “ajuste perfeito” pode levar ao sobreajuste, enquanto a abordagem manual resultou em um modelo mais simples e com maior capacidade de generalização.

A análise diagnóstica dos resíduos mostrou que todos os modelos Box-Jenkins geraram resíduos independentes e com variância constante. A divergência ocorreu no teste de normalidade, que foi reprovado por alguns dos modelos mais acurados, como o SARIMA Manual e o SES. Este resultado sugere que a não normalidade dos resíduos pode ser uma característica intrínseca da série de dados, cujos picos de venda se comportam como outliers, em vez de uma falha de ajuste do modelo. A abordagem mais promissora consistiu em utilizar modelos mais simples ou guiados pela análise humana.

Os resultados possuem implicações práticas. A identificação de um modelo com Erro Absoluto Médio (MAE) de aproximadamente 5,92 unidades oferece uma ferramenta quantitativa de apoio à decisão. Um gestor de estoque pode utilizar a previsão como linha de base, sabendo que, em média, a demanda real estará em um raio de aproximadamente 6 peças do valor previsto. Essa informação permite um dimensionamento mais racional do estoque de segurança, auxiliando na redução de custos e mitigando o risco de ruptura.

É fundamental reconhecer as limitações do estudo. A análise focou em um único produto com uma série histórica curta, e a natureza univariada da análise desconsiderou variáveis externas que podem impactar a demanda, como cronogramas de manutenção de clientes ou dados de safras. A ausência dessas variáveis exógenas é uma possível causa para a variabilidade não capturada pelos modelos. Essas limitações abrem caminhos para trabalhos futuros, como a exploração de modelos que permitem a inclusão de fatores externos, a aplicação da metodologia a outros produtos e o uso de técnicas como a validação cruzada rolada (Roll-Forward Cross Validation).

Este estudo explorou a aplicabilidade de modelos de séries temporais para a previsão de demanda de peças de reposição. A exploração demonstrou que, para a série em questão, as abordagens mais simples, como o modelo sazonal simples aditivo, se mostraram mais eficazes, superando modelos mais complexos. Este achado sugere que, em contextos de dados escassos e ruídosos, a capacidade de um modelo de capturar um padrão fundamental sem se sobreajustar ao ruído é mais crítica do que sua complexidade. Adicionalmente, o estudo evidenciou a superioridade da parametrização manual dos modelos ARIMA em relação às abordagens automáticas para este cenário, reforçando a importância da análise humana e do princípio da parcimônia. A análise das limitações indicou que a variabilidade da demanda dificilmente será explicada apenas por seu comportamento passado. A direção mais promissora para trabalhos futuros reside na transição para modelos multivariados que permitam a inclusão de variáveis exógenas. Conclui-se que o objetivo foi atingido: demonstrou-se que modelos clássicos de séries temporais, especialmente os de suavização exponencial, são viáveis para fornecer um suporte quantitativo inicial à gestão de estoque, mesmo em cenários de dados limitados e voláteis.

Referências
Appia. 2024. Otimização de estoque com IA: reduza perdas e maximize a lucratividade no agronegócio brasileiro. Disponível em: <https://www. appia. com. br/post/otimiza%C3%A7%C3%A3o-de-estoque-com-ia-reduza-perdas-e-maximize-a-lucratividade-no-agroneg%C3%B3cio-brasileiro>. Acesso em: 20 ago. 2025.
Arnold, J. R. T.; Chapman, S. N.; Clive, L. M. 2011. Introduction to Materials Management. 7ed. Pearson, New Jersey, NJ, USA.
Ballou, R. H. 2006. Gerenciamento da Cadeia de Suprimentos: Logística empresarial. 5ed. Bookman, Porto Alegre, RS, Brasil.
Box, G. E. P.; Jenkins, G. M.; Reinsel, G. C.; Ljung, G. M. 2015. Time Series Analysis: Forecasting and Control. 5ed. Wiley, Hoboken, NJ, USA.
Brockwell, P. J.; Davis, R. A. 2002. Introduction to Time Series and Forecasting. 2ed. Springer, New York, NY, USA.
Chai, T.; Draxler, R. R. 2014. Root mean square error (RMSE) or mean absolute error (MAE)? – arguments against avoiding RMSE in the literature. Geoscientific Model Development 7: 1247-1250.
Dias, M. A. P. 2009. Administração de Materiais: Princípios, conceitos e gestão. Atlas, São Paulo, SP, Brasil.
Dickey, D. A.; Fuller, W. A. 1981. Likelihood ratio statistics for autoregressive time series with a unit root. Econometrica 49: 1057-1072.
Engle, R. F. 1982. Autoregressive conditional heteroscedasticity with estimates of the variance of United Kingdom inflation. Econometrica 50(4): 987-1007.
Folha Agrícola. 2025. Logística inteligente é a chave para superar os desafios do agronegócio brasileiro. Disponível em: https://folhaagricola. com. br/2025/07/23/logistica-inteligente-e-a-chave-para-superar-os-desafios-do-agronegocio-brasileiro/. Acesso em: 20 ago. 2025.
Géron, A. 2019. Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow: Concepts, tools, and techniques to build intelligent systems. 2ed. O’Reilly Media, Sebastopol, CA, USA.
Godoy, A. S. 1995. Pesquisa qualitativa: tipos fundamentais. RAE – Revista de Administração de Empresas 35(3): 20-29.
Hamilton, J. D. 1994. Time Series Analysis. Princeton University Press, Princeton, NJ, USA.
Hodson, T. 2022. Root-mean-square error (RMSE) or mean absolute error (MAE): when to use them or not. Geoscientific Model Development 15: 5481-5489.
Hyndman, R. J.; Athanasopoulos, G. 2018. Forecasting: Principles and practice. 2ed. OTexts, Melbourne, Victoria, Australia.
Joseph, M.; Tackes, J. 2024. Modern Time Series Forecasting with Python. 2ed. Packt Publishing, Birmingham, UK.
Kien, T. T.; Park, M. J.; Yang, H. S. 2024. Comparative study of time series analysis algorithms suitable for short-term forecasting in implementing demand response based on AMI. Sensors 24(22): 7205.
Love, S. 1979. Inventory Control. McGraw-Hill, New York, NY, USA.
Makridakis, S.; Spiliotis, E.; Assimakopoulos, V. 2018. Statistical and machine learning forecasting methods: concerns and ways forward. Plos one 13(3): 1-26.
Makridakis, S.; Wheelwright, S. C.; Hyndman, R. J. 1998. Forecasting: Methods and Applications. 3ed. John Wiley, New York, NY, USA.
Morettin, P. A.; Toloi, C. M. C. 2006. Análise de Séries Temporais. 2ed. Blücher, São Paulo, SP, Brasil.
Muckstadt, J. A. 2005. Analysis and Algorithms for Service Parts Supply Chains. Springer, New York, NY, USA.
Nielsen, A. 2020. Análise Prática de Séries Temporais: Predição com estatística e aprendizado de máquina. Alta Books, Rio de Janeiro, RJ, Brasil.
Oses, C.; Ward, L.; Ceder, G. 2023. Small data machine learning in materials science. npj Computational Materials 9(1).
Rodrigues, G. S. S. C.; Ross, J. L. S. 2020. A Trajetória da Cana-de-Açúcar no Brasil: Perspectivas Geográfica, Histórica e Ambiental. EDUFAL, Maceió, AL, Brasil.
Sherbrooke, C. C. 2004. Optimal Inventory Modeling of Systems: multi-echelon techniques. 2ed. Springer, New York, NY, USA.
Silver, E. A.; Pyke, D. F.; Peterson, R. 1998. Inventory Management and Production Planning and Scheduling. 3ed. Wiley, New York, NY, USA.
Slater, P. 2017. Spare Parts Inventory Management: A complete guide to sparesology®. Industrial Press, New York, NY, USA.
Stephens, M. A. 1974. EDF statistics for goodness of fit and some comparisons. Journal of the American Statistical Association 69(347): 730-737.
Tomiazzi, J. S.; Judai, M. A.; Nai, G. A.; Pereira, D. R.; Antunes, P. A.; Favareto, A. P. A. 2018. Evaluation of genotoxic effects in Brazilian agricultural workers exposed to pesticides and cigarette smoke using machine-learning algorithms. Environmental Science and Pollution Research 25: 1259-1269.
Turrioni, J. B.; Mello, C. F. 2012. Metodologia de Pesquisa em Engenharia de Produção e Gestão de Operações. Editora da UNIFEI, Itajubá, MG, Brasil.
Willmott, C. J.; Matsuura, K.; Robeson, S. M. 2009. Ambiguities inherent in sums-of-squares-based error statistics. Atmospheric Environment 43: 749-752.


Resumo executivo oriundo de Trabalho de Conclusão de Curso de Especialização em Data Science e Analytics do MBA USP/Esalq

Saiba mais sobre o curso; clique aqui:

Quem editou este artigo

Você também pode gostar

Quer ficar por dentro das nossas últimas publicações? Inscreva-se em nossa newsletter!

Receba conteúdos e fique sempre atualizado sobre as novidades em gestão, liderança e carreira com a Revista E&S.

Ao preencher o formulário você está ciente de que podemos enviar comunicações e conteúdos da Revista E&S. Confira nossa Política de Privacidade