
08 de janeiro de 2026
Modelo hierárquico para previsão de demanda com abordagem estatística híbrida
Autor: Samuel Melo Bandeira — Orientadora: Luiz Gustavo Antonio De Souza
Este trabalho desenvolveu e implementou um modelo hierárquico de previsão de demanda, com abordagem estatística híbrida, para o processo de Sales and Operations Planning (S&OP) de uma empresa metalmecânica. O modelo opera na granularidade de Unidade Federativa (UF) por hierarquia de produto de 11 dígitos (H11d) com horizonte selecionável. A pesquisa investigou se uma arquitetura que combina técnicas estatísticas segmentadas pela morfologia das séries temporais poderia gerar previsões com qualidade tática, demonstrando coerência entre níveis hierárquicos e servindo como o “primeiro número” quantitativo para o ciclo de S&OP. A abordagem foi univariada, com ênfase em explicabilidade e auditabilidade para garantir a aceitação gerencial.
O modelo aborda o desafio de alinhar projeções de vendas com capacidades operacionais, função central do S&OP, onde a qualidade da previsão de demanda é um pilar para o sucesso, conforme destacam Grimson e Pyke (2007). Em cenários de alta complexidade, com vasto portfólio e distribuição nacional, a previsão é crítica. A abordagem hierárquica, defendida por Hyndman e Athanasopoulos (2021), é adequada para este contexto, permitindo que previsões detalhadas (UF × H11d) sejam reconciliadas para garantir consistência em níveis agregados, cruciais para o planejamento. A estrutura H11d, que concatena os níveis de taxonomia de produto (Família, Linha, Grupo, Tipo de material e Espessura), viabiliza essa análise granular.
A complexidade reside na diversidade de padrões de demanda do portfólio: produtos com vendas estáveis, sazonais, com tendência, voláteis e com demanda intermitente. Isso torna uma abordagem de modelo único (one-size-fits-all) ineficaz. A hipótese central do estudo é que uma arquitetura híbrida, que classifica cada série temporal por sua morfologia e aplica o modelo estatístico mais apropriado, oferece desempenho superior. Essa segmentação alinha a prática gerencial com a evidência estatística (Christopher, 2016), tratando cada padrão de demanda com a ferramenta adequada.
A abordagem univariada possui limitações reconhecidas, pois não incorpora variáveis causais externas, como ações de marketing ou indicadores macroeconômicos, tornando-a menos reativa a choques exógenos. Sua eficácia também depende da qualidade e extensão dos dados históricos, sendo um desafio para séries curtas. Contudo, a escolha priorizou parcimônia, robustez computacional e reprodutibilidade, características essenciais para um pipeline de execução rotineira e cujos resultados devem ser facilmente interpretados e auditados pelos planejadores no ciclo de S&OP.
O pipeline desenvolvido não substitui o julgamento humano, mas fornece um balizador quantitativo rigoroso. Ao gerar o “primeiro número” de forma automatizada, o modelo libera os planejadores para se concentrarem em análises de valor agregado, como a incorporação de inteligência de mercado, em vez de cálculos manuais. A estrutura supervisionada do algoritmo, com logs detalhados e saídas gráficas, permite rastrear cada etapa do processo, desde a classificação da série até a previsão final, garantindo transparência e facilitando o diagnóstico de desvios.
A metodologia quantitativa e aplicada foi estruturada em múltiplos estágios. O conjunto de dados compreendeu o histórico de vendas mensais de 2023 a 2025, na granularidade UF × H11d. As variáveis primárias foram data, UF, código H11d e volume de vendas. O pré-processamento incluiu limpeza de dados, tratamento de valores ausentes e padronização. A partir da data, foram derivadas variáveis de calendário como preditores.
Um pilar da metodologia foi a segmentação das séries temporais por duas óticas: importância para o negócio (análise ABC) e padrão de comportamento (classificação morfológica). A análise ABC priorizou itens por volume, valor e frequência. A classificação morfológica categorizou cada série (UF × H11d) como estável, sazonal, com tendência, volátil ou intermitente, usando critérios estatísticos objetivos: razão de zeros e intervalo médio entre vendas para intermitência; coeficiente de variação para volatilidade; autocorrelação no lag 12 para sazonalidade; e o teste de Mann-Kendall para tendências (Mann, 1945; Kendall, 1975). Essa dupla segmentação permitiu rotas de modelagem específicas.
A arquitetura de modelagem foi híbrida e adaptativa. Para séries sazonais e/ou voláteis, empregou-se o método de suavização exponencial ETS (Holt-Winters), com seleção automática da melhor configuração via Critério de Informação de Akaike (AIC) para evitar sobreajuste (Akaike, 1974). Para séries intermitentes, aplicou-se o método de Croston com a correção de Syntetos-Boylan (SBA), projetado para demandas esparsas e que reduz o viés do estimador original (Croston, 1972; Syntetos; Boylan, 2005). Para séries estáveis com histórico suficiente, foram estimados modelos lineares de efeitos mistos (MixedLM), que capturam heterogeneidade entre grupos enquanto compartilham informações (Laird; Ware, 1982), com a variável de resposta transformada pela técnica de Yeo-Johnson para aderência às premissas de normalidade (Yeo; Johnson, 2000). Para séries com tendências claras, utilizou-se regressão polinomial.
Para aumentar a robustez, foram implementados mecanismos de controle. A recalibração por Mínimos Quadrados Ponderados (WLS) foi aplicada quando o teste de Breusch-Pagan (Breusch; Pagan, 1979) indicava heterocedasticidade. A variância dos resíduos foi suavizada com LOWESS (Cleveland, 1979) para obter pesos estáveis. Limites superiores (caps), baseados em percentis do histórico, foram definidos para evitar projeções irrealistas. A projeção futura utilizou uma reconciliação hierárquica que combinou o sinal de crescimento ano-contra-ano (YOY) com uma média móvel recente, garantindo consistência nos níveis agregados (Hyndman; Ahmed; Athanasopoulos; Shang, 2011). A validação do modelo foi feita por corte temporal, com dados de treino e teste separados. A métrica primária foi o Weighted Absolute Percentage Error (WAPE), complementado por MAPE, RMSE, MAE e R². O diagnóstico de resíduos incluiu o teste de Shapiro-Wilk para normalidade (Shapiro; Wilk, 1965).
Os resultados da validação do pipeline demonstraram a eficácia da abordagem híbrida para o S&OP. O pipeline gerou previsões para um horizonte de seis meses para todas as séries elegíveis. O desempenho global foi satisfatório, alcançando um Weighted Absolute Percentage Error (WAPE) agregado de aproximadamente 38% e um coeficiente de determinação (R²) de cerca de 0,74. Este R² indica que 74% da variabilidade nas vendas foi explicada pelo modelo, um resultado robusto para uma abordagem univariada. O WAPE, ao ponderar os erros pelo volume, oferece uma medida de impacto no negócio mais representativa que o MAPE.
A análise de desempenho por morfologia confirmou a hipótese da segmentação. Séries estáveis e sazonais apresentaram os menores erros, respondendo bem ao modelo ETS/Holt-Winters, conforme a teoria de Hyndman e Athanasopoulos (2021). Para séries intermitentes, o método de Croston com ajuste SBA foi superior a alternativas simples, reduzindo a superestimação comum em demandas esparsas (Syntetos; Boylan, 2005). Embora o erro percentual nessas séries tenha sido mais elevado, o modelo projetou um nível médio de demanda mais realista. Nas carteiras voláteis, a combinação de Holt-Winters com limites (caps) foi crucial para gerar projeções mais estáveis e conservadoras.
O diagnóstico dos resíduos revelou heterocedasticidade, com a dispersão dos erros aumentando para volumes de venda maiores. Este achado, confirmado estatisticamente pelo teste de Breusch-Pagan (Breusch; Pagan, 1979), justificou a recalibração por Mínimos Quadrados Ponderados (WLS), que melhorou a precisão dos coeficientes e resultou em uma distribuição de resíduos mais homogênea. A análise dos gráficos de “Real vs. Predito” mostrou boa aderência global e destacou a necessidade dos limites (caps) para conter extrapolações em séries com rupturas estruturais, atuando como um mecanismo de segurança.
A projeção hierárquica, combinando o sinal YOY com médias recentes, foi fundamental para a coerência entre os níveis da estrutura de produto e geográfica, um requisito para o planejamento integrado do S&OP (Hyndman; Ahmed; Athanasopoulos; Shang, 2011). A análise de sensibilidade demonstrou que os parâmetros do modelo poderiam ser ajustados para tornar as previsões mais reativas ou conservadoras, oferecendo flexibilidade. A utilidade prática foi evidenciada pelo uso das previsões como base objetiva para metas comerciais, programação da produção e dimensionamento logístico. A rastreabilidade do processo aumentou a confiança dos usuários, permitindo-lhes entender a geração das previsões e identificar séries que exigiam análise qualitativa.
As limitações da abordagem também foram confirmadas. O erro foi maior em carteiras com alta intermitência ou volatilidade, onde o passado é um preditor menos confiável. A natureza univariada impede a antecipação de eventos externos não refletidos no histórico. A dependência de um histórico de dados longo e de boa qualidade também se mostrou um fator crítico, especialmente para os modelos mais complexos.
Em síntese, os resultados validaram a arquitetura proposta como uma ferramenta robusta para o planejamento tático. O equilíbrio entre a sofisticação estatística (modelagem por morfologia, WLS, MixedLM) e os controles operacionais pragmáticos (caps, reconciliação hierárquica) provou ser uma combinação poderosa. O pipeline entregou previsões que atingiram um nível de acurácia aceitável e foram coerentes, explicáveis e auditáveis, cumprindo os requisitos para servir como o “primeiro número” do processo de S&OP.
Este estudo conclui que a implementação de um pipeline estatístico híbrido e hierárquico para previsão de demanda é uma abordagem viável e eficaz para apoiar o processo de S&OP em uma empresa com portfólio complexo. A metodologia, que combinou segmentação de séries, aplicação de modelos estatísticos específicos e controles operacionais robustos, gerou previsões com acurácia tática relevante, medida pelo WAPE de aproximadamente 38% e R² de 0,74. As previsões mostraram-se coerentes entre os níveis hierárquicos e estáveis para servirem como balizador quantitativo.
As contribuições práticas do trabalho são diretas: o pipeline automatizado fornece um ponto de partida objetivo para o planejamento de demanda, apoiando metas comerciais, programação da produção e dimensionamento logístico por UF. Ao reduzir a subjetividade e o esforço manual, o modelo eleva a qualidade do processo de S&OP. As recomendações operacionais incluem a revisão contínua das carteiras mais voláteis e intermitentes, com foco nos itens de maior impacto (top ABC), e a manutenção das políticas de recalibração (WLS) e limites (caps) para garantir a robustez do sistema. Conclui-se que o objetivo foi atingido: desenvolveu-se e implementou-se um modelo hierárquico de previsão de demanda, de abordagem estatística híbrida, que entregou previsões com qualidade tática (WAPE ≈ 38% e R² ≈ 0,74), coerentes entre níveis e úteis como balizador quantitativo para o processo de S&OP.
Referências:
Akaike, H. 1974. A new look at the statistical model identification. IEEE Transactions on Automatic Control 19(6): 716–723.
Breusch, T. S.; Pagan, A. R. 1979. A simple test for heteroscedasticity and random coefficient variation. Econometrica 47(5): 1287–1294.
Christopher, M. 2016. Logistics & Supply Chain Management. 5. ed. Pearson, Harlow, Reino Unido.
Cleveland, W. S. 1979. Robust locally weighted regression and smoothing scatterplots. Journal of the American Statistical Association 74(368): 829–836.
Croston, J. D. 1972. Forecasting and stock control for intermittent demands. Operational Research Quarterly 23(3): 289–303.
Grimson, J. A.; Pyke, D. F. 2007. Sales and operations planning: an exploratory study and framework. Production and Operations Management 16(3): 454–469.
Hyndman, R. J.; Ahmed, R. A.; Athanasopoulos, G.; Shang, H. L. 2011. Optimal combination forecasts for hierarchical time series. Computational Statistics & Data Analysis 55(9): 2579–2589.
Hyndman, R. J.; Athanasopoulos, G. 2021. Forecasting: Principles and Practice. 3. ed. OTexts, Melbourne, Austrália.
Kendall, M. G. 1975. Rank Correlation Methods. 4. ed. Charles Griffin, London, Reino Unido.
Laird, N. M.; Ware, J. H. 1982. Random-effects models for longitudinal data. Biometrics 38(4): 963–974.
Mann, H. B. 1945. Nonparametric tests against trend. Econometrica 13(3): 245–259.
Shapiro, S. S.; Wilk, M. B. 1965. An analysis of variance test for normality (complete samples). Biometrika 52(3/4): 591–611.
Syntetos, A. A.; Boylan, J. E. 2005. On the accuracy of intermittent demand estimates. International Journal of Forecasting 21(2): 303–314.
Yeo, I.-K.; Johnson, R. A. 2000. A new family of power transformations to improve normality or symmetry. Biometrika 87(4): 954–959.
Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.
Resumo executivo oriundo de Trabalho de Conclusão de Curso de Especialização em Data Science e Analytics do MBA USP/Esalq
Saiba mais sobre o curso; clique aqui:





































