Imagem Comparação de Modelos Preditivos Prophet e LSTM para Previsão de Demanda no Varejo

02 de março de 2026

Comparação de Modelos Preditivos Prophet e LSTM para Previsão de Demanda no Varejo

Jorge Luiz Casselhas Junior; Ana Beatriz Pereira Sette

Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.

Este estudo comparou quantitativamente a performance dos modelos de machine learning Prophet e Long Short-Term Memory (LSTM) com uma técnica de previsão ingênua (Naïve Forecast), baseada na última observação da série temporal. O objetivo foi identificar a abordagem mais acurada e robusta para prever a demanda de um produto no varejo supermercadista, utilizando métricas de erro consolidadas. A pesquisa parte da premissa de que a variabilidade da demanda no varejo desafia o controle de estoques e o planejamento financeiro, pois erros de previsão podem levar a rupturas, perdas por perecibilidade ou excesso de mercadorias, impactando a eficiência e a rentabilidade.

A aplicação de técnicas quantitativas para transformar dados históricos em projeções acuradas é fundamental para a gestão moderna, permitindo decisões mais bem fundamentadas (Filho, 2020; Spadini e Alencar, 2022). Contudo, muitas operações de varejo ainda utilizam métodos ingênuos, como replicar as vendas do ciclo anterior, uma prática limitada em contextos dinâmicos por não capturar tendências, sazonalidades e eventos não recorrentes. A imprecisão na previsão de demanda afeta diretamente a cadeia de suprimentos, gerando custos operacionais elevados por capital imobilizado em estoque ou perdas financeiras (Alves, 2016).

Para superar esses desafios, é necessária a adoção de modelos preditivos mais sofisticados. O machine learning oferece ferramentas capazes de modelar relações não lineares e dependências temporais complexas. Modelos como o Prophet, projetado para múltiplas sazonalidades, e as redes neurais LSTM, que capturam dependências de longo prazo, são alternativas promissoras às abordagens tradicionais (Taylor e Letham, 2018; Géron, 2020). A capacidade desses modelos de aprender com dados históricos permite uma alocação mais precisa de recursos, a redução de custos e a prevenção de perdas, gerando ganhos em eficiência, competitividade e satisfação do consumidor.

A literatura recente valida a eficácia dessas abordagens. Spadini e Alencar (2022) destacam a utilidade do Prophet na análise de dados temporais, alinhando-se às necessidades do varejo. A flexibilidade das redes neurais como a LSTM possibilita a detecção de padrões negligenciados por modelos estatísticos, otimizando recursos e projeções de demanda (Bandara et al., 2020). A escolha do modelo adequado, no entanto, depende de fatores como a quantidade e qualidade dos dados e as características do produto (Alencar, 2021). Esta pesquisa justifica-se pela necessidade de uma avaliação empírica e comparativa para guiar gestores do varejo na seleção de ferramentas de previsão. Ao confrontar dois modelos de machine learning com um modelo de base ingênuo, o estudo busca validar a superioridade das técnicas avançadas e oferecer insights sobre qual se adapta melhor a uma série temporal de vendas de um produto de consumo essencial, como o leite.

A pesquisa utilizou uma abordagem quantitativa com delineamento focado em experimentação computacional. A base de dados foi extraída do conjunto “Supermarket Data” da plataforma Kaggle, contendo registros de vendas de um supermercado entre 01 de dezembro de 2023 e 09 de dezembro de 2024. A análise foi delimitada às vendas do produto leite, um item de consumo essencial com demanda frequente, resultando em uma série temporal densa a partir de 6.742 observações transacionais.

O pré-processamento dos dados foi realizado em Python com a biblioteca Pandas. A coluna temporal InvoiceDate foi convertida para o formato datetime, permitindo a agregação das observações transacionais pela soma da quantidade vendida por data. Isso resultou em uma série temporal com periodicidade diária de 375 observações. A partir dela, foram criadas duas granularidades adicionais: uma agregação mensal e uma variável ordinal (semanadomes) para analisar padrões cíclicos intra-mensais. Uma lacuna de 51 dias consecutivos sem registros foi tratada pela imputação da média dos dias completos do mesmo período para preservar a continuidade da série, conforme boas práticas (Wang e Wang, 2020).

As técnicas preditivas centrais foram o Prophet e a LSTM. O Prophet é um modelo aditivo que decompõe a série temporal em componentes de tendência, sazonalidade e feriados, oferecendo alta interpretabilidade e ajuste automático (Taylor e Letham, 2018). A LSTM é uma arquitetura de rede neural recorrente (RNN) que utiliza células de memória com mecanismos de portões para regular o fluxo de informação, permitindo capturar dependências temporais de longo prazo e padrões não lineares complexos, mitigando o problema do desaparecimento do gradiente (Géron, 2020; Bandara et al., 2020).

Para a avaliação dos modelos, a base de dados foi dividida em conjuntos de treino (80%) e teste (20%), respeitando a ordem cronológica. A otimização de hiperparâmetros foi feita com validação cruzada para séries temporais, utilizando janelas deslizantes. O desempenho foi mensurado por quatro indicadores de erro: Erro Absoluto Médio (MAE), Raiz do Erro Quadrático Médio (RMSE), Erro Percentual Absoluto Médio (MAPE) e Erro Absoluto Médio Escalado (MASE) (Hyndman & Koehler, 2006; Makridakis, 1993; Franses, 2016). O MASE foi adotado como métrica principal por sua capacidade de indicar se um modelo é superior a uma previsão de base simples.

A análise descritiva inicial revelou uma média de vendas diárias de 326,09 unidades, com um desvio padrão de 328,91, indicando alta variabilidade. Um valor mínimo de -293, interpretado como devoluções, foi removido da base de modelagem. A amplitude até o máximo de 4.153 reforçou a existência de outliers. A distribuição das vendas por dia da semana demonstrou um padrão sazonal claro, com picos entre quinta-feira e domingo e volumes menores no início da semana, uma informação valiosa para os modelos preditivos.

A análise da curva de vendas mensais acumuladas exibiu um crescimento contínuo, sugerindo uma tendência de consumo estável. Saltos mais intensos na curva podem estar associados a fatores externos como recebimento de salários ou promoções. Essa tendência de crescimento progressivo favorece a aplicação de modelos capazes de modelar tanto a tendência de longo prazo quanto as flutuações sazonais, como o Prophet, e também fornece um sinal forte para modelos baseados em memória, como a LSTM.

Os resultados da validação cruzada para o modelo Prophet indicaram que a melhor configuração (escala de ponto de mudança de 0,5, sazonalidade multiplicativa e semanal ativada) resultou em um MAE de 138,02, RMSE de 172,76, MAPE de 70,40% e um MASE de 0,63. O valor do MASE, sendo inferior a 1, comprova que o Prophet superou o desempenho do modelo ingênuo sazonal. Embora o MAPE tenha sido elevado, sua interpretação requer cautela em séries com alta variabilidade (Alencar, 2021). Portanto, a superioridade demonstrada pelo MASE, uma métrica mais robusta (Hyndman & Koehler, 2006), validou a eficácia do Prophet.

A avaliação do modelo LSTM, realizada com validação cruzada e testando janelas de entrada de 15 e 30 passos, também demonstrou desempenho superior à linha de base. A janela de 30 passos obteve, em média, um resultado ligeiramente melhor. O melhor desempenho foi observado na primeira dobra de validação com um lookback de 30, alcançando um MAE de 117,44, RMSE de 182,60, MAPE de 57,45% e um MASE de 0,44. Todos os valores de MASE obtidos com LSTM foram inferiores a 1, confirmando que a rede neural também superou consistentemente o modelo ingênuo. A variabilidade nos erros entre as dobras sugere que a série temporal possui períodos de maior e menor previsibilidade.

A comparação direta entre os melhores desempenhos de cada modelo validou a hipótese central do estudo: ambos os modelos de machine learning foram substancialmente melhores que a previsão ingênua. No entanto, ao comparar Prophet e LSTM, os resultados indicaram uma superioridade do modelo LSTM para esta série de dados. O LSTM alcançou um MASE de 0,44, enquanto o Prophet obteve 0,63. O LSTM também foi superior nas métricas de MAE (117,44 vs. 138,02) e MAPE (57,45% vs. 70,40%). Este achado sugere que, para a dinâmica de vendas analisada, a capacidade da LSTM de aprender padrões sequenciais complexos e não lineares foi mais eficaz que a abordagem de decomposição do Prophet.

A discussão desses resultados reforça a necessidade de abandonar métodos de previsão simplistas no varejo. Os modelos de machine learning supervisionados, ao incorporarem padrões sazonais e tendências, oferecem uma alternativa robusta (Filho, 2020). A superioridade da LSTM neste caso não invalida o Prophet, mas sugere que a complexidade do modelo deve ser adequada aos dados; em cenários com dependências temporais sutis e não lineares, arquiteturas de deep learning podem oferecer uma vantagem.

A implicação prática desses achados é direta para os gestores do varejo. A adoção de modelos como LSTM ou Prophet pode levar a uma gestão de estoques mais eficiente. Previsões acuradas permitem otimizar os níveis de inventário, reduzindo o risco de rupturas e de excesso de estoque, que imobiliza capital e aumenta custos (Alves, 2016). A capacidade de prever a demanda com menor erro, conforme demonstrado pelos valores de MAE e MASE, traduz-se em decisões de compra mais seguras e econômicas.

Este trabalho valida academicamente o uso de machine learning para previsão de demanda e fornece uma recomendação aplicável. A demonstração de que modelos avançados superam técnicas tradicionais serve como argumento para que empresas invistam em cultura de dados. A escolha entre Prophet e LSTM pode depender de um trade-off entre a interpretabilidade do Prophet e a acurácia potencial da LSTM em séries complexas. Independentemente da escolha, a migração para uma abordagem de previsão orientada por dados é um passo fundamental para a competitividade no varejo.

Em resumo, o estudo confrontou o desempenho dos modelos Prophet e LSTM com uma abordagem ingênua para o desafio da variabilidade da demanda no varejo. A análise demonstrou que ambos os modelos de machine learning superaram a técnica ingênua, com o LSTM apresentando um desempenho preditivo ligeiramente superior para a série de vendas de leite analisada, validado pela métrica MASE. A contribuição prática reside na validação de que a adoção de técnicas de previsão sofisticadas é essencial para otimizar a operação varejista.

Apesar das conclusões, o estudo possui limitações. A análise foi focada em um único produto e supermercado, o que restringe a generalização dos resultados. Adicionalmente, a lacuna de 51 dias na série temporal foi tratada com imputação pela média, o que pode ter suavizado a variabilidade dos dados. Pesquisas futuras poderiam expandir a metodologia para mais produtos e lojas. Conclui-se que o objetivo foi atingido: demonstrou-se que os modelos de machine learning, Prophet e LSTM, superam a acurácia de previsões ingênuas para a demanda no varejo, com o modelo LSTM apresentando o desempenho preditivo mais robusto para a série de dados analisada.

Referências:
Alencar, V. C. (2021). Time series forecasting: Prophet é mesmo um profeta? Medium.
Alves, S. N. J. (2016). Análise de aplicação de técnicas de Data Science para CRM em ambiente bancário [Trabalho de Conclusão de Curso, Universidade de São Paulo]. Biblioteca Digital de Trabalhos Acadêmicos da USP.
Bandara, K., Bergmeir, C., & Smyl, S. (2020). Forecasting across time series databases using recurrent neural networks on groups of similar series: A clustering approach. Expert Systems with Applications, 140, 112896.
Filho, M. (2020). Manual prático de Data Science. Amazon.
Franses, P. H. (2016). A note on the Mean Absolute Scaled Error. International Journal of Forecasting.
Géron, A. (2020). Mãos à obra: Aprendizado de máquina com Scikit-Learn, Keras e TensorFlow (2ª ed.). São Paulo: Alta Books.
Gil, A. C. (2019). Métodos e técnicas de pesquisa social (7ª ed.). São Paulo: Atlas.
Hyndman, R. J., & Koehler, A. B. (2006). Another look at measures of forecast accuracy. International Journal of Forecasting, 22(4), 679–688.
Makridakis, S. (1993). Accuracy measures: theoretical and practical concerns. International Journal of Forecasting, 9(4), 527-529.
Spadini, A., & Alencar, V. (2022). Séries temporais com Prophet: Análise e previsão de dados com Python. São Paulo: Casa do Código.
Taylor, S. J., & Letham, B. (2018). Forecasting at scale. The American Statistician, 72(1), 37–45. https://doi. org/10.1080/00031305.2017.1380080
Wang, X., & Wang, C. (2020). Time series data cleaning with regular and irregular time intervals. arXiv preprint arXiv:2006.04352.

Resumo executivo oriundo de Trabalho de Conclusão de Curso de Especialização em Data Science e Analytics do MBA USP/Esalq

Saiba mais sobre o curso; clique aqui:

Quem editou este artigo

Você também pode gostar

Quer ficar por dentro das nossas últimas publicações? Inscreva-se em nossa newsletter!

Receba conteúdos e fique sempre atualizado sobre as novidades em gestão, liderança e carreira com a Revista E&S.

Ao preencher o formulário você está ciente de que podemos enviar comunicações e conteúdos da Revista E&S. Confira nossa Política de Privacidade