Imagem Comparativo de modelos preditivos para vendas em plataformas de delivery de dark kitchens

23 de fevereiro de 2026

Comparativo de modelos preditivos para vendas em plataformas de delivery de dark kitchens

Mariana Scudeller Vicentini; Wallace Gusmão Ferreira

Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.

Este estudo comparou modelos preditivos de séries temporais (simples, clássicos e avançados) para prever vendas em plataformas de delivery compostas exclusivamente por “dark kitchens”. O objetivo foi determinar a abordagem mais adequada para este ambiente de negócios dinâmico e volátil, selecionando os modelos mais eficazes através de uma análise comparativa de métricas de erro, visando fornecer uma base metodológica para a otimização de operações em um segmento de mercado em expansão.

O setor de “food service” no Brasil cresceu, atingindo R$ 260,9 bilhões em vendas em 2024, um aumento de 10,4% (Associação Brasileira da Indústria de Alimentos [ABIA], 2024). O segmento de delivery expandiu-se, com 71% dos estabelecimentos de alimentação utilizando o serviço, dos quais 78% operam via plataformas digitais (Associação Brasileira de Bares e Restaurantes [ABRASEL], 2025). Este cenário impulsionou as “dark kitchens”, que operam exclusivamente para entrega, destacando-se pelos custos operacionais reduzidos e maior competitividade (da Cunha et al., 2024). Embora a quantificação seja limitada, um estudo de Hakim et al. (2023) identificou que aproximadamente 27% dos estabelecimentos em plataformas de delivery no país se enquadravam nesta categoria, com preços inferiores aos de restaurantes tradicionais.

Plataformas digitais operam em ambientes de alta complexidade e volatilidade, que demandam capacidades de previsão avançadas e escaláveis (Chowdhury et al., 2025). Uma previsão de vendas acurada é fundamental para a gestão estratégica, amparando decisões sobre alocação de recursos e planejamento operacional (Ahaggach et al., 2024). Os benefícios da modelagem preditiva impactam o setor financeiro (estimativa de lucros), o marketing (campanhas direcionadas) e as operações (planejamento de estoque e logística) (Panda e Mohanty, 2023; Chowdhury et al., 2025). A antecipação da demanda permite também uma melhor compreensão do comportamento do consumidor, possibilitando ações de marketing personalizadas (Ahaggach et al., 2024).

Uma previsibilidade de vendas precisa resulta na mitigação de riscos, impactando a lucratividade e a satisfação do cliente (Chowdhury et al., 2025; Panda e Mohanty, 2023). No contexto das plataformas de entrega de comida, as vantagens incluem a otimização de rotas e a alocação de entregadores, reduzindo tempo ocioso e custos (Bhat e Gillani, 2024). As projeções de mercado indicam um aumento de 28,2% no número de usuários de entrega de refeições em 2025, podendo alcançar 2,5 bilhões de pessoas globalmente até 2030 (Statista, 2025). As “dark kitchens” podem movimentar até US$ 1,5 trilhão mundialmente até 2050 (Euromonitor, 2019), reforçando a urgência de estudos sobre previsão de demanda neste segmento.

Dada a escassez de pesquisas focadas na previsão de vendas para plataformas de “dark kitchens”, este estudo busca preencher essa lacuna. A operação integralmente online desses estabelecimentos é um ponto crítico para a dinâmica dos marketplaces, e sua inclusão na análise preditiva é fundamental para a gestão da plataforma. A investigação, portanto, avalia a viabilidade da previsão neste ambiente complexo e compara sistematicamente o desempenho de diferentes classes de modelos, dos simples aos sofisticados, para identificar as ferramentas mais robustas para este desafio.

O estudo quantitativo utilizou uma base de dados retrospectiva de vendas diárias do Kaggle (2024), abrangendo o período de 2020 a 2023. O conjunto de dados continha exclusivamente históricos de vendas de “dark kitchens”. Após análise exploratória, que revelou lacunas nos dados de restaurantes individuais, optou-se por agregar a totalidade das vendas da plataforma “E”, que apresentava o maior volume de transações e um registro contínuo. Os dados de 2024 foram excluídos por estarem incompletos. A análise foi realizada em Python v.3.10.11, com as bibliotecas Pandas, NumPy, StatsModels, Scikit-learn, XGBoost, TensorFlow e Optuna.

A metodologia iniciou-se com a preparação dos dados, focando nas variáveis de data e quantidade vendida. Para investigar a sazonalidade semanal, realizou-se o teste de Kruskal-Wallis, pois os dados não apresentaram normalidade (teste de Shapiro-Wilk) (Mann, 2015). A estacionariedade da série temporal foi avaliada pelos testes Augmented Dickey-Fuller (ADF) e Kwiatkowski-Phillips-Schmidt-Shin (KPSS). A análise de autocorrelação (ACF) e autocorrelação parcial (PACF) foi empregada para identificar a dependência temporal e auxiliar na parametrização de modelos como o ARIMA (Oliveira et al., 2025). A escolha dos modelos seguiu a sugestão de Ahaggach et al. (2024) de comparar diferentes níveis de complexidade.

Os modelos avaliados foram divididos em três categorias. A primeira incluiu modelos simples (naive, naive sazonal, média e drift) como benchmarks de referência (Hyndman e Athanasopoulos, 2021). A segunda categoria abrangeu modelos clássicos: Suavização Exponencial (SE) e ARIMA. Para a SE, utilizou-se a abordagem ETS para testar combinações de tendência e sazonalidade (Gonzaga, 2017); para o ARIMA, a biblioteca pmdarima identificou a melhor configuração de parâmetros (p, d, q), e o teste de Ljung-Box validou a adequação do modelo. A terceira categoria consistiu em modelos avançados de aprendizado de máquina e profundo, que não exigem premissas sobre a estrutura da série (Oliveira et al., 2025). Foram selecionados Random Forest (Breiman, 2001), Long Short-Term Memory (LSTM) (Siami-Namini et al., 2019) e XGBoost (Chen e Guestrin, 2016), com base em sua eficácia demonstrada no setor.

Para aprimorar os modelos avançados, aplicou-se a otimização de hiperparâmetros com a biblioteca Optuna, um framework que automatiza a busca pela melhor configuração (Akiba et al., 2019). O desempenho de todos os modelos foi avaliado em um conjunto de teste (10% dos dados, 146 dias), com os 90% restantes (1324 dias) usados para treinamento. A comparação utilizou quatro métricas de erro: Erro Percentual Absoluto Médio (MAPE), Erro Percentual Absoluto Médio Simétrico (sMAPE), Erro Médio Absoluto (MAE) e Raiz do Erro Quadrático Médio (RMSE). Essas métricas oferecem diferentes perspectivas sobre a acurácia, desde a magnitude do erro (MAE, RMSE) até o erro percentual (MAPE, sMAPE), permitindo uma avaliação completa (Hyndman e Athanasopoulos, 2021).

A análise exploratória revelou variações significativas nas vendas mensais sem uma tendência clara. Junho de 2020, por exemplo, teve queda nas vendas, enquanto nos anos seguintes o mesmo mês mostrou crescimento. A agregação por dia da semana sugeriu um pico às sextas-feiras, mas o padrão não se repetiu consistentemente. O teste de Kruskal-Wallis (p-valor = 0,9794) confirmou a ausência de diferença significativa nas vendas entre os dias da semana. A análise descritiva mostrou que os dados diários possuíam menor variabilidade (desvio padrão de 17,90) em comparação com os semanais (98,25) e mensais (342,09), justificando a escolha da granularidade diária para a modelagem.

Os testes de estacionariedade confirmaram que a série de vendas diárias era estacionária (p-valores de 1,53 no ADF e 0,10 no KPSS), eliminando a necessidade de diferenciação. A análise de ACF e PACF revelou correlação significativa com o dia anterior (lag 1) e um pico no lag 6, sugerindo um ciclo de seis dias, padrão utilizado para configurar os modelos sazonais. Entre os modelos simples, o de Média teve o melhor desempenho (MAPE de 36,08%, MAE de 14,81), estabelecendo o benchmark inicial. O modelo Drift teve o pior desempenho (MAPE de 48,91%).

Na categoria de modelos clássicos, Suavização Exponencial Simples (SES) e ETS apresentaram resultados quase idênticos (MAPE de 39,85%, MAE de 23,11), pois a melhor configuração para o ETS foi um modelo sem tendência e sazonalidade, equivalente ao SES. O modelo ARIMA, otimizado para uma configuração SARIMA (1, 0, 2) (1, 0, 0), obteve um MAPE de 34,05% e um MAE de 14,86. Este resultado foi marginalmente superior ao modelo de Média, indicando uma vantagem preditiva limitada. A validade do SARIMA foi confirmada pelo teste de Ljung-Box nos resíduos (p-valor de 0,94).

Os modelos avançados obtiveram os resultados mais promissores. Antes da otimização, o Random Forest já se destacava com um MAPE de 23,16% e um MAE de 10,98. O XGBoost e o LSTM também superaram os modelos clássicos, com MAEs de 12,39 e 11,30, respectivamente. A otimização de hiperparâmetros com Optuna foi uma etapa crucial, aprimorando o desempenho de todos os modelos avançados. O XGBoost otimizado reduziu seu MAE para 10,94, e o LSTM otimizado alcançou um MAE de 10,93. Contudo, o modelo com melhor desempenho geral foi o Random Forest otimizado, que alcançou um MAPE de 23,42%, sMAPE de 20,06%, MAE de 10,68 e RMSE de 13,81.

A superioridade dos modelos de aprendizado de máquina corrobora com as conclusões de Chowdhury et al. (2025), que destacam a maior adaptabilidade dessas abordagens em cenários de vendas complexos. Enquanto modelos clássicos são úteis para demandas estáveis, o ambiente dinâmico das plataformas de delivery exige modelos capazes de capturar padrões não lineares, característica de algoritmos como Random Forest e LSTM (Ahaggach et al., 2024). O MAPE de aproximadamente 23% obtido é considerado aceitável para mercados voláteis como o de alimentos; valores na faixa de 20% são comuns (Shukla e Jharkharia, 2013). O MAE de 10,68 representa um erro médio de 11 vendas diárias, resultado competitivo em comparação a outros estudos do setor (Panda e Mohanty, 2023).

A análise comparativa demonstra que, para a previsão de vendas em plataformas de “dark kitchens”, os modelos avançados oferecem uma vantagem preditiva substancial. A complexidade do serviço, com variáveis externas não modeladas (feriados, clima, promoções) e alta volatilidade, torna os modelos clássicos menos eficazes. A capacidade dos modelos de aprendizado de máquina de aprender com os dados sem premissas rígidas sobre sua estrutura confere-lhes maior robustez.

Apesar das limitações (ausência de variáveis externas, uso de base de dados internacional), este estudo fornece insights metodológicos valiosos como guia para gestores e pesquisadores. A constatação de que 35% dos serviços de alimentação em uma plataforma de delivery em São Paulo são “dark kitchens” (Hakim et al., 2023) sublinha a relevância desses achados para o mercado brasileiro. A previsibilidade assertiva é um pilar para a sustentabilidade dessas plataformas, e a escolha da ferramenta de modelagem correta é um passo fundamental.

Em suma, este estudo comparou sistematicamente diferentes classes de modelos para prever vendas em plataformas de delivery de “dark kitchens”. A análise revelou que os modelos avançados de aprendizado de máquina superam significativamente os métodos simples e clássicos. O modelo Random Forest, com hiperparâmetros otimizados via Optuna, destacou-se como a abordagem mais eficaz. A otimização de hiperparâmetros provou ser fundamental para maximizar a performance dos modelos avançados, reforçando a importância da calibração em problemas de previsão complexos. As implicações práticas são diretas: previsões acuradas permitem alocação eficiente de entregadores, ações de marketing pontuais e otimização da lucratividade. Dada a crescente prevalência de “dark kitchens”, prever a demanda para este segmento é crucial. Embora a pesquisa apresente limitações, estabelece uma base para estudos futuros que podem incorporar outros fatores e algoritmos. Conclui-se que o objetivo foi atingido: demonstrou-se que modelos avançados de aprendizado de máquina, especialmente o Random Forest otimizado, apresentam desempenho superior na previsão de vendas em plataformas de delivery compostas por dark kitchens em comparação com métodos simples e clássicos.

Referências:
Ahaggach, H.; Abrouk, L.; Lebon, E. 2024. Systematic Mapping Study of Sales Forecasting: Methods, Trends, and Future Directions. Forecasting 6(3): 502-532.
Akiba, T.; Sano, S.; Yanase, T.; Ohta, T.; Koyama, M. 2019. Optuna: A next-generation hyperparameter optimization framework. In: Proceedings of the 25th ACM SIGKDD international conference on knowledge discovery & data mining, 2019, Anchorage, AL, USA. Anais… p. 2623-2631.
Associação Brasileira da Indústria de Alimentos [ABIA]. 2024. Balanço econômico da indústria de alimentos e bebidas – 2024. Disponível em: <https://intranet. abia. org. br/vsn/temp/z2025221OnePage25web. pdf>. Acesso em: 16 jun. 2025.
Associação Brasileira de Bares e Restaurantes [ABRASEL]. 2025. Evolução do delivery no Brasil: painel do 37º Congresso Abrasel. Disponível em: <https://abrasel. com. br/noticias/noticias/evolucao-delivery-brasil-painel-37-congresso-abrasel-saiba-como-participar/>. Acesso em: 20 ago. 2025.
Bhat, R. L.; Gillani, I. A. 2024. Demand Prediction in Online Food Delivery Platforms Using Graph Neural Networks. In: Proceedings of the 8th International Conference on Data Science and Management of Data, 2024, Bangalore, India. Anais… p. 323-325.
Breiman, L. 2001. Random forests. Machine Learning 45(1): 5-32.
Chen, T.; Guestrin, C. 2016. Xgboost: A scalable tree boosting system. In: Proceedings of the 22nd acm sigkdd international conference on knowledge discovery and data mining, 2016, San Francisco, CA, USA. Anais… p. 785-794.
Chowdhury, A. R.; Paul, R.; Rozony, F. Z. 2025. A systematic review of demand forecasting models for retail e-commerce enhancing accuracy in inventory and delivery planning. International Journal of Scientific Interdisciplinary Research 6(1): 01-27.
Crivellari, A.; Beinat, E.; Caetano, S.; Seydoux, A.; Cardoso, T. 2022. Regressor CNN-LSTM multialvo para prever a distribuição urbana da demanda por entrega de alimentos em curto prazo. Journal of Business Research 144: 844-853.
Da Cunha, D. T., Hakim, M. P., Alves, M. M., Vicentini, M. S., & Wiśniewska, M. Z. (2024). Dark kitchens: Origin, definition, and perspectives of an emerging food sector. International Journal of Gastronomy and Food Science, 35, 100884.
Esmailizade, S.; Ebrahimi, A.; Soltani, H.; Sam, A.; Rahimi, M. 2024. Machine Learning Approaches for Retail Forecasting: A Study on XGBoost and Time-Series Models. Authorea Preprints, 1-10.
Euromonitor. 2019. Ghost Kitchens, Virtual Restaurants, and a Delivery-Optimized Future | Market Research Report. Disponível em: <https://www. euromonitor. com/ghost-kitchens-virtual-restaurants-and-a-delivery-optimized-future/report>. Acesso em: 22 set. 2025.
Evers, J. M.; Tavasszy, L. A.; van Duin, J. H. R.; Schott, D. L.; Gorte, F. B. 2018. Demand forecast models for online supermarkets. In E-groceries, digitalization and sustainability: Which governance, planning and regulation mix do our cities need? 1-12.
Gonzaga, S. T. 2017. Curso de Séries Temporais. Instituto Brasileiro de Petróleo, Gás e Biocombustíveis [IBPAD]. Disponível em: <https://s3. ibpad. com. br/seriestemporais/>. Acesso em: 01 set. 2025.
Hakim, M. P., Libera, V. M. D., Zanetta, L. D. A., Stedefeldt, E., Zanin, L. M., Soon-Sinclair, J. M., … & Da Cunha, D. T. (2023). Exploring dark kitchens in Brazilian urban centres: A study of delivery-only restaurants with food delivery apps. Food Research International, 170, 112969.
Hyndman, R. J.; Athanasopoulos, G. 2021. Forecasting: principles and practice. 3. ed. OTexts, Melbourne, Australia. Disponível em: <https://otexts. com/fpp3/>. Acesso em: 01 set. 2025.
Kaggle. 2024. Multi-brand food sales production data. Disponível em: <https://www. kaggle. com/datasets/dimagigayanika/multi-brand-food-sales-prodution-data>. Acesso em: 20 ago. 2025.
Kim, S.; Kim, H. 2016. A new metric of absolute percentage error for intermittent demand forecasts. International Journal of Forecasting 32(3): 669-679.
Luhtala, R. 2023. Quantifying the effects of external predictors on food delivery platform order volumes. Master’s Programme in Industrial Engineering and Management. Aalto University School of Science, Finland, Espoo.
Mann, P. S. 2015. Introdução à estatística. 8ed. Livros Técnicos e Científicos, Rio de Janeiro, RJ, Brasil.
Morettin, P. A.; Toloi, C. M. C. 200

Resumo executivo oriundo de Trabalho de Conclusão de Curso de Especialização em Data Science e Analytics do MBA USP/Esalq

Saiba mais sobre o curso; clique aqui:

Quem editou este artigo

Você também pode gostar

Quer ficar por dentro das nossas últimas publicações? Inscreva-se em nossa newsletter!

Receba conteúdos e fique sempre atualizado sobre as novidades em gestão, liderança e carreira com a Revista E&S.

Ao preencher o formulário você está ciente de que podemos enviar comunicações e conteúdos da Revista E&S. Confira nossa Política de Privacidade