Imagem Aplicação de modelos preditivos para estimativa de vendas em farmácias independentes

16 de janeiro de 2026

Aplicação de modelos preditivos para estimativa de vendas em farmácias independentes

Autor(a): Lucas Andrade Pereira — Orientador(a): Anaximandro Anderson Pereira Melo de Souza

Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.

O mercado farmacêutico brasileiro é dominado por farmácias independentes, que representam oito em cada dez estabelecimentos (ABRADILAN, 2024). Nesse contexto, nove em cada dez farmácias que fecham são independentes, com a sobrevivência dependendo mais da inteligência de negócio do que do porte (SBVC, 2024). A inteligência de negócio abrange diversas áreas, mas a previsão de demanda é a base para o planejamento estratégico, pois suas projeções influenciam diretamente as decisões de compras, o fluxo de caixa, a alocação de pessoal e até mesmo as estratégias de marketing e precificação (Martins; Strambi, 2021). Farmácias independentes têm a vantagem da flexibilidade para adaptar seu mix de produtos às necessidades específicas da comunidade local, algo que grandes redes, com portfólios padronizados, têm mais dificuldade em fazer (ABRADILAN, 2024).

Modelos quantitativos, que analisam sistematicamente os históricos de vendas, permitem alinhar os níveis de estoque às flutuações de consumo, evitando tanto os custos de excesso de inventário quanto as perdas de oportunidade por falta de produto (SBVC, 2024).

A análise de séries temporais, definida como uma sequência de dados cronologicamente organizados onde existe uma dependência estatística entre seus valores, oferece as ferramentas matemáticas e estatísticas necessárias para essa tarefa, permitindo a extração de padrões e a projeção de comportamentos futuros (Box, Jenkins e Reinsel, 1994). Apesar da crescente disponibilidade de dados de vendas por meio de sistemas de ponto de venda (PDV), muitas empresas de pequeno porte ainda utilizam modelos qualitativos, baseados em intuição, opiniões de especialistas ou na experiência do proprietário, devido a limitações de recursos, tempo e pessoal especializado (Mourão et al., 2017). Em contraste, técnicas quantitativas usam modelos matemáticos para projetar a demanda a partir do comportamento passado, decompondo a série temporal em seus componentes fundamentais, como tendência (o movimento de longo prazo), sazonalidade (padrões que se repetem em períodos fixos, como anualmente) e ruído aleatório (Lage Júnior, 2019).

É uma abordagem de implementação relativamente simples e intuitiva, o que a torna atraente para aplicações práticas (Holt, 2004). Sua capacidade de modelar estruturas de dependência temporal complexas o torna particularmente útil em contextos com padrões cíclicos bem definidos (Da Veiga; Da Veiga; Tortato, 2016). A metodologia caracteriza a pesquisa como aplicada, pois seu propósito é a geração de conhecimento para a solução de um problema prático e imediato: a otimização da gestão de estoques de uma farmácia (Prodanov e Freitas, 2013). O estudo, conduzido em uma farmácia de pequeno porte em Bauru-SP, é também exploratório, pois busca aprofundar a compreensão sobre os padrões de demanda de uma categoria específica de produtos, identificando o modelo preditivo mais adequado para essa realidade, sobre a qual havia pouco conhecimento formalizado (Lakatos e Marconi, 2011).

Foram empregadas técnicas estatísticas para tratar os dados, modelar a série temporal e medir objetivamente a precisão dos modelos de previsão, utilizando métricas de erro padronizadas (Fonseca, 2012). O processo metodológico iniciou com a coleta de dados brutos do sistema de gestão da farmácia, abrangendo o período de outubro de 2022 a junho de 2025. Esta etapa envolveu a extração de todos os registros de vendas, contendo informações sobre o produto, a quantidade vendida e a data da transação. O tratamento dos dados foi uma fase crucial, incluindo a verificação e remoção de registros duplicados, o tratamento de valores ausentes (embora não tenham sido encontrados neste conjunto de dados) e a padronização dos nomes dos medicamentos para garantir a consistência.

Para a classificação dos produtos, foi desenvolvida uma rotina em Python que categorizava os itens como “gripais” ou “não gripais”. Esta rotina utilizou a biblioteca RapidFuzz, especificamente a função partial_ratio, que calcula a similaridade entre strings. Um limiar de 85% de similaridade com uma lista de palavras-chave (como “gripe”, “resfriado”, “tosse”, “dor de cabeça”) foi estabelecido empiricamente para classificar um produto como gripal.

A análise subsequente focou exclusivamente na série temporal agregada da categoria de medicamentos gripais, e variáveis temporais como mês e ano foram derivadas da data original para facilitar a análise de sazonalidade e tendência. Após a preparação e agregação dos dados em uma frequência mensal, foi realizada uma análise exploratória detalhada para identificar as características intrínsecas da série temporal. A função seasonal_decompose da biblioteca statsmodels do Python foi empregada para decompor a série em seus três componentes principais: tendência, sazonalidade e resíduo. Este processo foi realizado utilizando uma média móvel centrada de 12 meses para estimar o componente de tendência, uma escolha padrão para dados mensais com sazonalidade anual (Hyndman, 2018). Foram testados e comparados os modelos de decomposição aditivo e multiplicativo.

O modelo aditivo assume que os componentes são somados (Yt = Tt + St + Rt), enquanto o modelo multiplicativo assume que eles são multiplicados (Yt = Tt St Rt). A escolha entre eles é fundamental, pois indica se a amplitude das flutuações sazonais é constante ou se varia proporcionalmente ao nível da série, o que guia a parametrização dos modelos de previsão.

Para a etapa de modelagem e validação, a amostra de 33 meses foi dividida cronologicamente em um conjunto de treino, compreendendo os primeiros 80% dos dados (26 meses), e um conjunto de teste, com os 20% restantes (7 meses). Essa divisão é uma prática padrão para avaliar a capacidade de generalização do modelo, mitigando o risco de overfitting, que ocorre quando um modelo se ajusta excessivamente bem aos dados de treino, mas falha em prever novas observações (Hyndman, 2018). Antes de aplicar o modelo SARIMA, foi realizado o teste de Dickey-Fuller Aumentado (ADF) no conjunto de treino para verificar a premissa de estacionariedade, que implica que a média e a variância da série são constantes ao longo do tempo. A validação final dos modelos ajustados incluiu uma análise diagnóstica dos resíduos (a diferença entre os valores observados e os previstos).

Os resíduos devem se comportar como ruído branco, ou seja, seguir uma distribuição normal, não apresentar autocorrelação (verificado pelo teste de Ljung-Box) e ter variância constante (homocedasticidade, verificada pelo teste ARCH). A performance preditiva foi quantificada por três métricas de erro: Erro Absoluto Médio (MAE), Raiz do Erro Quadrático Médio (RMSE) e Erro Percentual Absoluto Médio (MAPE). O modelo que apresentasse os menores valores nessas métricas seria considerado o mais adequado para a tarefa de previsão. A base de dados consolidada compreendeu 263.817 registros de vendas individuais, totalizando 375.875 unidades de produtos comercializadas entre outubro de 2022 e junho de 2025. A etapa de limpeza de dados confirmou a integridade do conjunto, não identificando registros duplicados ou valores ausentes que necessitassem de tratamento.

A rotina de classificação automática, utilizando o limiar de similaridade de 85%, identificou 37.171 unidades vendidas como pertencentes à categoria de medicamentos gripais, o que corresponde a 9,9% do total de unidades comercializadas no período. Este percentual, embora minoritário, representa um volume significativo e financeiramente relevante, justificando o foco em sua gestão. A agregação mensal desses dados resultou em uma série temporal de 33 observações, que serviu como base para todas as análises exploratórias e de modelagem subsequentes.

A análise exploratória dos dados agregados revelou uma tendência geral de crescimento nas vendas de medicamentos gripais ao longo do período. Essa tendência mostrou-se particularmente acentuada a partir do final de 2023. A investigação de eventos externos coincidiu este crescimento com uma reforma estrutural na farmácia em novembro de 2023 e uma mudança de endereço para um local com maior fluxo de pessoas em maio de 2024. Esses eventos provavelmente funcionaram como intervenções, alterando o nível base da série e intensificando a tendência de crescimento. A comparação entre os modelos de decomposição aditivo e multiplicativo, avaliada com base no Erro Percentual Absoluto Médio (MAPE) dos resíduos, demonstrou a superioridade do modelo multiplicativo. O modelo multiplicativo apresentou um MAPE de 5,02%, enquanto o modelo aditivo resultou em um MAPE de 5,91%. Este resultado indica que a magnitude da sazonalidade não é constante, mas varia proporcionalmente ao nível da série.

Em termos práticos, isso significa que o aumento nas vendas durante o inverno é maior em anos de vendas gerais mais altas, um insight importante que reforça a adequação de modelos que podem incorporar interações multiplicativas, como a versão multiplicativa do Holt-Winters.

A análise de estacionariedade da série de treino foi um passo crítico e pré-requisito para a modelagem SARIMA. O teste de Dickey-Fuller Aumentado (ADF) aplicado à série original retornou um p-valor de 0,053. Considerando um nível de significância de 1% ou 5%, este valor não permite rejeitar a hipótese nula de que a série possui uma raiz unitária, ou seja, é não estacionária.

Para determinar o número de diferenciações necessárias, a função ndiffs sugeriu a aplicação de duas diferenciações (d=2). Após a primeira diferenciação, o p-valor do teste ADF caiu para 0,03, já indicando estacionariedade a 5%, mas não a 1%. Após a aplicação de duas diferenciações, o p-valor resultante foi de 0,002, um valor altamente significativo que confirma a estacionariedade da série transformada, tornando-a apta para a modelagem SARIMA.

A análise dos gráficos de autocorrelação (ACF) e autocorrelação parcial (PACF) da série original forneceu pistas para a especificação dos parâmetros do modelo. O gráfico ACF mostrou um decaimento lento, típico de séries não estacionárias com forte tendência, enquanto o gráfico PACF exibiu um corte abrupto após o primeiro lag, sugerindo um componente autorregressivo de ordem 1 (AR(1)).

Para complementar essa análise visual, o algoritmo auto_arima foi aplicado em duas abordagens: na série original e na série duplamente diferenciada.

Para a série original, a função sugeriu um modelo SARIMA(1, 0, 0)x(1, 0, 0, 12), que tenta capturar a sazonalidade diretamente.

Para a série duplamente diferenciada, o modelo sugerido foi SARIMA(2, 0, 2)x(2, 0, 0, 12), uma estrutura mais complexa. A etapa final consistiu na aplicação dos três modelos candidatos aos dados de treino e na avaliação de suas previsões para os 7 meses do conjunto de teste.

A análise diagnóstica dos resíduos de cada modelo ajustado confirmou que todos atendiam aos pressupostos estatísticos de normalidade, ausência de autocorrelação e homocedasticidade, validando sua construção. Em uma análise qualitativa, os gráficos de previsão mostraram que os modelos Holt-Winters e o SARIMA na série original conseguiram capturar a queda sazonal esperada, mas ambos subestimaram significativamente a forte tendência de crescimento observada em 2024, provavelmente influenciada pela mudança de endereço. Em contrapartida, o modelo SARIMA aplicado à série diferenciada demonstrou uma capacidade superior para se adaptar e projetar essa tendência de crescimento acelerado, seguindo mais de perto os valores reais observados. A avaliação quantitativa, baseada nas métricas de erro, foi decisiva para a escolha do melhor modelo. O modelo SARIMA aplicado à série duplamente diferenciada apresentou os menores valores em todas as três métricas: MAE, RMSE e MAPE.

Este resultado confirma que, para este conjunto de dados específico, a correta estabilização da série por meio da diferenciação foi um passo mais crucial para a precisão preditiva do que a simples captura de um padrão sazonal por outros meios. A capacidade do modelo de focar na previsão das mudanças (diferenças) em vez dos níveis absolutos permitiu que ele se ajustasse de forma mais eficaz à tendência de crescimento recente, que foi o fator determinante para sua superioridade no desempenho preditivo. O estudo demonstrou que a aplicação de modelos quantitativos de previsão é uma ferramenta estratégica valiosa e acessível para a gestão de estoques em farmácias independentes. A comparação entre Holt-Winters e SARIMA evidenciou que a escolha do modelo e, mais importante, o seu tratamento metodológico adequado, são fundamentais para a precisão das previsões.

A superioridade do modelo SARIMA, quando aplicado à série devidamente tornada estacionária, reforça a importância de seguir rigorosamente as premissas teóricas da análise de séries temporais para obter resultados confiáveis.

Conclui-se que o objetivo foi atingido: demonstrou-se que o modelo SARIMA, quando ajustado a uma série temporal devidamente tornada estacionária por diferenciação, oferece previsões de demanda de medicamentos gripais com maior acurácia em comparação ao modelo Holt-Winters e ao SARIMA aplicado na série original para o caso estudado.

Referências:
ABRADILAN – Associação Brasileira de Distribuição e Logística de Produtos Farmacêuticos. “Oito em cada dez farmácias no Brasil pertencem a pequenos e médios empresários”. São Paulo: ABRADILAN, 2024. Disponível em: https://www. abradilan. com. br/mercado/oito-em-cada-dez-farmacias-no-brasil-pertencem-a-pequenos-e-medios-empresarios/. Acesso em: 15 mar. 2025.
BOX, George EP; JENKINS, Gwilym M.; REINSEL, G. C. Time series analysis, forecasting and control. Englewood Clifs. 1994.
DA VEIGA, Claudimar Pereira; DA VEIGA, Cássia Rita Pereira; TORTATO, Ubiratã. Demand forecasting strategies: Understanding the most important concepts. Revista ESPACIOS| Vol. 37 (Nº 05) Año 2016, 2016.
FONSECA, Regina Célia Veiga da. Metodologia do Trabalho Científico. Curitiba: IESDE Brasil, 2012.
HOLT, Charles C. Forecasting seasonals and trends by exponentially weighted moving averages. International journal of forecasting, v. 20, n. 1, p. 5-10, 2004.
HYNDMAN, R. J.; ATHANASOPOULOS, G. Forecasting: Principles and Practice: A comprehensive introduction to the latest forecasting methods using R. Learn to improve your forecast accuracy using dozens of real data examples. 3. ed. Otext, 2018.
LAGE JUNIOR, M. Planejamento e Controle da Produção: teoria e prática. Rio de Janeiro: LTC, 2019.
LAKATOS, Eva Maria; MARCONI, Marina de Andrade. Metodologia Científica. São Paulo: Atlas, 2011.
MARTINS, Diogo Barreto; STRAMBI, Orlando. Forecasting upon a star: Forecasting or wishful thinking?. Journal of Air Transport Management, v. 91, p. 101992, 2021.
MOURÃO, P. L. de L.; DUARTE, A. P.; ALBUQUERQUE NETO, R. B.; MELO, C. M. de L.; ALMEIDA, M. das N. Análise comparativa entre modelos de decomposição de séries temporais em uma pequena empresa de cajuína em Teresina, Piauí. In: ENCONTRO NACIONAL DE ENGENHARIA DE PRODUÇÃO (ENEGEP), 37., 2017, Joinville. Anais… Joinville: ABEPRO, 2017.
PRODANOV, Cleber Cristiano; FREITAS, Ernani Cesar de. Metodologia do Trabalho Científico: Métodos e Técnicas da Pesquisa e do Trabalho Acadêmico. 2. ed. Novo Hamburgo: Editora Feevale, 2013.
SBVC– Sociedade Brasileira de Varejo e Consumo. “Abertura de farmácias no país ganha impulso”. São Paulo: SBVC, 2024. Disponível em: https://sbvc. com. br/abertura-de-farmacias-no-pais-ganha-impulso/. Acesso em: 15 mar. 2025.


Resumo executivo oriundo de Trabalho de Conclusão de Curso de Especialização em Data Science e Analytics do MBA USP/Esalq

Saiba mais sobre o curso; clique aqui:

Quem editou este artigo

Você também pode gostar

Quer ficar por dentro das nossas últimas publicações? Inscreva-se em nossa newsletter!

Receba conteúdos e fique sempre atualizado sobre as novidades em gestão, liderança e carreira com a Revista E&S.

Ao preencher o formulário você está ciente de que podemos enviar comunicações e conteúdos da Revista E&S. Confira nossa Política de Privacidade