Resumo Executivo

24 de fevereiro de 2026

Otimização do estoque de peças com machine learning para redução de custos

Lucas Nogueira Guerra; Anna Carolina Martins

Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.

Este trabalho define uma lista otimizada de peças de reposição para estoque utilizando machine learning, com o objetivo de reduzir o custo associado ao tempo de atendimento sem que o custo de estoque supere os benefícios. A pesquisa desenvolve um modelo preditivo que, a partir de dados históricos de uma empresa de máquinas de construção civil, recomenda a necessidade e a quantidade de compra de cada item. A solução proposta substitui abordagens tradicionais, ineficientes diante da variabilidade da demanda, por um sistema que equilibra a disponibilidade de peças e a minimização de custos. A relevância da abordagem está em transformar dados operacionais em decisões estratégicas, gerando eficiência e economia.

O setor de máquinas pesadas no Brasil, com cerca de 800 empresas, é fundamental para a construção civil, mineração e agronegócio (IBGE, 2025). A gestão de estoques de peças de reposição é um fator estratégico de competitividade. A indisponibilidade de uma peça crítica pode paralisar equipamentos, gerando custos de inatividade que superam o valor do componente. Por outro lado, o estoque excessivo imobiliza capital, aumenta custos de armazenagem e o risco de obsolescência. A gestão de estoques busca, portanto, um equilíbrio entre o nível de serviço e a eficiência de capital, um desafio central para a logística moderna (Silver, Pyke e Peterson, 1998).

A complexidade é acentuada pela demanda esporádica e de difícil previsão por peças de reposição. Métodos tradicionais de controle de estoque, como médias móveis, são inadequados para essa variabilidade. Nesse cenário, o machine learning surge como uma alternativa promissora. Conforme Bacchetti e Saccani (2012), a análise avançada de dados permite identificar padrões ocultos no histórico de consumo, correlacionando a demanda com variáveis antes ignoradas, o que possibilita a criação de modelos preditivos mais acurados e dinâmicos.

Estudos recentes confirmam o potencial do machine learning para otimização de inventários. Uma pesquisa de Silva et al. (2022) demonstrou a eficácia de redes neurais na previsão de demanda de peças no setor agrícola, alcançando alta precisão e permitindo uma gestão de estoques mais eficiente. Este trabalho se alinha a essa pesquisa, propondo um modelo que não apenas prevê a demanda, mas integra a previsão a uma lógica de decisão de compra. O modelo analisa variáveis como histórico de solicitações, estoque na filial, disponibilidade no fornecedor, tempos de atendimento e frequência de consumo. A partir dessa análise, o sistema define quais peças estocar e em que quantidade, considerando o impacto financeiro da aquisição para garantir a viabilidade da estratégia.

O desenvolvimento do modelo seguiu um processo de Mineração de Dados baseado na metodologia de Rezende (2003), com quatro etapas: Identificação do Problema, Pré-processamento, Extração de Padrões e Pós-processamento. Na Identificação do Problema, definiu-se que a questão central era a ineficiência na decisão de compra de peças, resultando em custos por excesso de estoque ou por tempo de máquina parada. O critério de sucesso foi a capacidade do modelo de gerar uma lista de compras que reduzisse os custos totais, considerando o capital imobilizado e o custo de oportunidade da inatividade. A compreensão do fluxo de informações entre as áreas foi fundamental para a idealização da solução (Han, Kamber & Pei, 2012).

A etapa de Pré-processamento preparou os dados brutos para a modelagem. Foram utilizados dois conjuntos de dados da empresa: “Atendimentos Realizados”, com o histórico de ordens de serviço dos últimos 12 meses, e “Fluxo de Peças”, detalhando os itens utilizados. A preparação, realizada no Power Query, envolveu limpeza de dados para corrigir inconsistências, transformação de tipos de variáveis e criação de novas métricas. A seleção de dados aplicou filtros para restringir a análise a um tipo específico de motor e a atendimentos que demandaram peças, focando no escopo definido. Por fim, a integração dos dois conjuntos de dados criou uma base unificada, enriquecendo o histórico de consumo. Este processo garantiu um conjunto de dados robusto e confiável, pré-requisito para a extração de padrões (Han, Kamber & Pei, 2012).

A fase de Extração de Padrões foi o núcleo do desenvolvimento; o modelo de machine learning foi construído. A abordagem foi um sistema de duas etapas com o algoritmo Random Forest, conhecido por sua robustez em dados tabulares (Breiman, 2001). Na primeira etapa, um modelo de classificação (RandomForestClassifier com 200 árvores) foi treinado para decidir se uma peça deveria ser comprada (“Sim” ou “Não”), usando como alvo um gabarito de compras validado por especialistas. Os atributos preditores incluíram consumo histórico, níveis de estoque e risco de reposição. Na segunda etapa, um modelo de regressão (RandomForestRegressor com 300 árvores) foi aplicado aos itens classificados como “Sim”, para prever a quantidade ideal de compra. A lógica do Random Forest, que agrega previsões de múltiplas árvores de decisão, confere ao modelo maior capacidade de generalização e menor sensibilidade a ruídos (Faceli et al., 2011).

A etapa final, Pós-processamento, validou e interpretou os resultados. O desempenho foi avaliado com um conjunto de dados de teste de junho de 2025, não utilizado no treinamento. Para o modelo de classificação, foram calculadas métricas como acurácia, precisão e recall. Para o modelo de regressão, foram usadas métricas como Erro Médio Absoluto (MAE) e o coeficiente de determinação (R²), que mede a proporção da variabilidade explicada pelo modelo (Montgomery & Runger, 2018). A análise da importância das variáveis, um output do Random Forest, permitiu identificar os fatores mais influentes nas decisões do modelo, fornecendo insights para a gestão (Sinoara, Antunes & Rezende, 2017). A validação foi realizada com os gestores da empresa, comparando as recomendações do modelo com as decisões de especialistas e analisando o impacto financeiro potencial.

A análise dos resultados revelou um desempenho robusto. A análise exploratória dos dados mostrou grande variabilidade na demanda entre materiais. A distribuição das médias de compra demonstrou forte concentração no item “B”, com valor médio de 352 unidades, enquanto itens como “F”, “H” e “G” apresentaram médias de 32, 25 e 21 unidades, respectivamente. Essa assimetria na demanda, comum em estoques de reposição, reforça a inadequação de políticas de estoque uniformes e a necessidade de uma abordagem customizada por item, como a proposta pelo modelo (Zipkin, 2000).

O desempenho do modelo de classificação, que decide se uma peça deve ser comprada, foi avaliado com uma matriz de confusão. Nos dados de teste, o modelo acertou 13 de 15 decisões, com acurácia de 86,7%. A precisão de 80% indica que, quando o modelo recomenda uma compra, está correto em 80% das vezes. O recall, também de 80%, significa que o modelo identificou 80% das oportunidades de compra que deveriam ter sido feitas. Embora o F1-Score de 0.571 sugira espaço para melhorias no equilíbrio entre precisão e recall, os resultados demonstram alta confiabilidade, superando métodos baseados em regras fixas (Silva et al., 2022).

A análise dos erros do classificador é fundamental. Os falsos positivos (recomendar compra quando desnecessário) geram custo de estoque. Os falsos negativos (não recomendar compra quando necessário) impactam o tempo de atendimento e podem levar à parada de equipamentos. O modelo apresentou um equilíbrio razoável, mas a discussão com a empresa revelou que os falsos negativos são mais críticos. Futuros ajustes no modelo poderiam focar em aumentar o recall, mesmo com uma ligeira redução na precisão, alinhando o algoritmo à estratégia de negócio (Bacchetti & Saccani, 2012).

O modelo de regressão, que estima a quantidade a ser comprada, também demonstrou alta performance. O coeficiente de determinação (R²) atingiu 0,938, indicando que o modelo explica 93,8% da variação na quantidade de itens a serem comprados. O Erro Médio Absoluto (MAE) foi de 7,867 unidades, significando que, em média, a previsão se desvia em menos de 8 unidades do valor ideal. Para peças com demandas de centenas de unidades, este nível de erro é considerado baixo e aceitável para planejamento.

A análise gráfica da comparação entre valores previstos e reais corrobora a qualidade do modelo de regressão. O gráfico de dispersão mostrou que as previsões acompanham a tendência dos dados reais. No entanto, a análise revelou desvios pontuais significativos, refletidos no Erro Quadrático Médio (MSE) de 452.4 e no RMSE de 21.27, métricas sensíveis a grandes desvios. A existência desses outliers sugere que, para alguns itens ou situações, o modelo pode ter dificuldades em capturar a complexidade da demanda.

A discussão desses resultados com a empresa identificou que os maiores desvios estavam associados a eventos não recorrentes, como grandes reformas de frota ou substituição de peças em garantia, não capturados pelas variáveis históricas. Isso aponta para uma limitação do modelo e reforça a recomendação de incorporar novas variáveis, como informações sobre projetos futuros ou sazonalidade, para aumentar a precisão (Silver, Pyke & Peterson, 1998).

Apesar dos desvios, o desempenho agregado do sistema de duas etapas foi um sucesso. A combinação de um classificador com 87% de acurácia e um regressor com R² de 94% fornece uma ferramenta poderosa para a automação e otimização da gestão de estoques. A solução demonstrou ser capaz de gerar recomendações de compra coerentes, contribuindo para decisões mais assertivas. A implementação do modelo tem o potencial de reduzir custos operacionais, seja pela diminuição do capital imobilizado, seja pela redução da inatividade dos equipamentos.

A implementação de um modelo preditivo representa uma evolução na gestão de estoques, transitando de um modelo reativo para um proativo. A capacidade de antecipar a necessidade de compra permite que a empresa se posicione de forma mais estratégica. A análise da importância das variáveis, fornecida pelo Random Forest, também gera insights, indicando, por exemplo, que o tempo de espera do fornecedor pode ser um preditor mais importante que o histórico de consumo em certos casos (Sinoara, Antunes & Rezende, 2017). Esses insights podem guiar não apenas as decisões de estoque, mas também as negociações com fornecedores. Os resultados demonstram que a aplicação de machine learning na gestão de peças de reposição é uma abordagem viável e de alto impacto. O modelo proposto alcançou métricas de desempenho robustas e provou seu valor prático, respondendo tanto à pergunta “o que comprar?” quanto “quanto comprar?”.

O presente estudo alcançou seu propósito ao desenvolver e validar um modelo de machine learning para otimizar a gestão de estoque de peças de reposição. Os resultados demonstraram ganhos potenciais, com o modelo de classificação atingindo 87% de acurácia e o de regressão explicando 94% da variabilidade da demanda. A análise revelou limitações, como a simplificação de regras de negócio e a dependência de um volume de dados restrito. A eficácia na predição evidenciou o desafio de equilibrar os custos de falsos positivos (estoque) e falsos negativos (atendimento ao cliente), sendo este último mais crítico. Para fortalecer a solução, recomenda-se a incorporação de variáveis adicionais, como sazonalidade, custo unitário e tempo de reposição do fornecedor, além da expansão da base de dados para incluir mais materiais e um histórico mais longo.

A continuidade deste trabalho pode explorar otimizações no modelo, como ajuste de hiperparâmetros e o teste de outros algoritmos, como Gradient Boosting ou redes neurais. A empresa parceira poderia investir em uma nova estrutura de coleta de dados, especialmente do fornecedor, para enriquecer o modelo. A expansão da análise para outros tipos de equipamentos permitiria aumentar o volume de registros e a generalização do modelo. Conclui-se que o objetivo foi atingido: demonstrou-se que a aplicação de um modelo de machine learning em duas etapas, classificação e regressão, permite definir uma lista otimizada de peças para estoque, equilibrando custos e tempo de atendimento com alta precisão preditiva.

Referências:
Bacchetti, A.; Saccani, N. 2012. Spare Parts Management: A Literature Review. International Journal of Production Economics. 140(2), 639-653.
Breiman, L. 2001. Random Forests. Machine Learning, 45(1), 5–32.
Faceli, K.; Lorena, A. C.; Gama, J.; Carvalho, A. C. P. L. F.; et al. 2011. Inteligência Artificial: Uma Abordagem de Aprendizado de Máquina. 1ed. LTC, Rio de Janeiro, RJ, Brasil.
Han, J.; Kamber, M.; Pei, J. 2012. Data Mining: Concepts and Techniques. 3ed. Morgan Kaufmann, Waltham, USA.
IBGE. Indústria de Máquinas e Equipamentos Pesados no Brasil: Estatísticas Econômicas 2025. Instituto Brasileiro de Geografia e Estatística, 2025.
Montgomery, D. C.; Runger, G. C. 2018. Applied Statistics and Probability for Engineers. 7ed. John Wiley & Sons, New York, USA.
Rezende, S. O.; et al. 2003. Sistemas Inteligentes: Fundamentos e Aplicações. 2ed. Manole, Barueri, SP, Brasil.
Silva, L. M.; Costa, A. P.; Ribeiro, S. C. 2022. Previsão de demanda de peças sobressalentes utilizando rede neural artificial. Journal of Industrial Engineering. 30(4), 45-62.
Silver, E. A.; Pyke, D. F.; Peterson, R. 1998. Inventory Management and Production Planning and Scheduling. 3ed. John Wiley & Sons, New York, USA.
Sinoara, R. A.; Antunes, J.; Rezende, S. O. 2017. Text Mining and Semantics: A Systematic Mapping Study.
Zipkin, P. H. 2000. Foundations of Inventory Management. McGraw-Hill, Boston, USA.


Resumo executivo oriundo de Trabalho de Conclusão de Curso de Especialização em Data Science e Analytics do MBA USP/Esalq

Saiba mais sobre o curso; clique aqui:

Quem editou este artigo

Mais recentes

Você também pode gostar

Quer ficar por dentro das nossas últimas publicações? Inscreva-se em nossa newsletter!

Receba conteúdos e fique sempre atualizado sobre as novidades em gestão, liderança e carreira com a Revista E&S.

Ao preencher o formulário você está ciente de que podemos enviar comunicações e conteúdos da Revista E&S. Confira nossa Política de Privacidade