Imagem Previsão do cumprimento OTIF com regressão logística integrada ao Power BI

26 de fevereiro de 2026

Previsão do cumprimento OTIF com regressão logística integrada ao Power BI

Gabriel Angel de Sousa Escouboue; Edilson José Rodrigues

Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.

Este estudo desenvolveu um modelo de aprendizado supervisionado, baseado em regressão logística, para prever a probabilidade de cumprimento do indicador OTIF (On Time In Full) em pedidos de venda de uma empresa do setor siderúrgico. O objetivo foi identificar as variáveis preditoras do desempenho logístico e estimar, no momento da entrada do pedido, a probabilidade de seu atendimento pleno, fornecendo uma ferramenta para a gestão proativa de riscos operacionais em um ambiente com alta diversidade de produtos e pedidos personalizados.

A gestão logística de alta performance é uma exigência competitiva, especialmente em setores como o siderúrgico, com cadeias de suprimentos complexas e custos logísticos elevados. A capacidade de entregar os produtos corretos, na quantidade solicitada e no prazo, é um diferencial competitivo. O indicador OTIF funciona como um termômetro da saúde da cadeia de suprimentos e da satisfação do cliente. Conforme destaca Christopher (2016), o nível de serviço ao cliente é um dos pilares para a construção de uma vantagem competitiva sustentável, o que torna a previsibilidade do desempenho uma prioridade estratégica.

A operação da empresa analisada demonstra a complexidade do processo. Cada pedido de venda percorre um fluxo que se inicia na negociação comercial e avança por etapas como análise de crédito, reserva de materiais, contratação de transporte, faturamento, expedição e entrega. A heterogeneidade dos pedidos — que variam em volume, condições de pagamento, restrições de crédito, estado de destino e modal de transporte — introduz múltiplas variáveis que podem impactar o resultado final. Uma falha em qualquer fase pode comprometer o cumprimento do OTIF, cujo desempenho resulta da interação entre decisões comerciais, financeiras e logísticas.

A ausência de uma ferramenta preditiva para antecipar falhas no atendimento impõe uma gestão reativa, na qual os problemas são identificados tardiamente, limitando a capacidade de mitigação e gerando custos como reentregas, multas e erosão da confiança do cliente. A proposta de um modelo de aprendizado de máquina visa transformar esse paradigma, permitindo uma abordagem proativa, na qual os recursos são alocados de forma inteligente para os pedidos que apresentam maior risco de descumprimento.

Este trabalho aplica métodos de ciência de dados para a resolução de problemas de negócio, conforme defendido por Fávero e Belfiore (2017), que argumentam sobre os ganhos de assertividade e eficiência proporcionados pela modelagem estatística. A integração da solução a uma plataforma de Business Intelligence como o Power BI potencializa esse valor, ao traduzir os resultados estatísticos em visualizações interativas e acessíveis, facilitando a tomada de decisão baseada em dados em todos os níveis da organização.

A metodologia adotada iniciou-se com a coleta e preparação de um dataset corporativo proprietário, contendo um histórico de aproximadamente 345 mil registros de pedidos de venda, coletados entre 2023 e 2025. Esta base de dados abrangia atributos logísticos, comerciais e operacionais de seis centros de distribuição e cerca de 300 itinerários distintos. As variáveis selecionadas incluíam dimensões como o estado de destino (UFRECEBEDOR), termos de frete (CDINCOTERMS), macrorregiões de entrega (CDITINERARIO), centros de expedição (CDCENTRO), classificação de clientes (CD9BOX), condições de pagamento, categorias de produtos (DSLINHA) e métricas de tempo de execução (SLAs).

O processo de Extração, Transformação e Carga (ETL) incluiu a conversão de formatos de data, a normalização de valores e a criação da variável alvo binária, OTIFBIN, onde “OK” foi mapeado para 1 (sucesso) e “NOK” para 0 (falha). As informações foram agregadas ao nível do pedido (NRDOC_VENDA), assegurando que cada linha do dataset representasse um único pedido. Esta etapa de consolidação envolveu a aplicação de regras como somatórios para volumes e máximos para prazos, garantindo a representatividade de cada registro.

Na fase de engenharia de atributos, as variáveis categóricas foram transformadas em variáveis binárias (dummies) e as numéricas foram padronizadas através da técnica z-score, um procedimento importante para algoritmos sensíveis à escala, como a regressão logística com regularização. Um desafio metodológico foi a alta cardinalidade de variáveis como as combinações de UF × Itinerário e Centro × Linha, que geravam um número excessivo de categorias. Para mitigar este problema, aplicou-se a clusterização não supervisionada k-means, que agrupou categorias semelhantes. A definição do número ótimo de clusters (k) foi apoiada pelo método do cotovelo, resultando na adoção de k=5 para Centro × Linha e k=6 para UF × Itinerário, valores que equilibraram a redução da dimensionalidade e a preservação da informação, uma abordagem alinhada às boas práticas de modelagem (Hair et al., 2019).

O algoritmo selecionado foi a regressão logística binária, um método de aprendizado supervisionado interpretável, adequado para problemas de classificação com variável dependente dicotômica (Hosmer, Lemeshow e Sturdivant, 2013). O modelo foi treinado utilizando 80% dos dados, com 20% reservados para teste, aplicando-se estratificação para garantir a proporção de classes. Para lidar com o desbalanceamento, foi utilizada a opção de balanceamento de pesos (class_weight=”balanced”), e a regularização L2 foi aplicada para prevenir o sobreajuste. A validação do desempenho foi conduzida por meio de métricas como acurácia, precisão, sensibilidade (recall), F1-score, matriz de confusão e a Área sob a Curva ROC (AUC). A implementação foi realizada em Python, e os resultados integrados ao Power BI.

O modelo de regressão logística binária demonstrou um desempenho robusto. A acurácia global na amostra de teste atingiu 80,67%. A precisão foi de 85,09%, o que significa que de cada 100 pedidos que o modelo classificou como prováveis de serem cumpridos, 85 de fato o foram. A sensibilidade (recall) alcançou 86,75%, revelando a capacidade do modelo em identificar corretamente os pedidos que foram efetivamente cumpridos. O F1-score, média harmônica entre precisão e sensibilidade, foi de 85,91%, um valor que confirma o equilíbrio do modelo. Estes resultados estão em conformidade com a literatura, que posiciona a regressão logística como uma ferramenta eficaz para predição e interpretação de resultados binários (Bishop, 2006).

A capacidade discriminatória do modelo foi corroborada pela análise da Curva ROC, que resultou em uma Área sob a Curva (AUC) de 0,86. Este valor indica uma excelente habilidade do modelo em distinguir entre as classes positiva (OTIF) e negativa (não OTIF). A análise das curvas ROC e Precision-Recall também permitiu avaliar o impacto de diferentes pontos de corte (thresholds) na classificação, oferecendo flexibilidade para ajustar o modelo às prioridades do negócio, como optar por um threshold mais conservador para minimizar riscos. Como apontam Fávero e Belfiore (2017), a utilização de um conjunto diversificado de métricas é essencial para uma avaliação completa de classificadores em contextos empresariais.

A análise dos coeficientes do modelo, transformados em odds-ratios, forneceu insights sobre os fatores de maior influência. O coeficiente positivo para a Soma do volume de faturamento (9,71) sugere que pedidos com maiores volumes já faturados têm uma chance maior de sucesso, possivelmente por estarem em etapas avançadas do processo. Em contrapartida, a Soma do volume de vendas apresentou um coeficiente fortemente negativo (–10,15), indicando que pedidos de grande porte ainda em carteira enfrentam um risco maior de descumprimento, o que pode ser atribuído a restrições de estoque ou capacidade. A variável Maior Dias Total obteve um coeficiente negativo (–3,31), confirmando que prazos de entrega mais longos estão associados a uma menor probabilidade de cumprimento.

A aplicação de clusterização k-means provou ser uma estratégia metodológica crucial. Variáveis como CD_ITINERARIO, com mais de 340 categorias, teriam tornado o modelo impraticável sem uma técnica de redução de dimensionalidade. Ao agrupar itinerários e combinações de centro e linha de produto em clusters, foi possível capturar a informação logística em um número manejável de variáveis, melhorando a eficiência computacional e a generalização do modelo. A disponibilização desses clusters como filtros interativos no Power BI permitiu que os gestores analisassem o desempenho por agrupamentos logísticos, identificando padrões de risco não visíveis na análise das categorias originais, em linha com as recomendações de James et al. (2013) sobre dados de alta dimensionalidade.

A integração da solução com o Power BI foi um diferencial para a aplicação prática dos resultados. A plataforma permitiu a criação de dashboards executivos nos quais os gestores podem visualizar a carteira de pedidos classificada pela probabilidade de não cumprimento do OTIF, aplicando filtros por região, cliente ou cluster logístico. Essa capacidade transforma o modelo estatístico em uma ferramenta de gestão diária, permitindo que a equipe de Customer Service atue preventivamente nos pedidos mais críticos. Como defendem Waller e Fawcett (2013), a conversão de dados em insights acionáveis é o que gera valor e diferencial competitivo.

Uma análise metodológica adicional comparou o desempenho da regressão logística com um modelo multinível, que considerou a Unidade da Federação (UF) como um efeito aleatório. Os resultados mostraram um Coeficiente de Correlação Intraclasse (ICC) de apenas 0,019, indicando que menos de 2% da variabilidade total do OTIF era explicada por diferenças entre os estados. Dado que o modelo multinível não apresentou ganhos preditivos expressivos, mas implicava maior complexidade, a escolha pelo modelo mais simples e interpretável foi justificada como a mais apropriada, conciliando performance estatística e aplicabilidade prática.

A implementação desta solução analítica representa um avanço na maturidade da gestão orientada a dados da empresa. A capacidade de prever o desempenho do OTIF permite uma alocação mais eficiente de recursos, como a priorização de pedidos na separação ou a negociação antecipada de fretes. A análise dos fatores de risco também fornece subsídios para a revisão de processos, como a definição de prazos de entrega mais realistas. A utilização de ferramentas de Business Intelligence, como o Power BI, é fundamental para que esses insights se traduzam em ações concretas (Laudon & Laudon, 2020), contribuindo para a otimização de toda a cadeia de suprimentos (Bowersox, Closs, & Cooper, 2013).

A implementação do modelo de regressão logística binária demonstrou ser uma abordagem eficaz para estimar a probabilidade de cumprimento do indicador OTIF. O processo, que abrangeu desde o tratamento de dados e a engenharia de atributos até o ajuste e a validação do algoritmo, resultou em um modelo com alta capacidade preditiva, capaz de transformar uma base de dados complexa em uma ferramenta de previsão de riscos. Os resultados evidenciam que características dos pedidos, como volume, prazos e complexidade operacional, exercem influência significativa sobre a probabilidade de sucesso, reforçando que o desempenho do OTIF é um reflexo do alinhamento sistêmico da cadeia de valor.

Na prática, a aplicação do modelo integrado ao Power BI gera benefícios tangíveis para a gestão logística e comercial. A capacidade de identificar antecipadamente os pedidos com maior risco de não conformidade permite que as equipes atuem de forma preventiva, otimizando a alocação de recursos, antecipando gargalos e melhorando a comunicação com o cliente. Esta abordagem fortalece a tomada de decisão baseada em dados, contribui para a redução de ineficiências operacionais e eleva o nível de serviço. Conclui-se que o objetivo foi atingido: demonstrou-se que a aplicação de um modelo de regressão logística permite prever com alta acurácia a probabilidade de cumprimento do indicador OTIF, fornecendo uma ferramenta estratégica para a gestão logística.

Referências:
BISHOP, C. M. Pattern Recognition and Machine Learning. New York: Springer, 2006.
BOWERSOX, D. J.; CLOSS, D. J.; COOPER, M. B. Supply Chain Logistics Management. 4. ed. New York: McGraw-Hill, 2013.
CHOPRA, S.; MEINDL, P. Supply Chain Management: Strategy, Planning, and Operation. 6. ed. Boston: Pearson, 2016.
CHRISTOPHER, M. Logistics & Supply Chain Management. 5. ed. Harlow: Pearson, 2016.
FÁVERO, L. P.; BELFIORE, P. Manual de Análise de Dados: Estatística e Modelagem Multivariada com Excel®, SPSS® e Stata®. Rio de Janeiro: Elsevier, 2017.
HAIR, J. F.; BLACK, W. C.; BABIN, B. J.; ANDERSON, R. E. Multivariate Data Analysis. 8. ed. Andover: Cengage, 2019.
HOSMER, D. W.; LEMESHOW, S.; STURDIVANT, R. X. Applied Logistic Regression. 3. ed. Hoboken: John Wiley & Sons, 2013.
JAMES, G.; WITTEN, D.; HASTIE, T.; TIBSHIRANI, R. An Introduction to Statistical Learning: with Applications in R. New York: Springer, 2013.
LAUDON, K. C.; LAUDON, J. P. Management Information Systems: Managing the Digital Firm. 16. ed. Harlow: Pearson, 2020.
WALLER, M. A.; FAWCETT, S. E. Data science, predictive analytics, and big data: a revolution that will transform supply chain design and management. Journal of Business Logistics, v. 34, n. 2, p. 77–84, 2013.


Resumo executivo oriundo de Trabalho de Conclusão de Curso de Especialização em Data Science e Analytics do MBA USP/Esalq

Saiba mais sobre o curso; clique aqui:

Quem editou este artigo

Você também pode gostar

Quer ficar por dentro das nossas últimas publicações? Inscreva-se em nossa newsletter!

Receba conteúdos e fique sempre atualizado sobre as novidades em gestão, liderança e carreira com a Revista E&S.

Ao preencher o formulário você está ciente de que podemos enviar comunicações e conteúdos da Revista E&S. Confira nossa Política de Privacidade