
02 de fevereiro de 2026
Otimização da seleção de fornecedores na Petrobras com Machine Learning
Davi Teves de Aguiar; Éllen Rimkevicius Carbognin
Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.
Este estudo desenvolveu e validou um algoritmo de machine learning para otimizar a seleção de fornecedores em contratações de bens por Dispensa de Licitação por Valor (DLV) na Petróleo Brasileiro S. A. (Petrobras). O objetivo foi criar um modelo preditivo para identificar, com alta precisão, os fornecedores mais propensos a submeter cotações efetivas — ofertas para materiais tecnicamente idênticos aos solicitados — visando aumentar a eficiência e reduzir custos operacionais, especialmente para itens classificados como “tail spend”.
A relevância do estudo reside na escala das operações da Petrobras, maior empresa do Brasil, com grande volume de aquisições. O plano de negócios 2025-2029 prevê US$ 111 bilhões em investimentos (CAPEX) (PETROBRAS, 2024). Os custos operacionais (OPEX) anuais somam aproximadamente R$ 124 bilhões, com R$ 14 bilhões destinados à contratação de materiais. Este cenário demonstra a importância estratégica de processos de aquisição eficientes. A seleção de fornecedores, neste contexto, é um pilar do gerenciamento da cadeia de suprimentos (Carvalho & Santos, 2021).
Como sociedade de economia mista, a Petrobras opera sob a Lei nº 13.303/2016 (Lei das Estatais), que exige isonomia, publicidade e ampla concorrência (Brasil, 2016). Embora a licitação seja a regra, a modalidade de Dispensa de Licitação por Valor (DLV) é aplicada a um grande volume de itens de baixo valor agregado, conhecidos como “tail spend”. Estes itens, representando 10-20% do valor total contratado, correspondem a 80-90% do volume de itens adquiridos (Drentin et al., 2018). Em 2024, essa categoria de compras na Petrobras envolveu 166.146 itens de pedido, totalizando mais de R$ 1,3 bilhão, o que demonstra a escala e a complexidade da gestão.
O principal gargalo no processo de DLV é a baixa efetividade média, de 50%. Metade dos itens publicados não resulta em pedido válido, exigindo reprocessamento e gerando custo administrativo. A metodologia padrão de convidar um número excessivo de fornecedores sobrecarrega a infraestrutura de TI, com o envio de dezenas de milhares de e-mails diários e o processamento de um volume massivo de propostas, muitas inadequadas. A otimização de processos de aquisição em grandes organizações é crucial para a sustentabilidade operacional (Mendes, 2022).
A aplicação de inteligência artificial e machine learning pode transformar a seleção de fornecedores, migrando de um modelo reativo para um sistema proativo e baseado em dados (Gidiagba et al., 2025). A literatura, contudo, carece de aplicações dessas técnicas em empresas estatais com regulamentos de contratação singulares. Este trabalho preenche parte dessa lacuna, oferecendo uma solução customizada para o contexto da Petrobras, com potencial para gerar ganhos de eficiência e economia de recursos.
A metodologia foi quantitativa e aplicada, utilizando Python (versão 3.13) e Visual Studio Code. O processo iniciou com a obtenção de dados brutos de fontes internas da Petrobras, como o sistema ERP e o portal de compras Petronect (PETRONECT, 2025). Dados históricos de oportunidades de compra, criadas entre 1º de janeiro de 2023 e 1º de setembro de 2025, foram extraídos via consultas SQL com o módulo pyodbc, abrangendo informações sobre oportunidades, requisições, materiais e fornecedores.
A etapa seguinte foi o tratamento e pré-processamento dos dados, fase crítica para a qualidade do dataset (Oliveira, 2023). As operações incluíram formatação de texto, preenchimento de valores nulos com “N/A”, remoção de duplicatas e junção de dataframes. O dataset consolidado foi estruturado com cada linha representando uma cotação única de um fornecedor para um item de uma oportunidade (OPORTITEM), contendo colunas como código do material (CODNM), código do fornecedor (VENDORNO), centro logístico (CENTRO), prazo de entrega (Prazoentrega) e valor estimado (Valor_bruto).
A variável alvo, Cotacaoefetiva, foi definida como binária: 1 se o fornecedor ofertou material idêntico ao solicitado (verificado por part number) e 0 nos demais casos. As variáveis explicativas foram: fornecedor (VENDORNO), valor estimado (Valorbruto), prazo de entrega (Prazoentrega) e local de entrega (CENTRO). A hipótese era que o comportamento do fornecedor é influenciado por sua identidade, porte da oportunidade e exigências logísticas. Para robustez estatística, foram considerados apenas materiais (COD_NM) que apareceram em 30 ou mais oportunidades, resultando em uma base final com 988.768 linhas e 686 materiais distintos.
Para treinamento e avaliação, utilizou-se o algoritmo RandomForestClassifier da biblioteca scikit-learn, escolhido por sua robustez, capacidade de lidar com interações complexas e resistência a overfitting em grandes datasets (Breiman, 2001). Um estudo comparativo entre a configuração padrão e uma otimizada via GridSearchCV revelou que a padrão teve desempenho superior em 75% dos 686 materiais (516 modelos), com uma métrica ROC_AUC média de 0,92 contra 0,90 da versão otimizada. Com base nesses resultados e na maior eficiência computacional, a configuração padrão foi adotada para todos os modelos. Para cada um dos 686 materiais, os dados foram divididos em 80% para treinamento e 20% para teste.
O algoritmo gerou 686 modelos de machine learning, cada um especializado em prever a probabilidade de cotação efetiva para um código de material (COD_NM) específico. Para selecionar os modelos mais promissores, estabeleceu-se um critério de corte baseado na métrica de precisão, definida como igual ou superior a 0,80. A precisão (Verdadeiros Positivos / (Verdadeiros Positivos + Falsos Positivos)) foi a métrica escolhida para minimizar os Falsos Positivos, ou seja, evitar convidar fornecedores que submetem propostas de materiais não idênticos. Tais propostas geram retrabalho, como pareceres técnicos de equivalência, que prolongam o ciclo de contratação e aumentam os custos administrativos.
Dos 686 modelos treinados, 511 atingiram ou superaram o limiar de precisão de 0,80, indicando alta confiabilidade. Dentro deste grupo, foram mapeados 50 materiais que, além de possuírem um modelo de alta precisão, apresentavam uma efetividade histórica de contratação inferior a 50%. Esses 50 materiais são os alvos ideais para a implementação inicial, pois combinam um problema crônico de baixa eficiência com uma ferramenta preditiva de alta acurácia, maximizando o potencial de ganho.
A análise das métricas de desempenho para esses 50 modelos prioritários revelou resultados positivos. A acurácia geral foi consistentemente alta, frequentemente acima de 0,90. A precisão, por critério de seleção, foi superior a 0,80, com muitos modelos alcançando 0,95 ou 1,00. A métrica ROC_AUC, que avalia a capacidade de discriminação do modelo, apresentou valores predominantemente entre 0,85 e 0,99. De acordo com a literatura, valores de AUC entre 0,8 e 0,9 indicam uma discriminação excelente, e acima de 0,9, excepcional (Hosmer Jr & Lemeshow, 2000). Isso confirma que os modelos são capazes de distinguir fornecedores com alta probabilidade de ofertar o material correto daqueles com baixa probabilidade.
O material de código 12376166, por exemplo, apresentou métricas perfeitas (1,00 para acurácia, precisão, sensibilidade, F1 e ROC_AUC) em um cenário com efetividade histórica de apenas 21%. Isso sugere que o processo atual é ineficiente, mas o modelo identifica perfeitamente o padrão dos fornecedores, oferecendo um caminho para otimização. Outros casos, como o material 10289406, com precisão de 1,00 e efetividade de 18%, reforçam o potencial da abordagem proposta.
Além dos 50 materiais prioritários, os outros 461 modelos com alta precisão também representam uma oportunidade de otimização. Como a efetividade média geral dos processos de DLV é de 51%, qualquer incremento, quando aplicado à escala de mais de 166.000 itens contratados anualmente, traduz-se em economia substancial de recursos. Administrativamente, a seleção assertiva de fornecedores reduz o retrabalho de compras fracassadas e o volume de pareceres técnicos. Do ponto de vista de TI, a redução no número de convites diminui a carga sobre servidores de e-mail, o tráfego de rede e os custos de armazenamento e processamento de cotações irrelevantes.
O estudo possui limitações. Os modelos foram treinados com dados históricos estáticos e não se adaptam automaticamente a mudanças de mercado, como a entrada de novos fornecedores ou alterações no portfólio de empresas existentes. Eventos como fusões ou aquisições de fornecedores não são capturados e podem afetar a performance preditiva. Portanto, um plano de retreinamento periódico dos modelos é essencial para manter sua acurácia.
Outra consideração crítica é regulatória. Como empresa de economia mista, a Petrobras deve garantir impessoalidade e isonomia. A aplicação de um modelo de machine learning que seleciona fornecedores por histórico não deve criar barreiras para novos concorrentes ou favorecer empresas estabelecidas. Para mitigar esse risco, a implementação deve ser acompanhada de regras de negócio que garantam oportunidades para novos fornecedores, como a inclusão de um percentual de convites para empresas sem histórico ou a realização de rodadas de qualificação abertas.
Uma limitação prática foi a ausência, no momento da pesquisa, de uma funcionalidade no sistema de compras da Petrobras para importar uma lista de fornecedores gerada externamente. A implementação dessa funcionalidade está prevista para o quarto trimestre de 2025, o que viabilizará testes piloto e a validação dos modelos em processos de contratação reais, permitindo a mensuração precisa do impacto da solução no ambiente operacional.
Este trabalho demonstrou a viabilidade e o potencial da aplicação de machine learning para aprimorar a seleção de fornecedores nos processos de DLV da Petrobras. O algoritmo desenvolvido, baseado no Random Forest, gerou modelos preditivos com métricas de desempenho robustas, especialmente para materiais com baixa eficiência histórica de contratação. A implementação desta solução pode gerar significativa redução de custos administrativos e de TI, além de aumentar a agilidade e a efetividade do processo de suprimentos.
A próxima etapa é a validação empírica dos modelos em ambiente de produção, assim que a funcionalidade sistêmica estiver disponível. Recomenda
Referências:
Brasil. 2016. Lei nº 13.303, de 30 de junho de 2016. Dispõe sobre o estatuto jurídico da empresa pública, da sociedade de economia mista e de suas subsidiárias, no âmbito da União, dos Estados, do Distrito Federal e dos Municípios.
Breiman, L. 2001. Random Forests. Machine Learning, 45(1), 5-32.
Carvalho, J. & Santos, F. 2021. Gestão da Cadeia de Suprimentos: Estratégias para o Século XXI. Editora Atlas, São Paulo, SP, Brasil.
Drentin, R., Erriquez, M., Nee, C., & Ziegler, M. 2018. Long tail, big savings: Digital unlocks hidden value in procurement. McKinsey & Company.
Gidiagba, J. O.; Tartibu, L. K.; Okwu, M. O. 2025. A systematic review of machine learning applications in sustainable supplier selection. Decision Analytics Journal 14: 1-21.
Hosmer Jr, D. W., Lemeshow, S. 2000. Applied logistic regression. 2ed. John Wiley & Sons, Hoboken, NJ, Estados Unidos da América.
Mendes, P. 2022. Desafios do Procurement em Grandes Corporações. Revista de Administração e Negócios, 18(2): 45-60.
Oliveira, A. 2023. Pré-processamento de Dados para Modelos Preditivos: Um Guia Prático. Editora Érica, São Paulo, SP, Brasil.
Petróleo Brasileiro S. A. [PETROBRAS]. 2024. Plano de Negócios 2025-2029. Disponível em: <https://api. mziq. com/mzfilemanager/v2/d/25fdf098-34f5-4608-b7fa-17d60b2de47d/4c9eecc5-c298-081d-799f-217fff1a1c82? origin=2>. Acesso em: 29 mar. 2025.
Procurement Negócios Eletrônicos S. A. [PETRONECT]. 2025. Portal de compras e fornecedores da Petrobras. Disponível em: <https://www. petronect. com. br/>. Acesso em: 02 abr. 2025.
Resumo executivo oriundo de Trabalho de Conclusão de Curso de Especialização em Data Science e Analytics do MBA USP/Esalq
Saiba mais sobre o curso; clique aqui:






































