27 de abril de 2026
BI e Dados Qualitativos na Recuperação de Crédito Bancário
Gustavo Luz Raft; Renan Luquini
Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.
A inadimplência bancária constitui um dos obstáculos mais significativos para a saúde financeira das instituições, impactando de forma direta a rentabilidade, os níveis de liquidez e o potencial de reinvestimento no mercado. O crédito desempenha um papel vital nas economias contemporâneas, atuando como um motor para a expansão do consumo, a geração de renda e o estímulo ao crescimento econômico sustentado (Rocha, 2010). Entretanto, a democratização e a ampliação da oferta de crédito trazem intrinsecamente o risco de inadimplemento, o qual exige uma gestão rigorosa pautada em instrumentos técnicos e estratégicos que busquem o equilíbrio entre a inclusão financeira e a preservação da sustentabilidade das carteiras de ativos. Historicamente, as práticas de análise de crédito e os processos de cobrança evoluíram de uma postura meramente reativa para a implementação de modelos proativos de monitoramento e priorização. No passado, tais práticas fundamentavam-se em relatórios massificados que apresentavam baixa sensibilidade ao histórico individualizado dos clientes e falhavam em integrar as percepções subjetivas dos agentes que atuam na linha de frente da recuperação. Essa desconexão reduzia a efetividade das abordagens, uma vez que a concessão de crédito deve ser acompanhada de políticas de cobrança planejadas que considerem a realidade específica de cada devedor e permitam flexibilidade nas negociações (Hoji, 2000).
O advento das tecnologias de Business Intelligence e a análise de grandes volumes de dados transformaram o setor bancário, permitindo a construção de painéis interativos que facilitam a visualização ágil e personalizada de informações complexas. A integração de múltiplas variáveis, tanto quantitativas quanto qualitativas, em um processo de apoio à decisão torna-se essencial em um cenário onde a centralidade da informação é o principal insumo estratégico. A utilização de linguagens de programação como Python e ferramentas de visualização como Streamlit oferece vantagens competitivas em termos de reprodutibilidade, escalabilidade e flexibilidade metodológica, permitindo que as instituições se adaptem rapidamente às exigências operacionais e regulatórias. A edição da Resolução CMN número 4.966/2021 alterou profundamente a forma como os riscos de crédito devem ser reconhecidos e provisionados no Brasil. Diferente do modelo anterior, que se baseava em perdas já concretizadas, a nova norma exige a mensuração contábil fundamentada em modelos de perda esperada. Essa transição obriga as instituições financeiras a identificar sinais de deterioração financeira de forma proativa, mesmo antes da ocorrência de um inadimplemento formal, considerando indicadores como a reestruturação de dívidas, o ajuizamento de ações e a incapacidade de pagamento nas condições originalmente pactuadas (Bacen, 2024).
Nesse contexto regulatório e tecnológico, a incorporação de insumos qualitativos no processo de recuperação de crédito ganha uma relevância sem precedentes. A experiência cotidiana dos agentes de cobrança contém sinais valiosos sobre a real probabilidade de pagamento de um cliente, elementos que frequentemente são negligenciados por sistemas de priorização puramente estatísticos. A ausência de valorização dessas percepções subjetivas pode resultar em desinteresse e falta de compromisso por parte dos colaboradores, cujas funções acabam restritas a tarefas operacionais de baixo impacto. A integração dessas informações, desde que devidamente calibradas e validadas, possui o potencial de aumentar a acurácia dos modelos de risco e promover um maior engajamento das equipes com o processo de recuperação. A simulação de dados surge como um elemento metodológico fundamental para testar tais conceitos, permitindo a reprodução de padrões de inadimplência plausíveis em bases sintéticas. A parametrização de dívidas e atrasos em populações homogêneas possibilita a criação de cenários que refletem a realidade de programas habitacionais e de crédito para baixa renda, garantindo verossimilhança às modelagens e permitindo o teste de novas metodologias de gestão (Fraga; Vieira, 2020).
A construção de um painel interativo que integre variáveis quantitativas e qualitativas representa uma contribuição direta para a modernização da gestão da inadimplência. Ao contrário dos modelos tradicionais, a solução proposta valoriza a percepção do agente de cobrança, calibrando-a com base na aderência histórica e em conformidade com as diretrizes da Resolução CMN número 4.966/2021. O objetivo central reside no desenvolvimento de uma ferramenta capaz de apoiar a priorização de clientes inadimplentes por meio de um modelo que combina o valor em atraso, os dias de inadimplência e a recorrência com avaliações subjetivas transformadas por funções matemáticas e ponderadas por desempenho empírico. Ao unir o rigor estatístico ao conhecimento prático dos agentes, busca-se demonstrar a aplicabilidade das ferramentas de Business Intelligence na recuperação de ativos e na conformidade regulatória do setor financeiro nacional.
A metodologia aplicada fundamentou-se em uma abordagem quantitativa, descritiva e aplicada, estruturada a partir da construção de dados simulados e do desenvolvimento de um modelo computacional em Python. O processo metodológico compreendeu desde a geração de bases mensais fictícias até a estruturação de um painel interativo em Streamlit, desenhado para integrar informações críticas ao fluxo de cobrança. A utilização de dados simulados permitiu testar a lógica dos indicadores e a robustez do modelo antes de qualquer aplicação em ambientes reais, garantindo que os parâmetros definidos possuíssem o rigor necessário para a análise. Para assegurar a aderência da simulação ao contexto das agências bancárias, foram utilizados dados da Pesquisa de Endividamento e Inadimplência do Consumidor, que forneceram os percentuais de endividamento, o atraso médio e a distribuição das faixas de inadimplência. Complementarmente, foram incorporados achados empíricos sobre a inadimplência em programas habitacionais populares para refinar o perfil dos clientes simulados (Fraga; Vieira, 2020).
A base inicial de dados foi composta por aproximadamente 300 famílias simuladas, das quais 29,9% foram classificadas como inadimplentes no primeiro mês, totalizando 100 clientes em atraso. A distribuição interna dessa amostra seguiu uma lógica de 60% na faixa de zero a 30 dias, 25% na faixa de 31 a 90 dias e 15% acima de 90 dias de atraso. Nos meses subsequentes, foram aplicadas regras de migração de carteira: uma parcela dos clientes na faixa inicial foi recuperada e excluída da base, enquanto os demais avançaram para estágios mais críticos de atraso. Os clientes com mais de 90 dias de inadimplência apresentaram uma taxa de recuperação reduzida, permanecendo majoritariamente na mesma faixa. Para manter a estabilidade da base em 100 inadimplentes mensais, novos entrantes foram adicionados periodicamente. A composição das dívidas foi segmentada em categorias específicas: cartão de crédito representou 54,66% do volume; financiamento habitacional correspondeu a 13,56%; financiamento de veículos somou 10,12%; crédito pessoal atingiu 8,10%; cheque especial representou 10,73% e o crédito consignado totalizou 2,83%. Os valores das dívidas variaram entre R$ 5 mil e R$ 90 mil, com uma concentração observada entre R$ 15 mil e R$ 30 mil. O valor efetivamente em atraso foi calculado como uma fração variando de 10% a 60% da dívida total.
A simulação dos canais de contato baseou-se em relatórios de desempenho de grandes instituições financeiras públicas, como o Banco do Brasil e a Caixa Econômica Federal, referentes ao quarto trimestre de 2023. Os canais foram harmonizados em dois grandes blocos: digitais, englobando aplicativos móveis, internet banking, WhatsApp e centrais de atendimento remoto; e presenciais, incluindo agências físicas, correspondentes bancários e terminais de autoatendimento. A atribuição dos canais aos contatos seguiu uma matriz probabilística baseada na média ponderada dos dados de mercado, refletindo a predominância dos meios digitais. No que tange ao sucesso operacional, os contatos presenciais foram definidos como plenamente bem-sucedidos em termos de efetivação da comunicação, enquanto os canais digitais receberam uma taxa média de sucesso de 92%, com uma variação controlada de três pontos percentuais para mais ou para menos. Para garantir a relevância estatística de todos os meios, aplicou-se uma função proporcional ao uso de cada canal, respeitando um piso mínimo de 5%.
Para a variável qualitativa, implementou-se uma escala de zero a 10 pontos para captar a percepção do agente de cobrança sobre a probabilidade de recuperação. Foi aplicada uma função quadrática centrada no valor cinco, de maneira que as notas próximas ao ponto médio recebessem um peso relativo superior, enquanto os valores extremos tivessem sua influência atenuada no modelo final. Na segunda carga de dados, a relevância desse insumo qualitativo foi calibrada de acordo com a aderência empírica observada para cada agente. Calculou-se a taxa de acerto entre a nota atribuída e o desfecho real do cliente, fosse ele a quitação, a manutenção da inadimplência ou uma negociação parcial. O peso da variável qualitativa no modelo de priorização foi ajustado proporcionalmente a essa consistência, garantindo que os agentes com maior precisão histórica tivessem maior impacto no ranking. As variáveis quantitativas, que incluíram o número de contatos, o valor da dívida, os dias em atraso e a recorrência, foram padronizadas por meio de z-score e sintetizadas em um único componente principal via análise de componentes principais. O escore final de prioridade resultou da soma entre esse componente quantitativo e o qualitativo ajustado, permitindo a ordenação decrescente dos clientes para atendimento.
O desenvolvimento do painel interativo em Python e Streamlit consolidou todas as etapas em uma interface única, dividida em quatro blocos operacionais. O primeiro bloco oferece uma visão geral da carteira e destaca o cliente prioritário, apresentando a distribuição das faixas de atraso. O segundo bloco é dedicado à gestão da fila de contatos, permitindo que o agente registre as interações diretamente no sistema. O terceiro bloco apresenta a evolução temporal da carteira e o desempenho da equipe por meio de gráficos de linhas e barras. Por fim, o quarto bloco mantém o registro do último contato realizado, assegurando a rastreabilidade das ações. Todo o processo foi documentado em scripts reprodutíveis, utilizando bibliotecas como pandas, numpy, scikit-learn e matplotlib, o que garante a transparência e a possibilidade de auditoria do modelo.
A aplicação da metodologia resultou na construção de três ciclos mensais de dados simulados, abrangendo cerca de 300 famílias e mantendo um fluxo constante de 100 clientes inadimplentes por período. A estrutura modular do painel de Business Intelligence assegurou a rastreabilidade total das informações, integrando as bases de clientes, o histórico de contatos e os indicadores de desempenho por meio do identificador único de cada cliente. A simulação replicou com fidelidade a dinâmica de fluxos mensais da carteira bancária, onde clientes migram entre diferentes faixas de atraso conforme o tempo transcorre. Observou-se que a manutenção da proporção de 60/25/15 entre as faixas de atraso, conforme os parâmetros da pesquisa de endividamento, exigiu uma gestão precisa das entradas e saídas de novos devedores. Os dados demonstraram que a harmonização dos canais de atendimento refletiu a realidade do setor bancário brasileiro, com uma predominância crescente dos meios digitais, que superaram a marca de 75% de participação, chegando a 79% em períodos mais recentes.
O painel exibiu indicadores estratégicos cruciais, como o valor total em atraso, o tempo médio de inadimplência e a taxa de recuperação segmentada por faixa de atraso. A eficiência por canal de contato também foi monitorada, permitindo identificar quais meios de comunicação apresentavam melhores resultados para diferentes perfis de dívida. O ranking de prioridade, construído a partir da padronização das variáveis, mostrou-se altamente coerente com a realidade operacional. Clientes com maiores valores de dívida e tempos de atraso mais prolongados foram sistematicamente posicionados no topo da lista de atendimento. A análise estatística revelou uma correlação positiva entre a posição no ranking e a probabilidade simulada de quitação. Entre os 20 primeiros clientes listados, a taxa de recuperação foi superior a 60%, enquanto no grupo de menor prioridade, esse índice caiu para menos de 20%. Para testar a robustez dessa ordenação, realizou-se uma análise de sensibilidade variando os pesos das variáveis principais em 10% para mais ou para menos. A ordenação dos clientes permaneceu praticamente inalterada, especialmente entre os dez primeiros colocados, o que sugere que o modelo possui alta resiliência a ajustes marginais e baixo risco de instabilidade na priorização.
A integração dos insumos qualitativos trouxe mudanças significativas na dinâmica do ranking. Após o ajuste pela aderência dos agentes, cerca de 18% dos clientes mudaram de posição na fila de prioridade. Desse total, 6% dos clientes avançaram para posições de maior destaque, enquanto 12% foram rebaixados. Esse resultado comprova que a opinião técnica dos agentes de cobrança, quando devidamente calibrada, possui o poder de influenciar o modelo e refinar a estratégia de recuperação. Do ponto de vista prático, a inclusão dessa variável sinaliza uma oportunidade de valorização profissional para os colaboradores da linha de frente. A baixa remuneração e a atuação limitada a tarefas repetitivas tendem a gerar desengajamento. Ao transformar a percepção do agente em um dado estatístico que altera a estratégia da instituição, promove-se um maior comprometimento com o processo global de recuperação de crédito.
Apesar dos resultados positivos e da viabilidade comprovada do protótipo, algumas limitações devem ser consideradas. O uso de dados simulados, embora parametrizado em fontes confiáveis e em conformidade com a Resolução CMN número 4.966/2021, não substitui a complexidade e a heterogeneidade dos dados reais de uma instituição financeira. A validação plena do modelo só poderá ocorrer em um ambiente operacional real que reflita as diversidades regionais e o histórico efetivo de inadimplência de uma carteira viva. Além disso, não foram conduzidos testes de consistência interna exaustivos ou correlações com taxas reais de recuperação de mercado, e o modelo não simulou mudanças macroeconômicas bruscas que poderiam alterar o perfil de risco dos devedores. No entanto, o painel cumpriu o objetivo de demonstrar como as ferramentas de ciência de dados e Business Intelligence podem modernizar a gestão da inadimplência e antecipar as necessidades regulatórias.
A discussão dos resultados aponta para a necessidade de uma documentação detalhada das versões das bibliotecas de programação utilizadas para garantir a reprodutibilidade do ambiente computacional. A evolução do modelo pode incluir a inserção de novas variáveis, como o histórico judicial dos devedores, dados de comportamento digital e indicadores macroeconômicos regionais. A realização de testes de estresse ampliados também é recomendada para o planejamento estratégico de longo prazo. A integração de técnicas de Data Science and Analytics, combinando estatística aplicada, simulação paramétrica e análise multivariada, permitiu estruturar uma lógica transparente e alinhada às melhores práticas de modelagem quantitativa. A utilização de Python e suas bibliotecas especializadas reforçou o caráter aplicado do projeto, evidenciando o potencial da ciência de dados na transformação de processos tradicionais de cobrança bancária.
A vinculação do estudo a uma base metodológica sólida permitiu conectar o rigor acadêmico à relevância prática exigida pelo mercado financeiro. A proposta evidenciou que a incorporação de variáveis qualitativas em um painel dinâmico amplia a previsibilidade das ações de cobrança e melhora a eficiência dos contatos. O modelo desenvolvido oferece uma visão gerencial estruturada, permitindo que os gestores monitorem não apenas o desempenho da carteira, mas também a eficácia individual de cada agente e de cada canal de comunicação. Essa abordagem integrada é fundamental para a evolução das práticas de Business Intelligence no setor bancário, reforçando o papel da análise de dados como elemento central para a eficiência operacional, a conformidade regulatória e a inovação tecnológica.
Conclui-se que o objetivo foi atingido por meio da criação de um modelo prototipado funcional para o ordenamento e a gestão de carteiras de clientes inadimplentes, fundamentado na integração de técnicas avançadas de análise de dados e visualização interativa. A utilização de dados simulados e parametrizados garantiu o realismo necessário para validar a robustez do ranking de prioridade e a aplicabilidade dos indicadores estratégicos. O trabalho demonstrou que a combinação de variáveis quantitativas com a percepção calibrada dos agentes de cobrança aumenta a eficácia da recuperação de crédito e promove o engajamento das equipes. Embora existam limitações inerentes ao uso de bases sintéticas, a solução mostrou-se apta para a transição para ambientes reais, oferecendo uma ferramenta valiosa para a tomada de decisão e para a adaptação às novas exigências da Resolução CMN número 4.966/2021, consolidando a ciência de dados como pilar essencial para a modernização das operações bancárias.
Referências Bibliográficas:
BANCO CENTRAL DO BRASIL. Resolução CMN nº 4.966, de 25 de novembro de 2021. Dispõe sobre critérios para classificação das operações de crédito. Disponível em: https://www.bcb.gov.br. Acesso em: 10 jun. 2025.
FRAGA, Nayra; VIEIRA, Rogério. Inadimplência no programa Minha Casa Minha Vida: um estudo com beneficiários da Faixa 1. Revista de Administração Pública, v. 54, n. 3, p. 489–507, 2020.
HOJI, Masakazu. Administração financeira: uma abordagem prática. São Paulo: Atlas, 2001.
ROCHA, Fabiana Cunha. A inadimplência de créditos no setor bancário brasileiro: um estudo de caso. 2010. Monografia (Graduação em Ciências Econômicas) – Universidade Federal de Santa Catarina, Florianópolis, 2010.
Resumo executivo oriundo de Trabalho de Conclusão de Curso da Especialização em Data Science e Analytics do MBA USP/Esalq
Para saber mais sobre o curso, clique aqui e acesse a plataforma MBX Academy




























