Imagem Análise comparativa de modelos de machine learning para previsão de risco de crédito

03 de março de 2026

Análise comparativa de modelos de machine learning para previsão de risco de crédito

Giovana Biasetti; Felipe Bastos Reis

Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.

Este estudo compara o desempenho de modelos de machine learning e métodos estatísticos tradicionais aplicados à modelagem de risco de crédito. Analisam-se a precisão, a capacidade preditiva e a interpretabilidade de três abordagens: Regressão Logística, Random Forest e XGBoost. A pesquisa avalia a eficácia dessas metodologias na previsão da inadimplência, utilizando um conjunto de dados público e validando os achados por meio de métricas como a Área Sob a Curva ROC (AUC-ROC) e a precisão. A interpretabilidade dos modelos é explorada com a técnica SHAP (SHapley Additive exPlanations). As contribuições deste trabalho visam aprimorar as estratégias de credit scoring, oferecendo insights para otimizar a concessão de crédito e mitigar riscos para instituições financeiras.

O sistema financeiro brasileiro enfrenta o desafio do aumento do endividamento da população. Dados do IBGE (2023) indicam que 78% das famílias brasileiras possuem dívidas, com 30% enfrentando dificuldades para honrar seus compromissos. Este cenário, conforme relatórios do Banco Central do Brasil (2023), pressiona as instituições financeiras a aprimorarem seus mecanismos de avaliação de risco. A inadimplência elevada compromete a estabilidade e a rentabilidade do setor, exigindo métodos mais sofisticados para minimizar perdas e garantir a sustentabilidade das operações de crédito (Campos, 2020). A precisão na identificação de potenciais maus pagadores é, portanto, um fator crítico para o mercado.

Historicamente, a análise de crédito era um processo manual e subjetivo, conduzido por analistas que avaliavam o perfil financeiro dos solicitantes. Este método era lento, custoso e suscetível a vieses, dependendo do julgamento individual do analista (Hand, 2021). Com o avanço computacional, o setor migrou para modelos estatísticos, que permitiram calcular a probabilidade de inadimplência de forma estruturada e escalável, introduzindo objetividade ao processo (Costa et al., 2020). Essa transição marcou o início da era do credit scoring, ferramenta que automatiza a avaliação de risco e permite decisões de crédito quase instantâneas.

Nos últimos anos, o aprendizado de máquina (machine learning) representou uma nova fronteira na modelagem de risco. Algoritmos como Random Forest e XGBoost (Extreme Gradient Boosting) ganharam destaque por sua capacidade de capturar relações não lineares e interações complexas entre variáveis, superando o desempenho de modelos estatísticos tradicionais em poder preditivo (Anderson, 2022). A função primordial dos modelos de credit scoring é estimar a probabilidade de um cliente se tornar inadimplente, informação que subsidia decisões sobre aprovação de crédito, limites e taxas de juros (Sicsú, 2010). Clientes classificados como de alto risco podem ter seu acesso ao crédito restringido, o que impacta a rentabilidade das operações (Carvalho; Mendes, 2020).

A construção de modelos de risco de crédito modernos deve considerar a responsabilidade social e a justiça algorítmica. É imperativo que os modelos não perpetuem ou amplifiquem desigualdades estruturais. Fatores socioeconômicos podem influenciar o acesso ao crédito, e os algoritmos, se não forem auditados, correm o risco de incorporar vieses discriminatórios (Barreto; Lemos, 2021). Nesse contexto, a interpretabilidade dos modelos é fundamental. Técnicas como o SHAP permitem desvendar a “caixa-preta” de algoritmos complexos, identificando quais características de um cliente mais influenciam a previsão de risco. Essa transparência atende a requisitos regulatórios e permite que as instituições justifiquem suas decisões, promovendo um acesso mais justo ao crédito (Limeira; Pereira, 2020).

A metodologia deste estudo iniciou-se com a seleção e preparação dos dados. Devido a restrições da Lei Geral de Proteção de Dados (LGPD) (Brasil, 2018), optou-se pela base de dados pública “Give Me Some Credit”, disponível na plataforma Kaggle e amplamente utilizada em estudos acadêmicos (Kaggle, 2025). O conjunto de dados contém informações de 150 mil indivíduos, com 11 variáveis como idade, renda mensal, razão de endividamento e histórico de atrasos. A escolha se justifica pelo volume de dados, que permite validação cruzada, e pela quantidade de variáveis ser inferior ao número de observações, garantindo relevância estatística para a análise multivariada (Hair et al., 2019).

Após a obtenção dos dados, realizou-se uma análise exploratória para compreender a distribuição e a correlação entre as variáveis. Foram utilizados histogramas e boxplots para identificar padrões, outliers e a relação de variáveis com a inadimplência, seguindo as diretrizes de Fávero et al. (2019). Esta etapa foi crucial para o pré-processamento, que incluiu o tratamento de valores ausentes e a padronização das variáveis numéricas com a técnica Standard Scaler. A padronização garante que as variáveis contribuam de forma equitativa para o treinamento dos modelos. O conjunto de dados foi dividido em 70% para treinamento e 30% para validação, preservando a proporção original das classes para evitar vieses.

Na fase de modelagem, foram desenvolvidos três algoritmos. O primeiro foi a Regressão Logística, um modelo linear que serve como baseline por sua simplicidade e interpretabilidade (Hastie; Tibshirani; Friedman, 2009). O segundo foi o Random Forest, um método de conjunto que constrói múltiplas árvores de decisão para aumentar a robustez e reduzir o sobreajuste (Breiman, 2001). O terceiro foi o XGBoost, uma técnica de gradient boosting conhecida por sua alta performance, que constrói árvores de forma sequencial; cada nova árvore corrige os erros da anterior (Chen; Guestrin, 2016). Para otimizar a performance, foram aplicadas técnicas de ajuste de hiperparâmetros, como Grid Search e Random Search.

A avaliação comparativa dos modelos baseou-se em métricas padrão. A acurácia mediu a proporção geral de previsões corretas. A curva AUC-ROC avaliou a capacidade do modelo de distinguir entre clientes adimplentes e inadimplentes. As métricas de precisão e recall foram analisadas para a classe de inadimplentes, pois identificar corretamente os maus pagadores (recall) é crítico em risco de crédito. A matriz de confusão foi utilizada para analisar os erros de classificação (James et al., 2013). Para garantir a transparência, a técnica SHAP foi aplicada para interpretar as previsões, revelando o impacto de cada variável (Lundberg; Lee, 2017). Os resultados quantitativos foram complementados por um questionário com sete profissionais da área para validar a aplicabilidade prática dos modelos.

A análise da Regressão Logística revelou um desempenho misto. O modelo alcançou 93% de acurácia, mas essa métrica pode ser enganosa em dados desbalanceados. A capacidade preditiva, medida pela AUC, foi de 0,71, um valor moderado. O principal ponto fraco foi a incapacidade de identificar a classe minoritária: o recall para inadimplentes foi de apenas 4%. Isso significa que o modelo detectou apenas 4 de cada 100 inadimplentes reais, representando um risco financeiro substancial. A precisão para essa classe também foi baixa, indicando que a chance de acerto ao prever um inadimplente era pequena.

A interpretabilidade via SHAP para a Regressão Logística confirmou a importância de variáveis intuitivas. O histórico de atrasos em pagamentos (superiores a 90 dias) foi o fator de maior impacto; valores mais altos aumentavam a probabilidade de inadimplência. Outras variáveis relevantes incluíram a utilização do crédito rotativo e a razão de endividamento, com correlação positiva com o risco. A idade mostrou uma relação inversa, com clientes mais jovens associados a um risco maior. A renda mensal elevada atuou como fator protetor. Embora o modelo seja interpretável, sua performance limitada na detecção da classe de interesse o torna inadequado para uso isolado.

O modelo Random Forest demonstrou uma melhoria substancial. A acurácia geral foi de 94%, mas o avanço significativo foi na capacidade discriminativa. A AUC saltou para 0,84, indicando uma habilidade superior para diferenciar entre bons e maus pagadores. O recall para a classe de inadimplentes aumentou de 4% para 19%, um crescimento de mais de quatro vezes. Embora ainda baixo, representa uma melhora drástica na detecção. A precisão para essa classe atingiu 57%, significando que mais da metade das previsões de inadimplência estavam corretas. O resultado evidencia a capacidade dos modelos baseados em árvores de lidar melhor com a complexidade dos dados.

A análise SHAP para o Random Forest reforçou os achados do modelo anterior. O histórico de atrasos nos pagamentos continuou sendo a variável mais influente. Fatores como o saldo do crédito rotativo e o montante da dívida também se mostraram preditores fortes. A renda mensal e a idade mantiveram seu papel como fatores protetores. A consistência na importância das variáveis entre os modelos confere confiança aos resultados, sugerindo que esses são os principais determinantes do risco de crédito no conjunto de dados. O Random Forest, ao combinar múltiplas árvores, capturou padrões mais sutis que o modelo linear.

O modelo XGBoost consolidou-se como o de melhor desempenho. A acurácia foi de 94%, similar à do Random Forest, mas a AUC atingiu 0,86, o valor mais alto do estudo. Este resultado indica que o XGBoost possui o maior poder preditivo. As métricas de precisão (58%) e recall (19%) para a classe inadimplente foram ligeiramente superiores às do Random Forest, confirmando sua superioridade. A performance do XGBoost é consistente com a literatura, que aponta algoritmos de gradient boosting como estado da arte para problemas de classificação com dados tabulares (Chen; Guestrin, 2016).

A interpretabilidade do XGBoost, via SHAP, revelou uma distribuição de importância das variáveis semelhante à do Random Forest. O histórico de atrasos, o uso de crédito rotativo, a razão de endividamento e a idade permaneceram como os principais preditores. A consistência entre os modelos baseados em árvores sugere que eles capturam a mesma estrutura subjacente nos dados, mas o XGBoost o faz de maneira mais eficiente. A capacidade do algoritmo de construir árvores sequencialmente, focando nos erros das iterações anteriores, permite um ajuste mais fino aos padrões complexos.

A comparação dos modelos evidencia uma clara hierarquia de desempenho. A Regressão Logística, embora interpretável, mostrou-se insuficiente para identificar inadimplentes. Os modelos baseados em árvores, Random Forest e XGBoost, foram superiores, com o XGBoost apresentando a melhor performance. Estes resultados corroboram estudos que apontam a robustez de algoritmos de conjunto em problemas de credit scoring (Breiman, 2001). O baixo recall em todos os modelos, no entanto, ressalta o desafio de prever eventos raros. Em contextos práticos, técnicas como ponderação de classes ou reamostragem (SMOTE) poderiam ser aplicadas para melhorar a detecção da classe minoritária (More, 2016).

Os dados primários coletados com profissionais do mercado validaram os achados. A maioria indicou preferência pelo Gradient Boosting (XGBoost) para aplicações práticas, citando sua alta capacidade preditiva. Eles reconheceram, contudo, a complexidade na otimização de hiperparâmetros e o risco de overfitting. A Regressão Logística foi valorizada por sua simplicidade e interpretabilidade, sendo considerada uma ferramenta para criar um baseline. O Random Forest foi percebido como um modelo intermediário, robusto, mas geralmente superado pelo XGBoost. Essa percepção do mercado alinha-se aos resultados empíricos deste estudo.

Em síntese, este trabalho demonstrou a superioridade dos algoritmos de machine learning baseados em árvores sobre o método estatístico tradicional na previsão de risco de crédito. Os resultados indicam que Random Forest e XGBoost superam a Regressão Logística em capacidade discriminativa (AUC) e na detecção de inadimplentes (recall), com o XGBoost emergindo como o modelo mais performático. A análise com SHAP identificou o histórico de atrasos, o uso de crédito rotativo, a razão de endividamento e a idade como os fatores mais relevantes. Teoricamente, o estudo reforça a eficácia de modelos não lineares em finanças. Na prática, sugere que a adoção de modelos como o XGBoost, aliada a ferramentas de interpretabilidade, pode otimizar a concessão de crédito.

As limitações do estudo incluem o uso de um único conjunto de dados, o que restringe a generalização, e uma análise estática que não considera a degradação do desempenho dos modelos ao longo do tempo. Pesquisas futuras poderiam expandir a análise para múltiplas bases de dados, investigar a robustez temporal e explorar arquiteturas como redes neurais. Conclui-se que o objetivo foi atingido: demonstrou-se que os modelos de machine learning baseados em árvores, especialmente o XGBoost, apresentam desempenho preditivo superior à Regressão Logística na modelagem de risco de crédito, embora o desafio de identificar a classe minoritária persista.

Referências:
ANDERSON, R. Credit Scoring and Its Applications. 2. ed. Cambridge: Cambridge University Press, 2022.
BANCO CENTRAL DO BRASIL. Relatório de Economia Bancária. Brasília: BCB, 2023.
BARRETO, R.; LEMOS, A. Desigualdade e Crédito no Brasil: Um estudo sobre os impactos socioeconômicos. Revista Brasileira de Economia, 2021.
BRASIL. Lei nº 13.709, de 14 de agosto de 2018. Dispõe sobre a proteção de dados pessoais e altera a Lei nº 12.965, de 23 de abril de 2014 (Marco Civil da Internet). Disponível em: https://www. planalto. gov. br/ccivil03/ato2015-2018/2018/lei/L13709. htm. Acesso em: Março de 2025.
BREIMAN, L. Random forests. Machine Learning, 45(1), 5–32, 2001.
CAMPOS, R. P. Impactos do endividamento sobre a sustentabilidade do setor financeiro. Revista Brasileira de Finanças, São Paulo, v. 14, n. 2, p. 134-150, 2020.
CARVALHO, A. R.; MENDES, F. J. O impacto da inadimplência no sistema financeiro: uma análise quantitativa. Revista de Economia Aplicada, Rio de Janeiro, v. 12, n. 1, p. 45-61, 2020.
CHEN, T.; GUESTRIN, C. XGBoost: A scalable tree boosting system. Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 2016.
COSTA, A. S.; SOUZA, M. F. Aplicação de modelos estatísticos na análise de risco de crédito: um estudo no mercado brasileiro. Revista Brasileira de Análise de Dados, Rio de Janeiro, v. 33, n. 3, p. 112-127, 2020.
FAVERO, L. P.; BELFIORE, P.; SILVA, F. L.; CHAN, B. L. Manual de análise de dados: estatística e modelagem multivariada com Excel®, SPSS® e Stata®. 1. ed. Rio de Janeiro: Elsevier, 2019.
HAIR, J. F. et al. Multivariate Data Analysis. 8th ed., Pearson, 2019.
HAND, D. J.; HENLEY, W. E. Statistical Classification Methods in Credit Scoring: A Review. Chichester: Wiley, 2021.
HASTIE, T.; TIBSHIRANI, R.; FRIEDMAN, J. The Elements of Statistical Learning. Springer, 2009.
IBGE. Pesquisa de Endividamento e Inadimplência do Consumidor (PEIC). Brasília: IBGE, 2023.
JAMES, G. et al. An Introduction to Statistical Learning. Springer, 2013.
KAGGLE. GiveMeSomeCredit: predict the probability of default and improve on the state of the art. 2011. Disponível em: https://www. kaggle. com/c/GiveMeSomeCredit/data. Acesso em: 9 ago. 2025.
LIMEIRA, S. D.; PEREIRA, T. F. A explicabilidade de modelos de machine learning no risco de crédito: análise e resultados. Revista Brasileira de Ciência de Dados, Curitiba, v. 16, n. 2, p. 143-156, 2020.
LUNDBERG, S. M.; LEE, S.-I. A Unified Approach to Interpreting Model Predictions. Advances in Neural Information Processing Systems, 2017.
MORE, A. Survey of resampling techniques for improving classification performance in unbalanced datasets. 2016.
SICSÚ, A. L. Credit Scoring: Desenvolvimento, Implantação, Acompanhamento. São Paulo: Blucher, 2010.


Resumo executivo oriundo de Trabalho de Conclusão de Curso de Especialização em Data Science e Analytics do MBA USP/Esalq

Saiba mais sobre o curso; clique aqui:

Quem editou este artigo

Você também pode gostar

Quer ficar por dentro das nossas últimas publicações? Inscreva-se em nossa newsletter!

Receba conteúdos e fique sempre atualizado sobre as novidades em gestão, liderança e carreira com a Revista E&S.

Ao preencher o formulário você está ciente de que podemos enviar comunicações e conteúdos da Revista E&S. Confira nossa Política de Privacidade