
02 de março de 2026
Comparação de modelos preditivos para identificação de fraudes em cartões de crédito
Gilberto Luiz Angelice de Camargo; Jailson dos Santos SIlva
Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.
Este trabalho compara o desempenho de três algoritmos de aprendizado supervisionado — regressão logística, XGBoost e redes neurais artificiais — na detecção de fraudes em transações com cartão de crédito. A análise utilizou uma base de dados pública e sintética, caracterizada por um severo desbalanceamento de classes, para simular cenários operacionais realistas. A investigação mensurou a performance técnica por meio de métricas como sensibilidade e precisão e discutiu as implicações gerenciais da implementação de cada abordagem. O estudo preenche uma lacuna na literatura ao realizar uma comparação direta e padronizada entre esses algoritmos, submetendo-os às mesmas condições de pré-processamento e avaliação para uma análise conclusiva sobre seu comportamento diante do desafio de detectar eventos raros.
A crescente digitalização das transações financeiras aumentou a conveniência, mas também ampliou a superfície de ataque para atividades fraudulentas. Autores como Abdulkreem e Abdulazeez (2024) destacam que a tecnologia, ao facilitar serviços, cria novas vulnerabilidades exploradas por agentes mal-intencionados. A complexidade dos sistemas modernos, conforme apontado por Wiese (2007), exige a superação de métodos tradicionais baseados em regras fixas, que são insuficientes para o volume e a velocidade das transações digitais. Nesse cenário, a adoção de soluções baseadas em inteligência artificial, especialmente o aprendizado de máquina, tornou-se imperativa para sistemas de defesa robustos.
As técnicas de aprendizado de máquina supervisionado são ferramentas eficazes na luta contra a fraude, pois identificam padrões sutis e não lineares em grandes volumes de dados, distinguindo comportamentos legítimos e anômalos. Zhang (2023) demonstra que modelos como XGBoost e redes neurais profundas aprendem os padrões de gastos de um cliente e identificam desvios que possam indicar fraude, mesmo em dados ruidosos e desbalanceados. A principal vantagem é a adaptabilidade: os modelos podem ser retreinados com novos dados para reconhecer novas ameaças, garantindo uma proteção dinâmica contra estratégias de fraude em constante evolução.
Um dos desafios técnicos mais significativos é o desbalanceamento extremo das classes. Em conjuntos de dados transacionais, as operações fraudulentas representam uma fração mínima, frequentemente inferior a 1%. Essa assimetria torna métricas como a acurácia inadequadas, pois um modelo que classifica todas as transações como legítimas ainda alcançaria uma acurácia superior a 99%, sendo inútil na prática. Awoyemi et al. (2017) ressaltam a importância de métricas como a sensibilidade (recall), que mede a proporção de fraudes reais corretamente identificadas, e a precisão, que mede a proporção de alertas que eram de fato fraudes. O equilíbrio entre elas é fundamental, pois um excesso de falsos positivos prejudica clientes legítimos, enquanto um excesso de falsos negativos resulta em perdas financeiras.
A literatura explora diversas abordagens para esses desafios. O XGBoost, um algoritmo de árvores de decisão gradiente-boosted, é citado por sua robustez e eficiência (Chen & Guestrin, 2016). As redes neurais, especialmente arquiteturas profundas, oferecem flexibilidade para capturar interações complexas (Singh et al., 2023; Wiese, 2007). Além dos algoritmos, técnicas de pré-processamento como engenharia de atributos e balanceamento de dados são cruciais para a performance (Mienye e Sun, 2023). Poucos trabalhos realizam uma comparação sistemática entre diferentes algoritmos sob um framework unificado, uma lacuna que este estudo aborda ao avaliar regressão logística, XGBoost e redes neurais em condições idênticas.
A metodologia deste estudo foi quantitativa e experimental, comparando o desempenho preditivo dos algoritmos em uma tarefa de classificação binária. A base de dados selecionada, “Credit Card Transactions Fraud Detection” (Kaggle), foi escolhida por seu forte desbalanceamento de classes. O conjunto de treinamento continha 1.296.675 registros, com 0,58% (7.506 casos) de fraude, enquanto o conjunto de teste possuía 555.719 registros, com 0,39% (2.145 casos) de fraude. Essa assimetria exigiu a adoção de estratégias específicas no treinamento e na seleção das métricas de avaliação, priorizando a detecção da classe minoritária.
O pré-processamento dos dados foi uma etapa crítica. Realizou-se engenharia de atributos, convertendo variáveis temporais como “transdatetranstime” e “dob” para o formato datetime e criando novas variáveis como a idade do cliente, a hora do dia e o dia da semana. Variáveis irrelevantes ou ruidosas (“transnum”, “ccnum”, informações pessoais) foram removidas. As variáveis categóricas remanescentes (“category”, “gender”, “diasemana”) foram codificadas com OneHotEncoder, e as variáveis numéricas foram padronizadas com StandardScaler, um passo essencial para algoritmos sensíveis à escala como regressão logística e redes neurais.
A construção e avaliação dos modelos seguiram um pipeline estruturado. A Regressão Logística foi implementada como baseline, sendo otimizada via GridSearchCV com validação cruzada para maximizar a sensibilidade, testando diferentes valores para o parâmetro de regularização C e para o peso das classes (class_weight). O XGBoost foi avaliado com parâmetros padrão (usando a métrica aucpr) e com hiperparâmetros otimizados via GridSearchCV, focando na maximização da sensibilidade. A otimização incluiu parâmetros como profundidade máxima das árvores e taxa de aprendizado.
O terceiro modelo foi uma Rede Neural Artificial feedforward (TensorFlow/Keras), com uma camada de entrada, duas camadas ocultas (32 e 16 neurônios, ativação ReLU) e uma camada de saída sigmoide. O modelo foi compilado com o otimizador Adam e a função de perda binarycrossentropy. Foram treinadas duas versões: uma sem tratamento para o desbalanceamento e outra com o parâmetro classweight para penalizar erros na classe minoritária. A análise deste modelo explorou a curva de precisão versus sensibilidade para diferentes limiares de decisão, permitindo uma calibragem fina do ponto de corte. Todos os modelos foram treinados no conjunto de treino e avaliados no de teste para garantir a capacidade de generalização.
A análise comparativa dos resultados revelou diferenças substanciais no desempenho, destacando o trade-off entre sensibilidade e precisão. A sensibilidade mede a capacidade de identificar fraudes, crucial para minimizar perdas, enquanto a precisão mede a proporção de alertas corretos, vital para evitar o impacto negativo sobre clientes legítimos. A escolha de qual métrica priorizar depende da estratégia de negócio e da tolerância ao risco da instituição.
O modelo de Regressão Logística demonstrou uma performance limitada. Em sua configuração inicial, sem ajuste para o desbalanceamento, obteve uma sensibilidade de 0%, sendo incapaz de identificar a classe minoritária. Após otimização com GridSearchCV, que ajustou o peso das classes, a sensibilidade aumentou para 74%, mas com uma precisão de apenas 2%. Isso significa que para cada 100 alertas de fraude, apenas 2 seriam reais, tornando o sistema operacionalmente inviável devido ao alto volume de falsos positivos, corroborando os achados de Awoyemi et al. (2017).
O XGBoost apresentou um desempenho técnico superior. Com parâmetros padrão, alcançou um equilíbrio de 74% de sensibilidade e 88% de precisão, posicionando-se como uma solução viável. Quando otimizado para maximizar a sensibilidade, atingiu 97%, identificando quase todas as fraudes. Contudo, esse foco resultou em uma queda na precisão para 19%. Esse comportamento, destacado por He & Garcia (2009), ilustra que a maximização da sensibilidade pode introduzir ruído operacional. Gerencialmente, a implementação de um modelo com essa configuração exigiria um sistema de segunda camada para filtrar os falsos positivos, uma abordagem alinhada com as recomendações de Zhou et al. (2024).
As Redes Neurais demonstraram um desempenho intermediário, com o diferencial da flexibilidade estratégica proporcionada pela calibragem do limiar de decisão. Em vez de usar o limiar padrão de 0,5, foi possível analisar a curva de precisão-sensibilidade. No primeiro modelo de rede neural, sem pesos de classe, um limiar de 0,13 resultou em um desempenho balanceado com 79% de sensibilidade e 79% de precisão. No segundo modelo, com class_weight, a estratégia foi maximizar a sensibilidade. Com um limiar de 0,6, o modelo alcançou 96% de sensibilidade, mas com uma precisão de 10%.
A capacidade de ajustar o limiar de decisão confere às redes neurais uma vantagem estratégica. Conforme ressaltado por Addo et al. (2021), essa flexibilidade permite que instituições implementem políticas de risco dinâmicas, aplicando um limiar mais rigoroso para transações de alto valor e um mais flexível para clientes de baixo risco. Essa adaptabilidade, combinada com a capacidade de capturar padrões não lineares (Wiese, 2017), as torna uma ferramenta poderosa, apesar dos desafios de interpretabilidade.
A discussão dos resultados evidencia que não existe um modelo universalmente superior. A escolha da ferramenta está ligada à estratégia de risco e à capacidade operacional. O XGBoost destacou-se como o modelo tecnicamente mais poderoso em detecção, mas sua implementação exigiria mecanismos para gerenciar o alto volume de falsos positivos gerados quando otimizado para alta sensibilidade. A Regressão Logística provou ser inadequada para a complexidade do problema. A Rede Neural emergiu como a solução mais flexível e estrategicamente adaptável, permitindo um controle granular sobre o trade-off entre sensibilidade e precisão. Os achados deste estudo estão em consonância com a visão de Carcillo et al. (2018), que argumentam que a eficácia de um sistema antifraude não se mede apenas pela performance algorítmica, mas também por fatores operacionais como explicabilidade e impacto no usuário. A implementação bem-sucedida requer uma abordagem holística que integre ciência de dados e estratégia de negócios.
Este estudo comparativo demonstrou que, embora algoritmos como XGBoost e Redes Neurais superem significativamente a Regressão Logística, a escolha da solução ideal depende de um equilíbrio entre performance técnica e viabilidade operacional. O desafio central reside na gestão do trade-off entre a sensibilidade na detecção de fraudes e o controle de falsos positivos. O XGBoost provou ser o mais potente na identificação de fraudes, mas ao custo de uma alta taxa de falsos alarmes quando otimizado. A Rede Neural destacou-se pela flexibilidade, permitindo uma calibragem fina do equilíbrio entre sensibilidade e precisão através do ajuste do limiar, o que a torna uma ferramenta estrategicamente valiosa.
As limitações deste trabalho incluem o uso de um conjunto de dados sintético, que pode não refletir toda a complexidade das fraudes reais. Adicionalmente, a análise não incorporou uma avaliação do impacto financeiro dos erros do modelo. Para pesquisas futuras, recomenda-se a validação desses modelos em bases de dados reais, a exploração de variáveis comportamentais e a investigação de arquiteturas híbridas que combinem diferentes algoritmos com regras de negócio. Conclui-se que o objetivo foi atingido: demonstrou-se que os algoritmos XGBoost e redes neurais artificiais superam significativamente a regressão logística na detecção de fraudes em cenários desbalanceados, cada um oferecendo vantagens distintas em termos de poder de detecção e flexibilidade operacional, reforçando que a implementação eficaz de sistemas antifraude exige uma abordagem multidimensional que alinhe tecnologia, estratégia e operação.
Referências:
Abdulkreem, R. Z.; Abdulazeez, A. M. 2024. Financial fraud detection based on machine and deep learning: a review. Indonesian Journal of Computer Science 13(3): 4366–4375.
Addo, P. M.; Guegan, D.; Hassani, B. 2021. Financial fraud detection based on machine and deep learning. International Journal of Financial Studies, 9(3): 45–67.
Awoyemi, J. O.; Adetunmbi, A. O.; Oluwadare, S. A. 2017. Credit card fraud detection using machine learning techniques: a comparative analysis. In: 2017 International Conference on Computing Networking and Informatics (ICCNI). IEEE, Lagos, Nigeria. p. 1–9.
Carcillo, F.; Dal Pozzo, A.; Le Borgne, Y.-A.; Bontemps, L.; Cauwenberghs, E.; Bontemps, C. 2018. SCARFF: a scalable framework for streaming credit card fraud detection with Spark. Information Fusion 41: 182–194.
Chen, T.; Guestrin, C. 2016. XGBoost: a scalable tree boosting system. In: Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. ACM, San Francisco, CA, EUA. p. 785–794.
Géron, A. 2020. Mão na massa: aprendizado de máquina com Scikit-Learn, Keras e TensorFlow. 2ed. Alta Books, São Paulo, SP, Brasil.
He, H.; Garcia, E. A. 2009. Learning from imbalanced data. IEEE Transactions on Knowledge and Data Engineering 21(9): 1263–1284.
Mienye, I. D.; Sun, Y. 2023. A machine learning method with hybrid feature selection for improved credit card fraud detection. Applied Sciences 13(12): 7254.
Singh, R. B.; Kumar, M.; Sharma, V. 2024. Enhancing security in digital payments: a comparative evaluation of machine learning models for credit card fraud detection. Financial Technologies and Security of Cyber Life 6: 1–12.
Wiese, B. J. 2007. Credit card transactions, fraud detection, and machine learning: modelling time with LSTM recurrent neural networks. Tese de Mestrado em Ciência da Computação. University of the Western Cape, Cape Town, África do Sul.
Zhang, F. 2023. Improved credit card fraud detection method based on XGBoost algorithm. BCP Business & Management 38: 2888–2895.
Zhou, G.; Demirhan, H.; İçen, D. 2024. An online fuzzy fraud detection framework for credit card transactions. Expert Systems with Applications 252: 124127.
Resumo executivo oriundo de Trabalho de Conclusão de Curso de Especialização em Data Science e Analytics do MBA USP/Esalq
Saiba mais sobre o curso; clique aqui:






































