Imagem Identificação e ordenamento de grupos homogêneos de clientes bancários conforme as características de vulnerabilidade

04 de março de 2026

Identificação e ordenamento de grupos homogêneos de clientes bancários conforme as características de vulnerabilidade

Carolina Borges Hartmann; Eder Costa Cassettari

Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.

As atividades realizadas pelas instituições bancárias integram o cotidiano da sociedade contemporânea, seja por meio da prestação de serviços diretos ou pela intermediação financeira, que consiste fundamentalmente na captação de recursos junto a agentes superavitários para o financiamento de agentes deficitários (Silva, 2016). Para assegurar um equilíbrio sustentável na relação entre bancos e clientes, o Banco Central do Brasil estabeleceu a Resolução CMN 4.949 em 2021, que dispõe sobre o relacionamento entre as instituições e seus usuários em todas as fases de contratação, definindo a obrigatoriedade de um tratamento justo e equitativo, especialmente para perfis com vulnerabilidades associadas. Complementarmente, a Federação Brasileira de Bancos instituiu o Normativo SARB 024 em 2021, que orienta as diretrizes para o trato com consumidores que possuem menor capacidade de discernimento e compreensão para a tomada de decisões financeiras. O conceito de vulnerabilidade, conforme Machado e Albuquerque (2019), perpassa características biológicas de grupos específicos, incluindo idosos e pessoas com deficiência. Grundy (2006) reforça que indivíduos em idades avançadas enfrentam desafios acentuados e possuem capacidade reduzida de resposta a estímulos complexos, o que os torna mais suscetíveis a riscos no ambiente bancário. Além dos fatores internos, como limitações cognitivas ou de alfabetização, Baker et al. (2005) destacam a interação com fatores externos, como a falta de acesso a bens e serviços e problemas estruturais. Santos, Rodrigues e Lanza (2021) apontam que idosos de baixa renda são alvos críticos de vulnerabilidade econômica, exigindo metodologias robustas para a graduação de riscos. A utilização de técnicas multivariadas exploratórias, como a Análise de Correspondência Simples e a Análise de Agrupamentos, mostra-se essencial para investigar a relação entre variáveis complexas em bancos de dados extensos (Fávero e Belfiore, 2024).

A identificação de grupos homogêneos de clientes fundamenta-se na necessidade de aplicar políticas diferenciadas que garantam a ética e a transparência exigidas pelo regulador. Técnicas como o k-means são amplamente aplicadas no setor bancário para desenvolver estratégias de retenção e personalização de ofertas (Hosseini et al., 2022). Kumar et al. (2024) observam que o agrupamento permite alocar recursos de marketing de forma mais eficiente, proporcionando melhores experiências aos usuários. No entanto, para além do agrupamento, a classificação dos grupos conforme o grau de vulnerabilidade requer ferramentas de Apoio Multicritério à Decisão, como o método de Prioridade Observada a Partir da Presunção de Atitude Gaussiana das Alternativas, conhecido como PrOPPAGA. Este método auxilia no processo decisório ao estabelecer relações de preferência entre alternativas, aliando algoritmos matemáticos à subjetividade inerente ao tomador de decisão (Santos et al., 2023). O PrOPPAGA tem sido aplicado com sucesso em diversos contextos, desde a escolha de veículos militares até a avaliação de viabilidade econômica em trechos ferroviários (Santos e Santos, 2021; Salgado et al., 2023). A integração dessas técnicas permite que a instituição financeira não apenas identifique quem são os clientes vulneráveis, mas também ordene esses grupos para priorizar ações de cuidado e conformidade normativa.

A metodologia adotada compreende uma pesquisa experimental aplicada em uma base de dados simulada, extraída da plataforma Kaggle, contendo originalmente 20.000 registros e 36 variáveis voltadas ao risco de crédito. Para o escopo deste estudo, selecionaram-se cinco variáveis críticas: Endividamento, Escolaridade, Idade, Renda Anual e Deficiência. A variável Deficiência foi gerada aleatoriamente para representar 9% da amostra, em alinhamento com os dados demográficos do Instituto Brasileiro de Geografia e Estatística, abrangendo tipos auditivos, intelectuais, motores e visuais. O processo de preparação dos dados envolveu o ajuste de inconsistências, como a atribuição de idade mínima de 25 anos para clientes com títulos de mestrado ou doutorado, e o incremento aleatório de registros de indivíduos com mais de 60 anos para refletir a realidade do público vulnerável. A Análise de Correspondência Simples foi o primeiro método aplicado, utilizando as variáveis qualitativas Escolaridade e Deficiência. O objetivo desta etapa foi transformar categorias qualitativas em coordenadas quantitativas métricas, permitindo sua inclusão no algoritmo de agrupamento. A Anacor baseia-se em tabelas de contingência e no teste qui-quadrado para verificar associações estatisticamente significantes (Fávero e Belfiore, 2024). Greenacre (2008) afirma que essa técnica gera um mapa espacial que indica a interdependência entre linhas e colunas, convertendo a subjetividade das categorias em dados passíveis de processamento matemático.

Após a transformação das variáveis, procedeu-se à Análise de Agrupamentos pelo método k-means, um esquema de aglomeração não hierárquico que define centros de gravidade para as observações. Para garantir a precisão do modelo, os dados foram padronizados via Z-scores, assegurando que a média de cada variável fosse zero e o desvio-padrão unitário, evitando que escalas monetárias elevadas distorcessem o cálculo das distâncias euclidianas (Fávero e Belfiore, 2024). A definição do número ideal de clusters foi realizada pelo Método de Elbow, que identifica o ponto de inflexão onde o acréscimo de novos grupos oferece um ganho marginal reduzido na explicação da variância (Bruce e Bruce, 2019). A amostra final para o agrupamento foi filtrada para conter apenas clientes com características de vulnerabilidade potencial, totalizando 9.793 indivíduos que atendiam a critérios como idade superior a 60 anos, escolaridade até o ensino médio, presença de deficiência, endividamento superior a 1 ou renda anual inferior a $ 16.800,00. O algoritmo realocou as observações iterativamente até a estabilização dos centroides, e a significância das variáveis na formação dos grupos foi validada pelo teste F da análise de variância.

A etapa final consistiu na aplicação do método PrOPPAGA para o ordenamento dos seis clusters gerados. Esta técnica de apoio multicritério utiliza uma abordagem estatística para normalizar os desempenhos das alternativas, tomando como referência o valor médio e a dispersão em torno da média, estruturando a decisão sem ignorar a subjetividade do problema (Santos et al., 2023). Foram estabelecidos oito critérios de avaliação baseados nas medianas e contagens de cada cluster. Cada critério foi classificado como monotônico de lucro, onde valores maiores são preferíveis, ou de custo, onde valores menores indicam maior prioridade. A atribuição de pesos seguiu uma escala de importância de 2-8, onde a deficiência intelectual recebeu o peso máximo devido à sua criticidade na compreensão de contratos financeiros. O processamento foi realizado em plataforma computacional especializada, gerando cardinalidades que permitiram o ranqueamento final das alternativas de acordo com o desempenho global de cada grupo em relação aos parâmetros de vulnerabilidade estabelecidos.

Os resultados iniciais da estatística descritiva para a base total de 20.000 clientes revelaram um endividamento médio de 0,402 e uma idade média de 47,57 anos. A renda anual média situou-se em $ 111.422,00, com uma mediana significativamente inferior de $ 65.463,50, indicando uma distribuição assimétrica. No que tange à escolaridade, os níveis de graduação e ensino médio foram os mais frequentes, representando 30,3% e 29,5% da amostra, respectivamente. A variável deficiência mostrou que 89,5% dos clientes não possuíam limitações declaradas, enquanto a deficiência auditiva foi a mais prevalente entre os 10,5% restantes. Ao aplicar a Análise de Correspondência Simples, o teste qui-quadrado resultou em um valor de 169,86 com p-valor de 0,000, rejeitando a hipótese de independência entre escolaridade e deficiência. A matriz de resíduos padronizados ajustados evidenciou associações fortes, como o valor de 8,18 para a relação entre ensino médio e deficiência intelectual, e 5,09 para ensino médio e deficiência motora. Tais associações confirmam que determinados perfis educacionais estão estatisticamente vinculados a tipos específicos de vulnerabilidade física ou mental, validando a necessidade de tratamento segmentado conforme preconizado por Fávero e Belfiore (2024).

Na análise de agrupamento k-means aplicada aos 9.793 clientes selecionados, o Método de Elbow indicou que a formação de seis clusters era a mais adequada para equilibrar a homogeneidade interna e a heterogeneidade entre os grupos. A análise de variância demonstrou que todas as variáveis contribuíram de forma significativa para a distinção dos grupos, com a variável deficiência apresentando a maior estatística F (3981,55), seguida pela escolaridade (3550,99) e renda anual (3505,31). O cluster 3 destacou-se por apresentar a maior renda anual mediana ($ 249.057,00), enquanto o cluster 1 apresentou o maior índice de endividamento mediano (1,3385). O cluster 5 revelou-se particularmente relevante por concentrar uma quantidade expressiva de indivíduos com deficiência intelectual (387 observações) e motora (208 observações), além de possuir a segunda menor mediana de renda anual ($ 33.734,50). O cluster 0 apresentou a maior idade mediana, com 68 anos, reforçando a característica de vulnerabilidade etária discutida por Grundy (2006).

A discussão dos resultados ganha profundidade ao integrar os dados do k-means com o ordenamento do método PrOPPAGA. A matriz de decisão utilizou as medianas de idade, renda e endividamento, além da contagem de clientes com ensino médio e os quatro tipos de deficiência. O cluster 5 obteve a maior cardinalidade (0,6239) e um resultado global de 21,84%, sendo classificado com vulnerabilidade altíssima. Este resultado é justificado pela alta concentração de deficiências intelectuais e auditivas, critérios que receberam os maiores pesos na modelagem multicritério. Em contraste, o cluster 1 obteve a menor cardinalidade (0,3307) e um resultado global de 11,58%, sendo classificado como de baixa vulnerabilidade relativa, apesar de possuir o maior endividamento. Isso ocorre porque, no modelo de decisão adotado, as limitações cognitivas e sensoriais foram priorizadas sobre os fatores puramente financeiros, em conformidade com as diretrizes da FEBRABAN que enfatizam a capacidade de entendimento do consumidor.

A comparação entre os grupos permite observar que o cluster 2, classificado com vulnerabilidade alta (18,62%), possui uma quantidade elevada de clientes com ensino médio (2.334 observações) e a terceira menor renda, o que corrobora a tese de Santos, Rodrigues e Lanza (2021) sobre a fragilidade econômica de perfis com baixa escolaridade. O cluster 0, com vulnerabilidade médio-alta (17,55%), é marcado pela senioridade dos clientes, exigindo das instituições financeiras canais de atendimento que considerem as limitações naturais da idade avançada. As limitações deste estudo residem no uso de uma base de dados simulada, o que pode não capturar todas as nuances comportamentais de clientes reais em situações de estresse financeiro. No entanto, a metodologia proposta demonstra ser uma ferramenta poderosa para a governança bancária. Pesquisas futuras poderiam incorporar variáveis de comportamento digital, como a facilidade de uso de aplicativos móveis, para refinar o conceito de vulnerabilidade na era do open finance. A aplicação de redes neurais para a identificação de padrões de fraude em contas de clientes vulneráveis também se apresenta como um desdobramento promissor para a proteção deste público.

A implicação prática deste ordenamento é a capacidade de a instituição financeira automatizar a aplicação de salvaguardas. Para o cluster 5, podem ser exigidas confirmações adicionais em transações de alto valor ou a presença de um acompanhante em assinaturas de contratos complexos. Para os clusters de vulnerabilidade média, como o 4 e o 0, a estratégia pode focar em educação financeira direcionada e comunicação em linguagem simples. Este nível de detalhamento operacional atende não apenas ao rigor normativo do Banco Central, mas também eleva o padrão ético da instituição, transformando dados brutos em inteligência de relacionamento. A integração da Anacor, k-means e PrOPPAGA oferece um fluxo analítico completo: desde a preparação e quantificação de dados qualitativos até a decisão estratégica final baseada em múltiplos critérios de importância social e econômica.

Conclui-se que o objetivo foi atingido, uma vez que a metodologia proposta permitiu a identificação de seis grupos distintos de clientes e seu ordenamento rigoroso conforme o grau de vulnerabilidade. A integração das técnicas de Análise de Correspondência Simples, k-means e o método PrOPPAGA mostrou-se eficaz para transformar variáveis qualitativas e quantitativas em um sistema de classificação robusto, alinhado às exigências da Resolução CMN 4.949 e do Normativo SARB 024. A identificação do cluster 5 como o grupo de vulnerabilidade altíssima e do cluster 1 como o de menor vulnerabilidade fornece subsídios concretos para que as instituições financeiras implementem políticas de atendimento diferenciadas, garantindo a proteção de consumidores com menor capacidade de discernimento e promovendo um equilíbrio ético nas relações de consumo bancário.

Referências Bibliográficas:

Baker, S. M.; Gentry, J. W.; Rittenburg, T. L. (2005). Building understanding of the domain of consumer vulnerability. Journal of Macromarketing.
Banco Central do Brasil. (2021). Resolução CMN nº 4.949 de 30 de setembro de 2021. Diário Oficial da União.
Bruce, A.; Bruce, P. (2019). Estatística Prática para Cientistas de Dados: 50 Conceitos Essenciais. Alta Books.
Favero, L. P.; Belfiore, P. (2024). Manual de Análise de Dados: Estatística e Machine Learning com Excel, SPSS, Stata, R e Python. LTC.
Federação Brasileira de Bancos. (2021). Normativo SARB nº 024 de 31 de março de 2021. FEBRABAN.
Greenacre, M. J. (2008). Correspondence Analysis of Raw Data. SSRN.
Grundy, E. (2006). Ageing and vulnerable elderly people: European perspectives. Ageing and Society.
Hosseini, M.; Abdolvand, N.; Harandi, S. R. (2022). Two-dimensional analysis of customer behavior in traditional and electronic banking. Digital Business.
Kumar, L. K.; Venkatesh, D.; Katyayani, J.; Sunkara, S.; Gowthami, K. (2024). A Study on Customer Segmentation for Banking Sector Through Cluster Analysis: Ethical Implications. Communications on Applied Nonlinear Analysis.
Machado, I. L. O.; Albuquerque, A. (2019). Papel do Estado quanto à vulnerabilidade e proteção de adultos com deficiência intelectual. Cadernos Ibero-Americanos de Direito Sanitário.
Salgado, N. F.; Silva, P. A. L.; Silva Jr., O. S.; Moreira, M. A. L.; Santos, M.; Portella, A. G. (2023). Application of the PrOPPAGA Method in the evaluation of returnable stretches in the context of the processes of early extension of railway concessions. Procedia Computer Science.
Santos, F. B.; Santos, M. (2021). Choice of armored vehicles on wheels for the Brazilian Marine Corps using PrOPPAGA. Procedia Computer Science.
Santos, M.; Costa, I. P. A.; Gomes, C. F. S.; Moreira, M. A. L. (2023). Ferramentas Computacionais de Apoio à Tomada de Decisão. Ed. dos Autores.
Santos, R. A. T.; Rodrigues, W.; Lanza, J. I. H. (2021). Impactos da educação financeira na redução da vulnerabilidade econômica de idosos de baixa renda. Revista Brasileira de Gestão e Desenvolvimento Regional.
Silva, J. P. (2016). Gestão e Análise de Risco de Crédito. Cengage Learning.

Resumo executivo oriundo de Trabalho de Conclusão de Curso de Especialização em MBA em Data Science, Inteligência Artificial e Analytics

Saiba mais sobre o curso, clique aqui

Quem editou este artigo

Você também pode gostar

Quer ficar por dentro das nossas últimas publicações? Inscreva-se em nossa newsletter!

Receba conteúdos e fique sempre atualizado sobre as novidades em gestão, liderança e carreira com a Revista E&S.

Ao preencher o formulário você está ciente de que podemos enviar comunicações e conteúdos da Revista E&S. Confira nossa Política de Privacidade