21 de maio de 2026
IA e Microsserviços na Análise de Reclamações Financeiras
Marcus Vinicius de Freitas Costa; Elaine Barbosa de Figueiredo
Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.
A digitalização do setor financeiro brasileiro representa uma das mais profundas transformações econômicas e sociais do país na última década, impulsionada por inovações como o sistema de pagamentos instantâneos PIX, que desde o seu lançamento em 2020 democratizou o acesso às transações e alcançou uma notável popularidade, sendo que em 2024 já era utilizado mensalmente por 63% da população (Agência Brasil, 2025). Essa ampla aceitação se reflete diretamente no volume de uso, que atingiu 63.8 bilhões de transações em 2024, representando um salto de 52% em relação ao ano anterior (FEBRABAN, 2024a). O sucesso da digitalização financeira, contudo, revelou fragilidades institucionais em duas frentes principais: a segurança, evidenciada pela escalada de golpes de engenharia social, e a crise na capacidade de atendimento, comprovada pela presença constante da insatisfação com o suporte prestado entre os assuntos mais citados na classificação do Banco Central do Brasil (BCB, 2025a). Esse cenário cria um paradoxo relevante, visto que 83% dos bancos declaram a experiência do cliente como seu principal diferencial competitivo (FEBRABAN, 2024b).
O intenso fluxo de manifestações digitais carrega um volume massivo de dados pessoais sensíveis, cujo tratamento inadequado não apenas mina a confiança do consumidor, mas também coloca as instituições em risco de descumprimento da Lei nº 13.709, conhecida como Lei Geral de Proteção de Dados (Brasil, 2018). Diante desse contexto, emerge a necessidade de soluções que transcendam a simples otimização de processos manuais, utilizando a orquestração de tecnologias centrais como a arquitetura de microsserviços e os modelos de linguagem de grande escala, conhecidos como Large Language Models. A fundamentação teórica para tal abordagem reside na capacidade dos microsserviços em promover um desenvolvimento ágil e flexível, permitindo que cada componente do sistema seja projetado e implantado de forma independente (Newman, 2015). Complementarmente, a arquitetura Transformer revolucionou o processamento de linguagem natural ao introduzir o mecanismo de autoatenção, que permite ao modelo ponderar a importância de diferentes partes de um texto simultaneamente, capturando relações contextuais complexas (Vaswani et al., 2023).
A compreensão das causas do aumento das reclamações no setor financeiro digital exige uma abordagem de natureza descritiva e exploratória (Gil, 2002). Para tanto, utiliza-se uma metodologia mista que combina a análise quantitativa de estatísticas sobre o uso do PIX com a análise qualitativa da linguagem utilizada pelos clientes em suas manifestações (Neto, 2017). O estudo de caso é empregado para analisar o processo de estruturação de dados provenientes de reclamações textuais, demonstrando como informações brutas podem ser convertidas em dados estatísticos relevantes para o setor (Yin, 2001). Os procedimentos incluem a coleta sistemática de elementos que, quando analisados em conjunto, permitem embasar estratégias para a redução de erros e a tomada de decisões assertivas (Adobe, 2023). O recorte temporal concentra-se nas reclamações registradas a partir de 2020, marco do lançamento oficial do PIX no Brasil.
A coleta de dados é realizada por meio da técnica de Web Scraping, que envolve o uso de scripts para acessar páginas web e extrair informações específicas (Techopedia, 2024). A implementação dessa solução utiliza a linguagem de programação C# com o framework .NET 9, escolhido pelas melhorias significativas em operações de protocolo de transferência de hipertexto, que proporcionam menor latência e suporte eficiente ao assincronismo (Microsoft, 2024). O processo operacional é dividido em módulos independentes que se comunicam via filas de mensagens utilizando o RabbitMQ, garantindo que as mensagens sejam gerenciadas de forma eficiente mesmo com o aumento da demanda (Videla e Williams, 2012). O primeiro módulo, denominado coletor, extrai as reclamações de portais públicos, capturando o texto da queixa, a data de publicação, a instituição financeira envolvida e a eventual resposta da empresa.
Após a obtenção dos dados brutos, uma etapa robusta de pré-processamento é fundamental para garantir a qualidade e a utilidade das informações em tarefas de processamento de linguagem natural (Martulandi, 2025). Essa fase envolve a limpeza estrutural, com a remoção de códigos HTML residuais e a normalização do texto para minúsculas, assegurando a uniformidade lexical necessária para as ferramentas de análise (Gimpel et al., 2011). A moderação de conteúdo é aplicada para identificar e substituir termos ofensivos por marcadores neutros, mantendo o valor analítico do dado enquanto protege os sistemas de conteúdo prejudicial (Hovy e Nozza, 2023). Para a proteção de dados sensíveis, como números de documentos e contatos, utilizam-se expressões regulares que automatizam a localização e substituição dessas informações, prática recomendada para reduzir riscos de segurança e fortalecer a confiança dos titulares (SERPRO, 2025).
A anonimização é reforçada pela identificação automática de nomes de pessoas, localidades e instituições financeiras por meio de técnicas de reconhecimento de entidades nomeadas. A aplicação utiliza bibliotecas de código aberto ajustadas às particularidades do português brasileiro, integrando listas oficiais do Instituto Brasileiro de Geografia e Estatística para elevar a precisão na detecção de municípios e prenomes (IBGE, 2010). O tratamento de grandes volumes de dados textuais impõe desafios devido à ambiguidade linguística, que pode ser sintática ou semântica, exigindo o uso de modelos de inteligência artificial capazes de interpretar nuances que métodos convencionais falham em captar (PUCRS, 2001). A estratégia de inferência utiliza plataformas de nuvem que eliminam a necessidade de infraestrutura local massiva, possibilitando o acesso a tecnologias avançadas sem custos operacionais proibitivos de manutenção (Aporia, 2024).
A arquitetura de processamento adota unidades de processamento de linguagem especializadas, que oferecem desempenho superior e menor consumo de energia em comparação com processadores gráficos tradicionais (Groq, 2023). O modelo de linguagem selecionado para a estruturação dos dados possui uma vasta janela de contexto, permitindo a análise integral de documentos extensos e o seguimento preciso de instruções em linguagem natural (Zhou et al., 2023). O processo de estruturação ocorre em duas etapas: primeiro, a sumarização das reclamações para concentrar as informações mais importantes e otimizar a entrada de dados (Sarmento e Oliveira, 2024); segundo, a extração de atributos padronizados, como o tipo de problema, o produto relacionado e a solução proposta. Essa padronização é essencial para viabilizar análises quantitativas e aplicar modelos estatísticos que identifiquem padrões de insatisfação (Paiva, 2023).
O armazenamento dos dados finais é realizado em uma base de dados relacional gerenciada pelo PostgreSQL, escolhido por seus robustos recursos de integridade, segurança e alta escalabilidade (PostgreSQL, 2025). A estrutura lógica do banco de dados é representada por modelos que mapeiam as entidades do sistema e seus vínculos, facilitando a visualização das regras de negócio (Heuser, 2016). Complementarmente, utiliza-se a técnica de busca textual para permitir a recuperação rápida de informações em grandes volumes de dados não estruturados (Spot Intelligence, 2024). Ferramentas como o Elasticsearch são empregadas para indexar os dados, oferecendo funcionalidades de reconhecimento de variações linguísticas e correção de erros de digitação, o que torna a busca mais robusta e precisa (Gheorghe et al., 2015a).
A disponibilização dos resultados ocorre por meio de um painel interativo que centraliza as informações consolidadas, permitindo a rápida identificação de anomalias e o monitoramento contínuo (Few, 2006). A concepção dessa interface segue diretrizes internacionais de acessibilidade para garantir que usuários com diferentes necessidades possam interagir com a informação sem barreiras (W3C, 2024). A qualidade técnica da plataforma é validada por ferramentas de auditoria automatizada que analisam o desempenho, a acessibilidade e a otimização para mecanismos de busca (Google, 2016). A construção de uma identidade visual coerente também é considerada um passo fundamental para estabelecer confiança, utilizando elementos gráficos que transmitam credibilidade e segurança (INPI, 2013a; Heller, 2014).
A implementação do sistema permitiu o processamento de um corpus expressivo de 531.735 registros textuais extraídos de portais de reclamações, abrangendo um período de 12 anos. A análise de frequência de termos iniciou-se com a tokenização, segmentando o texto em unidades menores para isolar elementos relevantes (Jurafsky e Martin, 2025). A remoção de palavras de parada foi realizada utilizando listas padrão para o português, refinando a filtragem em busca de temas centrais (NLTK Project, 2024). Embora termos genéricos como banco e cartão dominem a frequência absoluta, o termo PIX demonstrou uma relevância estatística crescente. Das 44.170 reclamações que mencionam o serviço, observou-se que os dois primeiros meses de 2025 já acumularam um volume superior ao de todo o ano de 2024, representando um aumento projetado de aproximadamente 578,89% na média mensal de queixas.
A eficácia das técnicas de anonimização atingiu 99,70% na redução de entidades pessoais identificáveis, resultado validado por modelos de linguagem especializados em português que capturam sutilezas semânticas do idioma (Souza et al., 2020; Brugnaroto et al., 2023). O processo de sumarização textual proporcionou uma redução de 74,31% no tamanho médio das manifestações, transformando textos longos em resumos concisos que preservam as nuances contextuais (Sarmento e Oliveira, 2024). No que tange à distribuição institucional, as instituições de pagamento, que englobam a maioria das empresas de tecnologia financeira, concentram 43,54% do volume total de queixas. Esse percentual expõe os desafios dessas empresas em escalar seus serviços de suporte na mesma velocidade em que popularizam suas soluções digitais. Os bancos tradicionais, por sua vez, respondem por 41,43% das reclamações, enfrentando dificuldades semelhantes na modernização de sistemas legados.
A análise dos dados estruturados revelou que o estorno do valor pago é a principal causa de insatisfação, respondendo por 35,17% das queixas. Esse dado evidencia uma urgência na agilidade dos processos de devolução de recursos e na transparência sobre o status das solicitações. Falhas na clareza contratual e na comunicação, incluindo propaganda enganosa e cobrança indevida, somam 22,38% das ocorrências, indicando a necessidade de revisão de contratos e padronização da exibição de tarifas em canais digitais. Entraves na experiência operacional e no atendimento totalizam 16,73% das manifestações, apontando para a presença de fluxos internos repetitivos e deficiências na capacitação das equipes de suporte.
Quanto aos produtos, os pagamentos eletrônicos lideram as queixas com 18,78%, seguidos por problemas em contas e cartões de crédito. Nesses segmentos, predominam demoras na liquidação de transações e tentativas de fraude, o que sugere a necessidade de reforço em algoritmos de detecção comportamental e autenticação multifatorial. As soluções propostas pelas instituições financeiras indicam que 57,37% das intervenções resultam no encerramento do vínculo com o cliente, como a remoção de serviço ou o cancelamento. Esse padrão revela uma insuficiência de alternativas proativas de negociação e a manutenção de processos internos burocráticos que priorizam o desligamento em vez da retenção. Apenas 17,17% das resoluções focam em estornos efetivos, o que demonstra uma falta de caminhos flexíveis para a quitação de pendências financeiras.
Iniciativas de suporte operacional, como respostas formais e correção de dados, apresentam níveis moderados de burocracia que estendem o tempo de resolução. Para mitigar esses conflitos, é fundamental automatizar tarefas repetitivas e utilizar assistentes virtuais para o diálogo inicial, garantindo rastreabilidade em cada ponto de contato. A integração de sistemas de cobrança a plataformas de atendimento digital permitiria comunicar proativamente diferentes cenários de amortização antes que o cliente recorra a instâncias externas de reclamação. A análise evidencia que a automação não é apenas uma vantagem competitiva, mas uma necessidade imperativa para lidar com a complexidade das demandas financeiras modernas.
A convergência entre microsserviços e inteligência artificial demonstra ser uma abordagem eficaz para transformar grandes volumes de dados não estruturados em conhecimento estratégico. A capacidade de processar milhares de reclamações diariamente com alta precisão na anonimização garante a conformidade regulatória enquanto fornece subsídios para a melhoria contínua dos serviços. Contudo, a dependência de modelos de linguagem exige um aprimoramento constante no domínio das particularidades do português brasileiro para evitar interpretações equivocadas de termos regionais ou gírias específicas do contexto financeiro. O ajuste fino dos modelos com dados especializados pode elevar ainda mais a acurácia das classificações automáticas.
Estudos futuros devem integrar informações de redes sociais e relatórios oficiais de órgãos reguladores para ampliar a abrangência das análises e validar os achados em ambientes de produção real. A mensuração do impacto da automação sobre indicadores como o tempo médio de atendimento e o nível de satisfação líquida dos usuários fornecerá dados quantitativos sobre o retorno do investimento nessas tecnologias. A colaboração entre engenharia de software e ciência de dados é o caminho para superar o paradoxo da digitalização, onde a tecnologia que facilita a transação deve ser a mesma que humaniza e agiliza a resolução de problemas.
Conclui-se que o objetivo foi atingido, uma vez que a arquitetura proposta demonstrou capacidade técnica para processar e estruturar volumes massivos de reclamações financeiras com 99,70% de eficácia na anonimização e uma redução de 74,31% na densidade textual via sumarização. A análise revelou que o estorno de valores é o principal gargalo operacional tanto para fintechs quanto para bancos tradicionais, e que a maioria das soluções atuais resulta no encerramento prematuro do vínculo com o cliente. A orquestração entre microsserviços e modelos de linguagem de grande escala prova ser uma solução viável para automatizar o tratamento de dados sensíveis e gerar inteligência de negócio, embora demande aprimoramento contínuo no ajuste fino dos modelos para as nuances do idioma e a integração de novas fontes de dados para garantir a robustez das decisões institucionais.
Referências Bibliográficas:
*Final check on “Agência Brasil”:*
*Missing items check:*
…
Citation: Agência Brasil, 2025
Database: Agência Brasil. 2025. Em 2024, 63% dos brasileiros usaram o PIX ao menos uma vez por mês. Disponível em: <https://agenciabrasil.ebc.com.br/geral/noticia/2025-03/em-2024-63-dos-brasileiros-usaram-o-pix-ao-menos-uma-vez-por-mes>. Acesso em: 13 jul. 2025.
Newman, 2015 -> Missing.
Paiva, 2023 -> Missing.
PostgreSQL, 2025 -> Missing.
PUCRS, 2001 -> Missing.
Sarmento e Oliveira, 2024 -> Missing.
SERPRO, 2025 -> Missing.
Spot Intelligence, 2024 -> Missing.
Techopedia, 2024 -> Missing.
Vaswani et al., 2023 -> Missing.
Videla e Williams, 2012 -> Missing.
W3C, 2024
Yin, 2001 -> Missing.
Zhou et al., 2023 -> Missing.
Resumo executivo oriundo de Trabalho de Conclusão de Curso da Especialização em Engenharia de Software do MBA USP/Esalq
Para saber mais sobre o curso, clique aqui e acesse a plataforma MBX Academy




























