28 de janeiro de 2026
A importância de big data analytics em políticas públicas
Beatriz Vieira Santello Mendes; Pablo Henrique Paschoal Capucho
Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.
O presente estudo investiga a aplicação de Big Data Analytics na formulação de políticas públicas, com foco na sustentabilidade financeira do Fundo de Garantia do Tempo de Serviço (FGTS). As recentes alterações legais, como o saque-aniversário, ampliaram as possibilidades de saque, motivando a análise do impacto dessas mudanças na arrecadação líquida do Fundo. O objetivo central é abordar a importância do Big Data Analytics nas decisões sobre políticas públicas, analisando a correlação entre a arrecadação líquida do FGTS e os valores sacados de abril de 2020 a janeiro de 2024. A análise estatística bivariada, utilizando o coeficiente de correlação de Pearson, foi aplicada a dados públicos extraídos do portal oficial do FGTS, organizados em séries temporais mensais (Brasil, 1966).
A análise de dados na cultura organizacional tem se intensificado, buscando oferecer produtos e serviços personalizados (Davenport e Harris, 2018). O uso de dados, por meio de análises quantitativas e estatísticas, orienta a tomada de decisões fundamentadas em evidências, conhecido como Analytics. A análise descritiva visualiza dados históricos, a preditiva antecipa cenários futuros e a prescritiva apoia a experimentação. A análise autônoma, com inteligência artificial, auxilia na extração de aprendizado dos dados (Ferreira e Gomes, 2019). A adoção de uma abordagem orientada por dados impõe o desafio de gerenciar volumes massivos de informações, mensurados em exabytes (EB). O conceito de Big Data envolve volume, velocidade, variedade, variabilidade e complexidade (Fávero e Belfiore, 2025). O volume refere-se à quantidade de dados, a velocidade à rapidez na criação dos dados, a variedade à heterogeneidade dos dados, a variabilidade à oscilação na geração de dados e a complexidade à multiplicidade de fontes de dados.
O Big Data, isoladamente, não fornece informações estratégicas; associa-se ao conceito de Analytics. A integração configura o macroprocesso Big Data Analytics, utilizado para gerar valor e vantagem competitiva. Esse macroprocesso é composto por dois subprocessos e cinco etapas: captura, separação, limpeza, organização, armazenamento, disponibilização, modelagem, análise e interpretação. Empresas utilizam Big Data Analytics para maximizar lucros e fidelizar clientes; governos podem aplicar para buscar eficiência nas políticas públicas. O FGTS, criado em 1966, tinha como objetivo constituir uma reserva financeira ao trabalhador em caso de demissão sem justa causa e auxiliar na melhoria da qualidade de vida da população.
Para demonstrar o uso do Big Data Analytics em políticas públicas, o estudo avalia a correlação entre a arrecadação líquida do FGTS e o valor de saque-aniversário de abril de 2020 a janeiro de 2024. Para comparação, foram avaliadas as correlações entre a arrecadação líquida do FGTS e os saques por aposentadoria, uso em moradia própria e demissão sem justa causa. Os dados públicos da arrecadação líquida e dos saques foram capturados na página eletrônica do FGTS (fgts.gov.br) pelos códigos 60 e 60F (saque aniversário), 05, 05A, 05E e 05F (aposentadoria), 91, 92, 93, 95 e 96 (moradia própria) e 01, 01M e 01S (demissão sem justa causa). O período de análise foi escolhido com base na disponibilidade dos dados do saque aniversário, ocorrido em abril de 2020, até janeiro de 2024.
Os dados capturados foram organizados em uma tabela com a série histórica na ferramenta Excel, separados por mês em bilhões de reais. Em seguida, aplicou-se uma análise estatística bivariada com a fórmula CORREL para calcular o coeficiente de correlação de Pearson, visando identificar se a arrecadação líquida do FGTS aumenta ou diminui na mesma proporção dos saques analisados. O coeficiente de correlação de Pearson demonstra se uma variável Y aumenta ou diminui em relação a outra variável X (Fávero e Belfiore, 2025). Os valores possíveis variam de -1 a 1; 0 indica não haver correlação entre as variáveis. O resultado próximo de -1 indica relação inversamente proporcional e o resultado mais próximo de 1 indica relação diretamente proporcional entre as duas variáveis analisadas (Dancey e Reidy, 2019). Resultados entre 0,1 e 0,3 sugerem relacionamento fraco entre as variáveis, resultados entre 0,4 e 0,6 indicam relacionamento moderado e, entre 0,7 e 1 indicam relacionamento forte.
Analisando a Lei 8.036/90 e suas alterações, o FGTS é um direito trabalhista constituído por depósitos mensais realizados pelo empregador em conta vinculada ao trabalhador, equivalentes a 8% da remuneração, ou 2% no caso de jovem aprendiz (Brasil, 1990). Esses valores são corrigidos pela Taxa Referencial (TR) e acrescidos de juros de 3% ao ano. A partir de 2016, foi implementada a distribuição de lucros aos cotistas, aumentando a rentabilidade do fundo. O saque do FGTS é permitido em situações específicas previstas em lei, como demissão sem justa causa, aposentadoria, aquisição de imóvel ou doenças graves. Em 2019, a criação do saque-aniversário permitiu retiradas anuais de parte do saldo da conta, mesmo com vínculo empregatício ativo.
Conforme o modelo de Big Data Analytics, o subprocesso de Big Data é operacionalizado pela Caixa Econômica Federal, que disponibiliza dados públicos tratados e agregados, permitindo a execução do subprocesso Analytics por meio de técnicas estatísticas. Foram coletados dados mensais de arrecadação líquida do FGTS e dos principais tipos de saque de abril/2020 a janeiro/2024. A arrecadação líquida apresentou valores negativos nos meses iniciais da pandemia e em maio a agosto de 2021, mantendo-se positiva nos demais períodos. Observa-se um padrão sazonal, com picos de arrecadação nos meses de dezembro e janeiro, e quedas acentuadas em março de cada ano, sugerindo influência de fatores externos como aquecimento do mercado de trabalho nos períodos de festas de fim de ano. Desde sua implementação em abril de 2020, o saque aniversário tem apresentado crescimento contínuo nos valores sacados, podendo refletir a adesão progressiva dos trabalhadores à nova sistemática de saque.
Para analisar se existe correlação entre os valores da arrecadação líquida e do saque aniversário, foi calculado o coeficiente da correlação de Pearson por meio da fórmula CORREL no Excel sobre os números da tabela 1. Nessa primeira análise, foi encontrado o coeficiente 0,45, indicando uma correlação positiva moderada. Como a correlação encontrada é diretamente proporcional, não é possível interpretar que a arrecadação líquida do FGTS diminui à medida que o saque aniversário aumenta. Por outro lado, verifica-se que há o crescimento simultâneo das variáveis. O saque por aposentadoria apresentou um coeficiente da correlação de Pearson de 0,66 indicando uma correlação positiva ainda moderada, mas mais forte do que a correlação com o saque aniversário e diretamente proporcional, não sendo possível também sugerir que a arrecadação líquida diminui à medida que aumenta o saque por aposentadoria.
Na análise do saque para uso em moradia própria, o resultado do coeficiente da correlação de Pearson foi de 0,37, indicando uma correlação positiva fraca entre ele e a arrecadação líquida. A correlação encontrada aqui também é diretamente proporcional, não sendo possível sugerir que a arrecadação líquida diminui à medida que aumenta o saque para uso em moradia própria. Na última análise proposta para esse estudo, foi verificada a correlação entre a arrecadação líquida e o saque por demissão sem justa causa, que é o maior saque em valores no período analisado. No cálculo do coeficiente da correlação de Pearson, foi obtido o resultado -0,64, em que se indica uma correlação negativa moderada. Como essa correlação é inversamente proporcional, pode ser interpretado que a arrecadação líquida diminui à medida que aumenta o saque por demissão sem justa causa.
A arrecadação líquida do FGTS é definida pela diferença entre a arrecadação bruta e os saques realizados no período analisado. Em uma análise preliminar, seria razoável supor que qualquer modalidade de saque apresentaria correlação negativa com a arrecadação líquida, uma vez que o aumento dos saques tende a reduzir o saldo disponível. No entanto, ao aplicar métodos de Big Data Analytics, observou-se um comportamento estatístico diferente: correlações positivas entre a arrecadação líquida e os saques por aniversário, aposentadoria e aquisição de moradia própria. Apenas o saque por demissão sem justa causa apresentou correlação negativa moderada com a arrecadação líquida. A correlação entre variáveis não implica, necessariamente, em relação de causalidade. É possível encontrar correlações não genuínas; no contexto do FGTS, é plausível que variáveis externas estejam influenciando simultaneamente tanto o aumento da arrecadação líquida quanto o crescimento dos saques.
No caso do saque aniversário, fatores macroeconômicos como a inflação podem exercer influência significativa. A inflação tende a elevar os salários, o que, por consequência, aumenta o valor recolhido pelas empresas ao FGTS. Simultaneamente, como o saque aniversário é calculado com base em um percentual do saldo das contas vinculadas, o aumento desses saldos também eleva o valor sacado. Situação semelhante pode ocorrer com os saques por aposentadoria e moradia própria. O aumento da arrecadação pode se dar pela valorização salarial ao mesmo tempo em que a força de trabalho formal envelhece e mais trabalhadores aposentam. Ou fatores como o crescimento do crédito imobiliário podem aumentar a disposição dos trabalhadores para a aquisição de imóveis e gerar mais saques.
A correlação negativa observada entre os saques por demissão sem justa causa e a arrecadação líquida do FGTS merece atenção especial. Essa modalidade de saque está diretamente relacionada à função original do Fundo, que é servir como proteção ao trabalhador em momentos de desligamento involuntário. A correlação negativa sugere que, à medida que aumentam os saques por demissão, há uma tendência de redução na arrecadação líquida, o que pode comprometer a capacidade do FGTS de cumprir suas demais funções sociais coletivas. A correlação negativa encontrada levanta uma hipótese relevante: o aumento dos saques por demissão sem justa causa pode estar contribuindo para a redução dos recursos disponíveis no Fundo. Essa hipótese se torna especialmente preocupante diante de cenários em que há aumento da informalidade no mercado de trabalho ou a substituição de vínculos empregatícios por contratos de pessoas jurídicas [PJ], que não geram recolhimento ao FGTS.
Embora os resultados obtidos não permitam afirmar que a modalidade de saque aniversário comprometa a sustentabilidade do FGTS, a correlação negativa observada nos saques por demissão sem justa causa aponta para a necessidade de estudos mais aprofundados. É fundamental investigar se há, de fato, uma relação causal entre essa modalidade de saque e a redução da arrecadação líquida, o que poderia justificar a revisão de políticas públicas relacionadas ao FGTS. Conclui-se, portanto, que o uso de Big Data Analytics entre variáveis do FGTS oferece uma ferramenta poderosa para a formulação e avaliação de políticas públicas. A correlação positiva entre arrecadação líquida e saques por aniversário não permite afirmar que essa nova modalidade de saque comprometa a sustentabilidade do Fundo. No entanto, a correlação negativa observada nos saques por demissão sem justa causa sugere que essa modalidade pode representar um risco à capacidade do FGTS de continuar cumprindo suas funções originais. Conclui-se que o objetivo foi atingido: demonstrou-se a importância da aplicação de Big Data Analytics na análise da sustentabilidade financeira do FGTS, identificando padrões relevantes e subsidiando decisões estratégicas no âmbito das políticas públicas.
Referências Bibliográficas:
Brasil. 1966. Lei n. 5.107, de 13 de setembro de 1966. Cria o Fundo de Garantia do Tempo de Serviço, e dá outras providências. Disponível em https://www.planalto.gov.br/ccivil_03/LEIS/L5107.htm. Acesso em 23 mar. 2023.
Brasil. 1990. Lei n. 8.036, de 11 de maio de 1990. Dispõe sobre o Fundo de Garantia do Tempo de Serviço, e dá outras providências. Disponível em https://www.planalto.gov.br/ccivil_03/leis/l8036consol.htm. Acesso em 12 mar. 2023.
Dancey, C. P.; Reidy, J. 2019. Estatística sem Matemática para Psicologia. 7 ª ed. Penso Editora, Porto Alegre, RS, Brasil.
Davenport, T. H.; Harris, J. G. 2018. Competição Analítica: Vencendo Através da Nova Ciência. 1ª ed. Alta Books, Rio de Janeiro, RJ, Brasil.
Fávero. L. P.; Belfiore, P. 2025. Manual de Análise de Dados: Estatística e Machine Learning com Excel®, SPSS®, Stata®, R® e Python®. 2ª ed. LTC Livros Técnicos e Científicos, Rio de Janeiro, RJ, Brasil.
Ferreira, R.; Gomes, J. S. 2019. Projeto de big data analytics: uma discussão à luz da capacidade absortiva. Disponível em https://periodicos.uff.br/sbijournal/article/view/28905. Acesso em 23 mar. 2023.
Resumo executivo oriundo de Trabalho de Conclusão de Curso de Especialização em Digital Business do MBA USP/Esalq
Saiba mais sobre o curso; clique aqui:




























