11 de junho de 2026
A importância de Big Data Analytics em políticas públicas
Beatriz Vieira Santello Mendes; Pablo Henrique Paschoal Capucho
DOI: 10.22167/2675-6528-2026M03
Artigo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.
Resumo
O estudo abordou a importância da aplicação de Big Data Analytics na formulação de políticas públicas, com foco na sustentabilidade financeira do Fundo de Garantia do Tempo de Serviço (FGTS). Objetivou-se analisar a correlação entre a arrecadação líquida do FGTS e os valores sacados no período de abril de 2020 a janeiro de 2024, buscando compreender o impacto de recentes alterações legais que ampliaram as possibilidades de saque, como a modalidade saque-aniversário. Para isso, dados públicos mensais de arrecadação líquida e dos principais tipos de saque (aniversário, aposentadoria, moradia própria e demissão sem justa causa) foram extraídos do portal oficial do FGTS. A análise estatística bivariada empregou o coeficiente de correlação de Pearson. Os resultados revelaram correlações positivas entre a arrecadação líquida e os saques por aniversário, aposentadoria e moradia própria, e uma correlação negativa com os saques por demissão sem justa causa. A análise sugeriu que variáveis externas, como inflação e formalização do mercado de trabalho, podem ter influenciado simultaneamente a arrecadação e os saques, sem estabelecer uma relação causal direta. Concluiu-se que o Big Data Analytics se mostrou eficaz para identificar padrões relevantes e subsidiar decisões estratégicas em políticas públicas, sendo recomendável a ampliação de estudos sobre os impactos da rotatividade no mercado formal e seus reflexos na sustentabilidade do FGTS.
Palavras-chave: Análise de Dados; Correlação; FGTS; Saque-aniversário; Sustentabilidade Financeira.
1. Introdução
A incorporação da análise de dados à cultura organizacional das empresas não é recente. Há algum tempo, organizações buscam estruturar-se de forma orientada por dados, visando oferecer produtos e serviços personalizados. Essa tendência estende-se também ao setor público, onde a capacidade de processar e interpretar grandes volumes de dados pode transformar a elaboração e a execução de políticas públicas.
O uso estratégico de dados, por meio de análises quantitativas e estatísticas, bem como de modelos preditivos e explicativos, que orienta a tomada de decisões fundamentadas em evidências, é conhecido como Analytics. Este campo abrange diferentes níveis. A análise descritiva permite a visualização de dados históricos. A análise preditiva contribui para a antecipação de cenários futuros. A análise prescritiva apoia a experimentação e a compreensão de comportamentos. Já na análise autônoma, a intervenção humana é reduzida, com a inteligência artificial e o aprendizado de máquinas para extrair conhecimento dos dados (Davenport e Harris, 2018).
A decisão estratégica de adotar uma abordagem orientada por dados impõe às organizações o desafio de gerenciar e manipular volumes massivos de informações, mensurados em exabytes. Ao abordar o conceito de Big Data, é comum referir-se às cinco dimensões fundamentais na geração e disponibilidade de dados: volume, velocidade, variedade, variabilidade e complexidade (Fávero e Belfiore, 2025). O volume refere-se à imensa quantidade de dados gerada. A velocidade diz respeito à rapidez de sua criação. A variedade está relacionada à heterogeneidade dos dados. A variabilidade refere-se à oscilação na geração. Por fim, a complexidade está ligada à multiplicidade de fontes, demandando esforço para tratamento e análise.
Ressalta-se que o Big Data, isoladamente, não é capaz de fornecer informações estratégicas com potencial de geração de valor. Para tal finalidade, associa-se ao conceito o uso de Analytics. A integração desses dois elementos configura o macroprocesso denominado Big Data Analytics, que pode ser compreendido como a utilização estratégica de dados com o objetivo de gerar valor e alcançar vantagem competitiva (Ferreira e Gomes, 2019). Este macroprocesso é composto por subprocessos de captura, tratamento e análise de dados, resultando em insights que subsidiam decisões estratégicas.
Enquanto as empresas utilizam o Big Data Analytics para maximizar lucros e fidelizar clientes, os governos têm a oportunidade de aplicar esse macroprocesso para buscar a eficiência na elaboração e manutenção das políticas públicas. A utilização de dados para promover a eficiência social e gerar impacto mensurável é crucial no setor público (Davenport e Harris, 2018). Um exemplo significativo de política pública no Brasil é o Fundo de Garantia do Tempo de Serviço (FGTS).
O FGTS foi criado em 1966 pela Lei 5.107 (Brasil, 1966), em substituição à estabilidade no emprego, com o objetivo principal de constituir uma reserva financeira para o trabalhador em caso de demissão sem justa causa. Além disso, o Fundo foi concebido para auxiliar na melhoria da qualidade de vida da população, destinando recursos para financiamento de habitação, saneamento básico e infraestrutura urbana, conforme a Lei 8.036/90 (Brasil, 1990). No entanto, no decorrer de sua existência, alterações legais ampliaram os motivos de saque do Fundo de Garantia.
Desde o ano de 2020, por exemplo, os trabalhadores que aderiram à sistemática saque-aniversário podem retirar parte do seu saldo de FGTS independentemente da ocorrência da rescisão contratual. Essa nova modalidade de saque, juntamente com outras alterações, levanta um questionamento fundamental: tais mudanças impactam a arrecadação líquida do Fundo e sua capacidade de cumprir as funções originais, comprometendo sua sustentabilidade?
Diante desse cenário, a aplicação de Big Data Analytics torna-se crucial para subsidiar decisões informadas sobre políticas públicas, garantindo a perenidade do FGTS como instrumento de proteção social. Assim, o presente estudo busca abordar a importância da utilização de Big Data Analytics nas decisões sobre políticas públicas, analisando a correlação entre a arrecadação líquida do FGTS e os valores sacados nas modalidades de aniversário, aposentadoria, moradia própria e demissão sem justa causa, no período de abril de 2020 a janeiro de 2024.
2. Material e Métodos
O presente estudo adotou uma abordagem quantitativa e de natureza correlacional, com o objetivo de analisar a relação entre a arrecadação líquida do Fundo de Garantia do Tempo de Serviço (FGTS) e os valores sacados em diferentes modalidades. Buscou-se compreender como as alterações legais que ampliaram as possibilidades de saque impactaram a sustentabilidade financeira do Fundo. A pesquisa concentrou-se na avaliação da correlação entre as variáveis, sem estabelecer relações de causalidade direta.
A unidade de análise consistiu em dados públicos mensais referentes à arrecadação líquida do FGTS e aos valores sacados por diferentes motivos. O período de observação abrangeu abril de 2020 a janeiro de 2024. Essa delimitação temporal foi definida pela disponibilidade dos dados, uma vez que a modalidade de saque-aniversário foi implementada em abril de 2020 e os dados de arrecadação líquida estavam disponíveis até janeiro de 2024 no momento da coleta.
Os dados foram capturados diretamente da página eletrônica oficial do FGTS (fgts.gov.br), que disponibiliza informações públicas sobre o Fundo. Foram coletadas as séries históricas mensais da arrecadação líquida e dos saques efetivados. As modalidades de saque consideradas incluíram saque-aniversário (códigos 60 e 60F), aposentadoria (códigos 05, 05A, 05E e 05F), moradia própria (códigos 91, 92, 93, 95 e 96) e demissão sem justa causa (códigos 01, 01M e 01S).
Após a captura, os dados foram organizados em uma série histórica mensal, utilizando a ferramenta Microsoft Excel. Cada variável, incluindo a arrecadação líquida e os valores de cada modalidade de saque, foi registrada em bilhões de reais. Essa organização permitiu a estruturação dos dados para a subsequente aplicação das técnicas de análise estatística.
Para avaliar a correlação entre a arrecadação líquida do FGTS e os valores sacados nas modalidades específicas, aplicou-se a análise estatística bivariada. O coeficiente de correlação de Pearson foi calculado por meio da função CORREL do Microsoft Excel. Este coeficiente é uma medida estatística que indica a força e a direção de uma relação linear entre duas variáveis quantitativas.
O coeficiente de correlação de Pearson varia de -1 a 1. Um valor próximo de 1 indica uma correlação positiva forte, sugerindo que as variáveis se movem na mesma direção. Um valor próximo de -1 indica uma correlação negativa forte, onde as variáveis se movem em direções opostas. Um valor próximo de 0 (zero) sugere ausência de correlação linear (Fávero e Belfiore, 2025).
A interpretação da intensidade da correlação é fundamental para a compreensão dos resultados. Coeficientes entre 0,1 e 0,3 são considerados fracos, enquanto valores entre 0,4 e 0,6 indicam uma correlação moderada. Já os resultados entre 0,7 e 1 apontam para uma correlação forte. Essa classificação auxilia na identificação da intensidade do relacionamento entre as variáveis estudadas (Dancey e Reidy, 2019).
A aplicação do coeficiente de Pearson visou identificar a existência de uma relação linear entre a arrecadação líquida do FGTS e cada tipo de saque, bem como a direção e a intensidade dessa relação. O procedimento permitiu verificar se o aumento ou a diminuição de uma variável acompanhava o comportamento da outra, sem inferir causalidade.
3. Resultados e Discussão
A presente seção detalha os achados da pesquisa, que se propôs a analisar a correlação entre a arrecadação líquida do Fundo de Garantia do Tempo de Serviço (FGTS) e os valores sacados em diferentes modalidades, no período de abril de 2020 a janeiro de 2024. A investigação utilizou uma abordagem de Big Data Analytics, conforme o macroprocesso descrito por Ferreira e Gomes (2019), que integra a captura, tratamento e análise de dados para gerar insights estratégicos. A operacionalização do subprocesso de Big Data foi realizada pela Caixa Econômica Federal, agente operador do FGTS, que disponibiliza dados públicos tratados e agregados, permitindo a execução do subprocesso Analytics por meio de técnicas estatísticas, como a análise de correlação de Pearson.
Para o estudo, foram coletados dados mensais referentes à arrecadação líquida do FGTS e aos principais tipos de saque: aniversário, aposentadoria, moradia própria e demissão sem justa causa. Esses dados, expressos em bilhões de reais, foram organizados em séries históricas para permitir a aplicação da análise estatística bivariada. O período de análise foi delimitado pela disponibilidade dos dados do saque-aniversário, que se iniciou em abril de 2020, estendendo-se até janeiro de 2024, momento em que os dados mais recentes estavam acessíveis para a pesquisa.
Inicialmente, observou-se que a arrecadação líquida do FGTS apresentou valores negativos nos meses iniciais da pandemia, especificamente de abril a junho de 2020, e novamente de maio a agosto de 2021. Nos demais períodos analisados, a arrecadação manteve-se positiva. Essa variação sugere uma sensibilidade do Fundo a contextos econômicos mais amplos, como crises ou períodos de recuperação. Além disso, identificou-se um padrão sazonal na arrecadação, com picos notáveis nos meses de dezembro e janeiro, e quedas acentuadas em março de cada ano, indicando a influência de fatores externos, como o aquecimento do mercado de trabalho e o aumento do consumo nos períodos de festas de fim de ano.
Em contraste com a arrecadação líquida, a modalidade de saque-aniversário demonstrou um crescimento contínuo nos valores sacados desde sua implementação em abril de 2020. Esse padrão de aumento progressivo pode ser interpretado como um reflexo da adesão crescente dos trabalhadores a essa nova sistemática de saque, que permite a retirada anual de parte do saldo do FGTS, independentemente da rescisão contratual. A observação desse crescimento constante ressalta a popularidade e a consolidação dessa opção entre os beneficiários do Fundo.
Ao investigar a correlação entre a arrecadação líquida e o saque-aniversário, o coeficiente de correlação de Pearson calculado foi de 0,45, indicando uma correlação positiva moderada. Esse resultado sugere que, à medida que os valores do saque-aniversário aumentam, a arrecadação líquida do FGTS também tende a crescer, e vice-versa. Contudo, é fundamental interpretar que essa correlação positiva não estabelece uma relação de causalidade direta, mas sim um crescimento simultâneo das variáveis, influenciado por fatores comuns.
A interpretação cuidadosa desses resultados é crucial, pois a correlação entre variáveis não implica, necessariamente, uma relação de causa e efeito. No contexto do FGTS e do saque-aniversário, é plausível que variáveis externas de natureza macroeconômica, como a inflação, exerçam influência significativa. A inflação, ao elevar os salários, tende a aumentar o valor dos depósitos realizados pelas empresas no FGTS. Concomitantemente, como o saque-aniversário é calculado com base em um percentual do saldo das contas vinculadas, o aumento desses saldos também eleva o valor disponível para saque, gerando um crescimento simultâneo de ambas as variáveis sem uma ligação causal direta (Davenport e Harris, 2018).
A análise da correlação entre a arrecadação líquida e o saque por aposentadoria revelou um coeficiente de Pearson de 0,66. Este valor indica uma correlação positiva moderada, sendo mais forte do que a observada com o saque-aniversário. A relação diretamente proporcional sugere que o aumento dos saques por aposentadoria tende a ocorrer em conjunto com o aumento da arrecadação líquida. Similarmente aos saques-aniversário, essa correlação não deve ser interpretada como causal, mas como um indicativo de fatores subjacentes que afetam ambas as dimensões.
Para os saques por aposentadoria, o aumento da arrecadação líquida pode ser influenciado pela valorização salarial no mercado de trabalho formal, enquanto o crescimento dos saques pode ser atribuído ao envelhecimento da força de trabalho e ao consequente aumento no número de trabalhadores que atingem a idade de aposentadoria. Esses fatores externos atuam de forma conjunta, elevando tanto a arrecadação quanto os saques, sem que um seja a causa direta do outro. A aplicação de Big Data Analytics permite identificar esses padrões complexos, que seriam difíceis de discernir sem uma análise aprofundada dos dados.
No que tange à correlação entre a arrecadação líquida e o saque para uso em moradia própria, o coeficiente de Pearson obtido foi de 0,37. Este resultado aponta para uma correlação positiva fraca, indicando uma relação diretamente proporcional, mas com menor intensidade em comparação com as modalidades de saque-aniversário e aposentadoria. A dispersão dos pontos observada na análise gráfica reforça a natureza fraca dessa correlação, sugerindo que a proximidade com uma correlação perfeita é limitada.
A interpretação para a correlação positiva fraca entre arrecadação líquida e saques para moradia própria também se alinha à influência de variáveis externas. O crescimento do crédito imobiliário, por exemplo, pode aumentar a disposição dos trabalhadores para a aquisição de imóveis, resultando em mais saques. Simultaneamente, a valorização salarial e a formalização do mercado de trabalho podem contribuir para o aumento da arrecadação. Assim, a correlação observada reflete a ação conjunta de múltiplos fatores macroeconômicos e sociais, e não uma relação de causalidade direta entre o volume de saques e a arrecadação.
Em síntese, as correlações positivas observadas para os saques-aniversário, aposentadoria e moradia própria, embora moderadas ou fracas, não devem ser interpretadas como um fortalecimento da sustentabilidade do FGTS. Pelo contrário, esses resultados são indicativos de que variáveis externas, como a inflação e a dinâmica do mercado de trabalho, influenciam simultaneamente tanto a arrecadação quanto o volume de saques. Essa perspectiva é crucial para evitar interpretações equivocadas sobre a saúde financeira do Fundo, destacando a complexidade das interações entre os dados.
A análise mais relevante para a sustentabilidade do Fundo foi a correlação entre a arrecadação líquida e o saque por demissão sem justa causa, que representa o maior volume de saques no período estudado. O coeficiente de correlação de Pearson para essa modalidade foi de -0,64, indicando uma correlação negativa moderada. Esse resultado é inversamente proporcional, o que significa que, à medida que os saques por demissão sem justa causa aumentam, a arrecadação líquida do FGTS tende a diminuir.
Essa correlação negativa merece atenção especial, pois o saque por demissão sem justa causa está diretamente relacionado à função original do FGTS, que é prover proteção ao trabalhador em momentos de desligamento involuntário. A tendência de redução na arrecadação líquida, à medida que os saques por demissão aumentam, pode comprometer a capacidade do FGTS de cumprir suas demais funções sociais coletivas, como o financiamento de projetos de infraestrutura, saneamento básico e habitação popular. Essa hipótese se torna particularmente preocupante em cenários de aumento da informalidade no mercado de trabalho ou da substituição de vínculos empregatícios por contratos de pessoas jurídicas (PJ), que não geram recolhimento ao FGTS.
Ainda que a análise de correlação não estabeleça causalidade, a correlação negativa com os saques por demissão sem justa causa levanta uma hipótese relevante sobre o impacto na sustentabilidade do Fundo. O aumento desses saques pode estar contribuindo para a redução dos recursos disponíveis, o que, em um cenário extremo de informalização, poderia comprometer não apenas a sustentabilidade financeira do FGTS, mas sua própria existência como instrumento de proteção social. A capacidade do Big Data Analytics em identificar essa relação inversa é fundamental para alertar os formuladores de políticas públicas sobre potenciais riscos.
Os resultados obtidos demonstram que o uso de Big Data Analytics oferece uma ferramenta poderosa para a formulação e avaliação de políticas públicas. Embora as correlações positivas observadas para o saque-aniversário, aposentadoria e moradia própria não permitam afirmar que essas modalidades de saque comprometam a sustentabilidade do FGTS, elas indicam a influência de variáveis externas que afetam simultaneamente a arrecadação e os saques. Por outro lado, a correlação negativa com os saques por demissão sem justa causa sugere um risco potencial à capacidade do Fundo de continuar cumprindo suas funções originais.
Em suma, a pesquisa revelou padrões complexos nas interações entre a arrecadação líquida do FGTS e as diferentes modalidades de saque. As correlações positivas para saque-aniversário, aposentadoria e moradia própria indicam a influência de fatores macroeconômicos que impulsionam ambos os lados da equação, enquanto a correlação negativa com o saque por demissão sem justa causa aponta para uma dinâmica que pode impactar diretamente a sustentabilidade do Fundo. A análise de dados, portanto, é essencial para subsidiar decisões estratégicas e garantir a perenidade do FGTS como um pilar de proteção social e desenvolvimento nacional.
4. Conclusão
O presente estudo buscou analisar a correlação entre a arrecadação líquida do Fundo de Garantia do Tempo de Serviço (FGTS) e os valores sacados em diferentes modalidades, no período de abril de 2020 a janeiro de 2024, evidenciando a importância do Big Data Analytics na formulação de políticas públicas. Verificou-se que a arrecadação líquida do FGTS apresentou correlações positivas moderadas com os saques por aniversário (0,45), aposentadoria (0,66) e moradia própria (0,37). Contudo, observou-se que essas relações não indicam causalidade direta, mas sim a influência de variáveis macroeconômicas e de mercado de trabalho, como a inflação e a formalização, que impulsionam simultaneamente a arrecadação e os saques. Em contraste, identificou-se uma correlação negativa moderada (-0,64) entre a arrecadação líquida e os saques por demissão sem justa causa, modalidade que representa o maior volume de retiradas e está diretamente ligada à função original de proteção social do Fundo. Este achado sugere um risco potencial à capacidade do FGTS de cumprir suas funções sociais coletivas, especialmente em cenários de informalidade crescente no mercado de trabalho. A aplicação de Big Data Analytics mostrou-se, assim, uma ferramenta eficaz para identificar padrões complexos e subsidiar decisões estratégicas no âmbito das políticas públicas.
É fundamental ressaltar que a análise de correlação, por sua natureza, não estabelece relações de causalidade, o que constitui uma limitação inerente ao desenho metodológico empregado. A interpretação cuidadosa dos resultados é crucial para evitar conclusões equivocadas sobre a sustentabilidade do FGTS, reconhecendo que fatores externos atuam de forma conjunta sobre as variáveis estudadas. Diante da correlação negativa observada com os saques por demissão sem justa causa, recomenda-se a ampliação de estudos futuros para investigar a existência de uma relação causal entre essa modalidade de saque e a redução da arrecadação líquida. Sugere-se, ainda, aprofundar a análise sobre os impactos da rotatividade no mercado formal e seus reflexos na sustentabilidade do FGTS, buscando identificar medidas que garantam a perenidade e a eficácia do Fundo como instrumento de proteção social e desenvolvimento nacional.
Referências Bibliográficas
Brasil. 1966. Lei n. 5.107, de 13 de setembro de 1966. Cria o Fundo de Garantia do Tempo de Serviço, e dá outras providências. Disponível em https://www.planalto.gov.br/ccivil_03/LEIS/L5107.htm. Acesso em 23 mar. 2023.
Brasil. 1990. Lei n. 8.036, de 11 de maio de 1990. Dispõe sobre o Fundo de Garantia do Tempo de Serviço, e dá outras providências. Disponível em https://www.planalto.gov.br/ccivil_03/leis/l8036consol.htm. Acesso em 12 mar. 2023.
Dancey, C. P.; Reidy, J. 2019. Estatística sem Matemática para Psicologia. 7 ª ed. Penso Editora, Porto Alegre, RS, Brasil.
Davenport, T. H.; Harris, J. G. 2018. Competição Analítica: Vencendo Através da Nova Ciência. 1ª ed. Alta Books, Rio de Janeiro, RJ, Brasil.
Ferreira, R.; Gomes, J. S. 2019. Projeto de big data analytics: uma discussão à luz da capacidade absortiva. Disponível em https://periodicos.uff.br/sbijournal/article/view/28905. Acesso em 23 mar. 2023.
Fávero. L. P.; Belfiore, P. 2025. Manual de Análise de Dados: Estatística e Machine Learning com Excel®, SPSS®, Stata®, R® e Python®. 2ª ed. LTC Livros Técnicos e Científicos, Rio de Janeiro, RJ, Brasil.
Artigo oriundo de Trabalho de Conclusão de Curso de Especialização em Digital Business do MBA USP/Esalq
Saiba mais sobre o curso; clique aqui:























