Imagem Significância de fatores socioeconômicos na abstenção eleitoral brasileira de 2024

26 de fevereiro de 2026

Significância de fatores socioeconômicos na abstenção eleitoral brasileira de 2024

Gabriel Colombo; Fabricio Pelloso Piurcosky

Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.

Esta pesquisa investiga a significância estatística de variáveis socioeconômicas na determinação dos índices de abstenção eleitoral no Brasil, com foco nas eleições municipais de 2024. A análise busca compreender como indicadores como escolaridade, Índice de Desenvolvimento Humano Municipal (IDHM), renda per capita, densidade demográfica e estrutura populacional, obtidos de fontes públicas, se associam à decisão do eleitor de não comparecer às urnas. O estudo desenvolve e compara modelos de regressão linear para diferentes escopos geográficos — primeiro para as capitais e depois para todos os municípios brasileiros — a fim de avaliar a robustez das relações identificadas. Adicionalmente, o trabalho apresenta os resultados por meio de ferramentas de visualização de dados, proporcionando uma compreensão dos padrões de participação eleitoral e oferecendo subsídios para futuras investigações e políticas públicas.

A participação eleitoral é um pilar da democracia, e a análise da abstenção é crucial para a representatividade política, sendo um tema de relevância crescente no Brasil e em outras democracias (Borba, 2008). Este estudo explora a hipótese de que condições socioeconômicas contextuais exercem influência mensurável sobre as taxas de abstenção, partindo de uma base de dados quantitativa e aplicando métodos estatísticos. A análise histórica dos níveis de abstenção nas capitais brasileiras, de 2000 a 2024, serve como pano de fundo para a investigação dos dados do pleito mais recente.

A literatura acadêmica brasileira aborda o conceito de “alienação eleitoral” (Santos, 1987), que agrupava abstenções, votos brancos e nulos. A base teórica para essa abordagem é o modelo da escolha racional (Downs, 1998), que postula que o eleitor realiza um cálculo de custo-benefício. Se os custos de votar (deslocamento, tempo, informação) superam os benefícios, a probabilidade de não participação aumenta (Silva, 2013). No entanto, essa visão unificada foi desafiada por pesquisadores que argumentaram pela necessidade de tratar cada fenômeno de forma distinta.

A crítica mais contundente a esse agrupamento foi apresentada por Nicolau (2004), que demonstrou empiricamente como a transição para a urna eletrônica no Brasil impactou desigualmente os votos não válidos. A simplificação do processo de votação levou a uma redução drástica dos votos nulos e brancos, frequentemente associados a dificuldades de eleitores com menor escolaridade, enquanto os índices de abstenção seguiram uma trajetória distinta. Essa separação analítica é fundamental, pois revela que a abstenção pode estar ligada a um conjunto diferente de variáveis, como condições sociais, econômicas e engajamento cívico.

A metodologia é quantitativa, baseada na análise de dados secundários de fontes oficiais. O processo utilizou a linguagem Python 3.7 (Python Software Foundation, 2023) para automação da coleta e pré-processamento. A biblioteca Pandas (McKinney, 2023) foi usada para a manipulação de dados, enquanto a modelagem estatística empregou o modelo de Mínimos Quadrados Ordinários (OLS) da biblioteca Statsmodel (Seabold & Perktold, 2023) para estimar a relação linear entre a taxa de abstenção e os indicadores socioeconômicos. Os dados foram armazenados em um banco de dados PostgreSQL (PostgreSQL Global Development Group, 2023), acessado pela interface DBeaver (DBeaver, 2023).

O fluxo de trabalho iniciou com a obtenção dos dados eleitorais do repositório do Tribunal Superior Eleitoral (TSE) para as eleições municipais de 2000 a 2024. A limpeza de dados envolveu a criação de uma chave primária (cidade + UF) para evitar inconsistências, a padronização de colunas e a segmentação entre primeiro e segundo turnos. Os dados socioeconômicos e geográficos foram extraídos do IBGE, que os disponibiliza em formato de texto, exigindo um script com expressões regulares (RegEx) para estruturar informações como área territorial, população, densidade demográfica, escolarização, IDHM, mortalidade infantil e PIB per capita.

Uma etapa fundamental foi a expansão da base de dados. A análise inicial, restrita às 26 capitais, apresentava risco de viés, já que as capitais não são representativas da maioria dos municípios. Para aumentar a robustez do modelo, o escopo foi expandido para todos os 5.567 municípios do país. Esse processo exigiu tratamentos adicionais, como a remoção de eleições suplementares, a imputação de valores nulos em variáveis do IBGE (a mortalidade infantil foi imputada com a média estadual) e a resolução de divergências na nomenclatura de municípios entre as bases do TSE e do IBGE. Após a padronização, dois municípios não foram encontrados na base do IBGE e foram removidos, resultando em uma base final consolidada.

A apresentação dos resultados foi realizada com o Microsoft Power BI (Microsoft, 2023), com dados importados do PostgreSQL. A modelagem no Power BI envolveu a criação de relacionamentos entre tabelas e o desenvolvimento de medidas em linguagem DAX (Data Analysis Expressions) para análises dinâmicas. Foram construídos dashboards interativos com gráficos, tabelas e mapas para facilitar a exploração dos dados e a comunicação dos achados. A arquitetura do projeto integrou um pipeline completo, desde a extração de dados, passando pelo processamento e modelagem estatística, até a visualização interativa.

A análise exploratória nas 26 capitais revelou alta multicolinearidade entre as variáveis preditoras. A matriz de correlação indicou forte correlação positiva entre IDHM e PIB per capita (0, 7386) e negativa entre IDHM e mortalidade infantil (-0,6872). Variáveis altamente correlacionadas podem comprometer a estabilidade de um modelo de regressão, pois fornecem informações redundantes, inflando a variância dos coeficientes e dificultando a identificação do efeito individual de cada preditor.

O primeiro modelo OLS, treinado com os dados das capitais, foi estatisticamente significativo em seu conjunto (p-valor do teste F = 0,00534), com um coeficiente de determinação (R²) de 0,63, explicando 63% da variação na taxa de abstenção. No entanto, a análise dos coeficientes individuais mostrou que a maioria das variáveis não era estatisticamente significativa. A única variável com forte relevância foi o IDHM (p-valor = 0,0015), cujo coeficiente positivo (1, 3956) sugeriu, contraintuitivamente, que capitais com maior desenvolvimento humano tendem a ter maiores índices de abstenção. A escolarização apresentou significância marginal (p-valor = 0,063) e um coeficiente negativo, alinhado à teoria.

A limitação da amostra motivou a expansão da análise para todos os 5.567 municípios. A análise de correlação na base de dados ampliada mostrou uma redução significativa da multicolinearidade. O treinamento do modelo OLS com esta base nacional resultou em um R² de 0,186, indicando que as variáveis socioeconômicas explicam 18,6% da variabilidade nas taxas de abstenção em todo o país. Embora o poder explicativo seja menor, o que era esperado devido à heterogeneidade dos municípios, a vantagem deste modelo foi sua robustez estatística: o p-valor do teste F foi praticamente nulo (4,93e-243) e todas as variáveis preditoras se mostraram estatisticamente significativas.

Este último resultado é o mais informativo, pois sugere que, embora as variáveis do IBGE não expliquem a maior parte da abstenção, todas possuem uma relação estatisticamente válida com ela em nível nacional. O modelo demonstrou que municípios com maior IDHM e PIB per capita tendem a ter maiores taxas de abstenção, confirmando o padrão contraintuitivo das capitais, o que pode indicar apatia ou desilusão política em contextos mais desenvolvidos. Em contrapartida, escolarização e densidade demográfica apresentaram coeficientes negativos, indicando que municípios mais escolarizados e densamente povoados tendem a ter menor abstenção. A diferença nos resultados entre os modelos reforça que as dinâmicas eleitorais das metrópoles não são representativas do país.

Os resultados foram consolidados em um relatório interativo no Power BI. A primeira seção oferece uma análise histórica dos índices de abstenção, votos brancos e nulos para as capitais entre 2000 e 2024, permitindo identificar tendências como o aumento da abstenção em 2020 e sua persistência em 2024. A segunda seção visualiza os resultados do modelo das capitais, comparando valores reais e preditos e exibindo o erro de previsão por meio de um mapa interativo. A terceira e última aba apresenta os achados do modelo nacional, com mapas coropléticos que exibem a distribuição geográfica das taxas de abstenção, dos indicadores socioeconômicos e do erro do modelo, revelando padrões regionais. A interatividade dos elementos permite ao usuário explorar as complexas relações entre contexto socioeconômico e participação eleitoral.

A análise comparativa dos modelos revela que, embora o modelo restrito às capitais apresente um poder explicativo maior (R² = 63%), sua validade é limitada pela pequena amostra e pela multicolinearidade. Por outro lado, o modelo nacional, apesar de um R² inferior (18,6%), é estatisticamente mais robusto e informativo. A significância de todas as variáveis preditoras neste modelo confirma que os fatores socioeconômicos desempenham um papel relevante, ainda que não exclusivo, na determinação da abstenção em todo o território. A discrepância entre os modelos evidencia que as capitais possuem uma dinâmica de participação política distinta do restante do país, reforçando a importância de análises que considerem a heterogeneidade municipal.

As implicações práticas deste estudo apontam para a necessidade de políticas públicas e estratégias de engajamento cívico sensíveis aos contextos locais. O achado de que municípios mais desenvolvidos (maior IDHM) apresentam maior abstenção sugere que o desengajamento pode estar associado à apatia, um desafio que requer abordagens diferentes daquelas voltadas para barreiras de acesso. A pesquisa também abre caminhos para estudos futuros, que podem aprimorar o modelo incorporando variáveis políticas, como competitividade eleitoral, polarização e confiança nas instituições. A análise do impacto das redes sociais e da desinformação emerge como uma fronteira de investigação promissora. Conclui-se que o objetivo foi atingido: demonstrou-se que as variáveis socioeconômicas são estatisticamente significantes para a compreensão dos índices de abstenção eleitoral no Brasil, fornecendo uma base sólida para investigações mais aprofundadas.

Referências:
BORBA, Julian. As bases sociais e atitudinais da alienação eleitoral no Brasil. Revista Debates, v. 2, n. 2, p. 134-157, 2008.
CERVI, Emerson Urizzi; BORBA, Felipe. Quem se abstém no Brasil? Competição local e efeito da Covid-19 na participação do eleitor no primeiro turno da eleição municipal de 2020. Sociedade e Estado, v. 37, n. 2, p. 599-619, 2022.
DBEAVER. DBeaver: ferramenta universal para gerenciamento de banco de dados. Versão 23.0: DBeaver Corp., 2023. Disponível em: <https://dbeaver. io/>. Acesso em: 10 jul. 2025.
DOWNS, Anthony. An economic theory of democracy. Harper and Row, v. 28, 1957.
Instituto Brasileiro de Geografia e Estatística [IBGE]. 2025. Cidades e Estados. Disponível em: <https://www. ibge. gov. br/cidades-e-estados>. Acesso em: 20 abr. 2025.
JUPYTER. Jupyter Notebook: ambiente interativo de desenvolvimento. Versão 6.5.1. Project Jupyter, 2023. Disponível em: <https://jupyter. org/>. Acesso em: 10 jul. 2025.
MCKINNEY, Wes. Pandas: biblioteca para análise e manipulação de dados em Python. Versão 2.2.1: Python Software Foundation, 2023. Disponível em: <https://pandas. pydata. org/>. Acesso em: 10 jul. 2025.
MICROSOFT. Power BI – análise de dados e visualização. Versão 2.118. Microsoft, 2023. Disponível em <https://powerbi. microsoft. com>, acesso em 10 jul. 2025.
NICOLAU, Jairo. A participação eleitoral: evidências sobre o caso brasileiro. In: Congresso Luso-Afro-Brasileiro de Ciências Sociais. 2004.
POSTGRESQL GLOBAL DEVELOPMENT GROUP. PostgreSQL: sistema gerenciador de banco de dados objeto-relacional. Versão 15: PostgreSQL Global Development Group, 2023. Disponível em: <https://www. postgresql. org/>. Acesso em: 10 jul. 2025.
PYTHON SOFTWARE FOUNDATION. Python: linguagem de programação. Versão 3.7: Python Software Foundation, 2023. Disponível em: <https://www. python. org/>. Acesso em: 10 jul. 2025.
SANTOS, Wanderley Guilherme dos. Crise e castigo: partidos e generais na política brasileira. Rio de Janeiro: Vértice/IUPERJ, 1987.
SEABOLD, Skipper; PERKTOLD, Josef. Statsmodels: econometric and statistical modeling with Python: Python Software Foundation, 2023. Disponível em: <https://www. statsmodels. org/>. Acesso em: 10 jul. 2025.
SILVA, Rafael da. Alienação eleitoral: um estudo comparado das bases sociais e atitudinais. Revista Andina de Estudios Políticos, v. 3, n. 1, p. 109-133, 2013.
Tribunal Superior Eleitoral [TSE]. 2024. Detalhe da apuração por município e zona. Disponível em: <https://dadosabertos. tse. jus. br/dataset/resultados-2024>. Acesso em: 20 abr. 2025.


Resumo executivo oriundo de Trabalho de Conclusão de Curso de Especialização em Data Science e Analytics do MBA USP/Esalq

Saiba mais sobre o curso; clique aqui:

Quem editou este artigo

Você também pode gostar

Quer ficar por dentro das nossas últimas publicações? Inscreva-se em nossa newsletter!

Receba conteúdos e fique sempre atualizado sobre as novidades em gestão, liderança e carreira com a Revista E&S.

Ao preencher o formulário você está ciente de que podemos enviar comunicações e conteúdos da Revista E&S. Confira nossa Política de Privacidade