11 de fevereiro de 2026
Análise do comportamento eleitoral brasileiro e o efeito do voto de arrasto
Raphael Frazão; Patrícia Belfiore Fávero
Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.
Esta pesquisa investigou a existência, a intensidade e os determinantes do “voto de arrasto” no sistema eleitoral brasileiro. O estudo analisou quantitativamente a relação entre a escolha para cargos executivos (prefeito, presidente) e legislativos (vereador, deputado federal) na mesma seção eleitoral. O objetivo foi verificar se a popularidade e o alinhamento ideológico de um candidato majoritário influenciam o desempenho de candidatos proporcionais, comparando as eleições municipais de 2024 e nacionais de 2022.
A análise buscou quantificar a magnitude do fenômeno e entender suas variações conforme o nível da eleição (municipal vs. nacional) e o contexto demográfico (região, porte do município). Compreender seus gatilhos e sua magnitude é, portanto, fundamental para decifrar a dinâmica do poder e da representação no Brasil. O “voto de arrasto”, ou coattail effect, descreve a capacidade de um candidato proeminente em disputa majoritária de transferir votos para outros candidatos de seu partido ou coligação (Borges & Lloyd, 2016). Este efeito é um componente central das estratégias partidárias, influenciando alianças e a composição dos legislativos. Sua compreensão é indispensável para analisar a governabilidade e a representação política no presidencialismo federativo brasileiro. Esta dualidade torna seu estudo ainda mais pertinente para o debate sobre a qualidade da democracia. A literatura destaca que as coligações são um elemento intrínseco ao sistema; partidos buscam maximizar ganhos eleitorais (Limongi & Vasselai, 2018).
O voto de arrasto, nesse contexto, resulta de uma engenharia política deliberada para otimizar resultados em um ambiente competitivo e multipartidário (Power & Rodrigues-Silveira, 2019). Esta pesquisa utiliza dados em nível de seção eleitoral para observar os resultados concretos dessas estratégias. Ao focar na seção eleitoral, a unidade mais granular de análise de votação, o estudo busca superar as limitações de análises agregadas em nível municipal ou estadual, que podem mascarar heterogeneidades locais e levar a inferências ecológicas imprecisas sobre o comportamento do eleitor individual. A ideologia funciona como um “atalho cognitivo” para o eleitor (Downs, 1957), simplificando a escolha em um quadro partidário complexo. Embora haja desafios, é possível mapear o espectro ideológico dos partidos brasileiros (Bolognesi et al., 2023).
Este estudo investiga se o alinhamento ideológico entre candidatos majoritários e proporcionais é um preditor mais forte do voto de arrasto do que a simples afiliação partidária, sugerindo que a coerência ideológica pode transcender alianças formais. A hipótese subjacente é que, em um cenário de crescente polarização, os eleitores podem usar a posição ideológica do candidato executivo de sua preferência como um guia para selecionar um legislador, mesmo que este pertença a uma legenda diferente, mas ideologicamente próxima. Apesar da literatura sobre comportamento eleitoral, a análise do voto de arrasto com ciência de dados em grande escala e em nível de seção eleitoral é uma fronteira de pesquisa. Estudos tradicionais frequentemente usam dados agregados que podem ocultar nuances.
Esta investigação preenche essa lacuna ao empregar um volume massivo de dados do Tribunal Superior Eleitoral (TSE) e aplicar modelos preditivos para avaliar o poder de diferentes variáveis com um rigor empírico sem precedentes (Hastie et al., 2009). A abordagem computacional permite não apenas testar hipóteses de forma estatística, mas também construir modelos capazes de prever a ocorrência do fenômeno, hierarquizando a importância relativa de cada fator explicativo e revelando padrões complexos que métodos convencionais teriam dificuldade em identificar. A metodologia baseou-se na análise de dados públicos de “Votação por Seção Eleitoral” do TSE para os pleitos de 2022 (nacional) e 2024 (municipal), abrangendo todas as seções do país.
Para cada seção, foram registrados os candidatos mais votados para prefeito/vereador (2024) e presidente/deputado federal (2022). A principal variável criada foi a classificação ideológica dos partidos, baseada na escala de Bolognesi, Ribeiro e Codato (2023), que gerou a variável binária mesmoespectroideologico. Foram incorporadas variáveis demográficas (região, porte populacional) do Ipeadata e a proporcao_votos do candidato majoritário na seção, como proxy de popularidade. O processo de extração, transformação e carga (ETL) foi conduzido em Python, com os dados consolidados em um banco de dados PostgreSQL. Este processo envolveu a limpeza e padronização de milhões de registros, a fusão de fontes de dados heterogêneas e a engenharia de variáveis para tornar os dados brutos adequados para a modelagem estatística e de aprendizado de máquina. A operacionalização das variáveis foi um passo crítico.
A variável mesmoespectroideologico foi codificada como 1 se o partido do candidato majoritário e do proporcional mais votados na seção pertencessem ao mesmo bloco ideológico (Esquerda, Centro ou Direita), conforme a classificação de Bolognesi et al. (2023), e 0 caso contrário. A variável proporcao_votos foi calculada como a porcentagem de votos válidos que o candidato ao executivo obteve naquela seção específica, servindo como uma medida direta de sua força eleitoral local. As variáveis demográficas, como o porte populacional do município, foram categorizadas em faixas para permitir a análise de como o fenômeno se comporta em contextos urbanos e rurais distintos. A combinação dessas variáveis permitiu a construção de um dataset robusto e multidimensional para a análise.
Para responder à questão de pesquisa, empregou-se uma abordagem mista. Primeiramente, a Regressão Logística Multinomial foi usada para avaliar a significância estatística e o efeito das variáveis preditoras sobre a probabilidade de alinhamento (Agresti, 2013). Este modelo foi escolhido por sua interpretabilidade, permitindo quantificar o impacto de cada variável no log-odds da ocorrência do alinhamento. Em complemento, foram aplicados modelos de aprendizado de máquina para avaliar a capacidade preditiva e hierarquizar a importância das variáveis. Utilizou-se o modelo de Florestas Aleatórias (Random Forest) por sua robustez contra sobreajuste e capacidade de capturar interações não lineares (Breiman, 2001). Subsequentemente, aplicou-se o XGBoost (Extreme Gradient Boosting), reconhecido por sua alta performance preditiva e eficiência (Chen & Guestrin, 2016).
A análise da importância das variáveis (feature importance) desses modelos, calculada através de métricas como a redução média da impureza (Gini) para o Random Forest e o ganho médio por divisão para o XGBoost, foi fundamental para identificar os principais motores do voto de arrasto.
A análise das eleições municipais de 2024 (478.025 seções) revelou forte alinhamento ideológico. Em 69,90% das seções, o prefeito e o vereador mais votados pertenciam ao mesmo espectro político. A maior parte desse alinhamento (42,79% do total) ocorreu entre candidatos de partidos diferentes, mas com ideologias congruentes, sugerindo que a afinidade ideológica transcende a filiação partidária. Este achado é particularmente relevante, pois indica que os eleitores, no nível local, utilizam a ideologia como um filtro primário, priorizando a coerência programática em detrimento da lealdade a uma única sigla. Dentro das seções alinhadas, o espectro da “Direita” representou 91,88% dos casos, indicando forte coesão nesse campo no nível municipal e uma capacidade superior de capitalizar o voto de arrasto em 2024. As eleições nacionais de 2022 (477.570 seções) apresentaram um cenário distinto. A maioria das seções (54,77%) não demonstrou alinhamento ideológico entre presidente e deputado federal.
Este número sugere que, na eleição nacional, o voto para deputado é influenciado por uma gama mais ampla de fatores, incluindo a força de lideranças regionais, o apelo individual do candidato e dinâmicas locais que não estão diretamente atreladas à disputa presidencial. Contudo, nos 45,23% das seções onde houve alinhamento, o padrão foi concentrado: 83,70% desses casos corresponderam ao espectro da “Direita”. O resultado aponta que o voto de arrasto, embora menos frequente que na esfera municipal, manifesta-se de forma intensa e ideologicamente coesa quando ocorre, refletindo a polarização nacional (Samuels & Zucco, 2018).
A análise por faixa populacional revelou padrões opostos entre as eleições. No pleito municipal de 2024, o alinhamento ideológico foi maior em municípios menores (78% em cidades com até 10 mil habitantes) e diminuiu com o aumento da população, sugerindo que a influência pessoal do prefeito e a menor complexidade do ambiente político fortalecem o arrasto local. Nesses contextos, a figura do prefeito domina o cenário político, e sua indicação ou apoio a um candidato a vereador tem um peso considerável. Em contrapartida, nas eleições nacionais de 2022, a tendência foi inversa: o alinhamento foi mais baixo em municípios pequenos e aumentou com o porte populacional, atingindo seu pico (quase 60%) em cidades maiores.
Isso indica que o voto de arrasto presidencial é mais proeminente em centros urbanos; o debate é mais nacionalizado, a informação política é mais disseminada pela mídia nacional e a polarização ideológica se manifesta com maior intensidade.
A análise regional expôs variações geográficas. Nas eleições municipais, Centro-Oeste (80,21%) e Sul (76,94%) tiveram os maiores índices de alinhamento, e o Nordeste (63,56%) o menor. Essa clivagem se acentuou no pleito nacional de 2022: Sul (68,33%) e Centro-Oeste (67,9%) mantiveram altas taxas, enquanto o Nordeste registrou apenas 15,7%. Esses padrões evidenciam que o voto de arrasto é moldado por culturas políticas regionais e diferentes níveis de polarização (Nicolau, 2014). As regiões Sul e Centro-Oeste, que demonstraram maior apoio a candidatos de direita na eleição presidencial, replicaram esse alinhamento de forma mais consistente no voto para deputado federal. Já o Nordeste, com forte apoio a um candidato presidencial de esquerda, não demonstrou a mesma coesão no voto legislativo, indicando uma dinâmica eleitoral mais complexa e possivelmente mais personalista na escolha dos deputados. Os modelos preditivos validaram as hipóteses do estudo.
Em ambas as eleições, os modelos de aprendizado de máquina, especialmente o XGBoost, alcançaram alta acurácia (88%), demonstrando uma forte capacidade de prever o alinhamento entre os votos majoritário e proporcional com base nas variáveis selecionadas.
A análise de importância das variáveis foi conclusiva.
Para as eleições municipais, mesmoespectroideologico (importância de 0,41 no Random Forest e 0,43 no XGBoost) e proporcaovotosprefeito (importância de 0,33 no Random Forest) foram as mais influentes.
Para as eleições nacionais, mesmoespectroideologico e proporcaovotospresidente foram novamente os fatores mais decisivos, com um peso combinado de quase 60% no Random Forest. No XGBoost, o alinhamento ideológico e a ideologia específica do candidato presidencial (espectropoliticopresidente_Direita) emergiram como os preditores mais poderosos. Esses resultados demonstram que a escolha para o cargo legislativo é fortemente influenciada pela escolha para o executivo, seja por alinhamento ideológico ou pela força eleitoral do candidato majoritário. A consistência dos achados entre os modelos confere robustez às conclusões. Enquanto a Regressão Logística confirmou a significância estatística das variáveis preditoras, estabelecendo a validade da relação, os modelos Random Forest e XGBoost validaram o poder preditivo e quantificaram a importância de cada fator.
A convergência dos resultados de múltiplos métodos analíticos, que partem de pressupostos distintos, permite afirmar com alto grau de confiança que o voto de arrasto é um fenômeno mensurável, cujos principais vetores são a congruência ideológica e a dominância eleitoral do candidato ao executivo. A superioridade da variável ideológica sobre outros fatores demográficos, como região e porte do município, reforça a tese de que a dimensão programática e ideológica tem ganhado centralidade no comportamento eleitoral brasileiro. A pesquisa validou empiricamente a existência e relevância do “voto de arrasto” no contexto eleitoral brasileiro, demonstrando que sua manifestação é moldada pelo nível da eleição e pelo contexto demográfico. Foram revelados padrões distintos entre os pleitos: o alinhamento ideológico foi mais forte em municípios menores no âmbito local, enquanto no cenário nacional a coesão foi mais proeminente em centros urbanos maiores.
Os modelos de aprendizado de máquina identificaram consistentemente a afinidade ideológica (mesmoespectroideologico) e a popularidade do candidato ao executivo (proporcao_votos) como os principais fatores preditivos do voto para o legislativo. Este estudo contribui para a literatura ao quantificar a intensidade do voto de arrasto e demonstrar a aplicabilidade de ferramentas de ciência de dados para analisar grandes volumes de dados eleitorais.
Conclui-se que o objetivo foi atingido: demonstrou-se que o fenômeno do ‘voto de arrasto’ é uma força significativa no comportamento eleitoral brasileiro, impulsionado pela afinidade ideológica e pela popularidade do candidato ao executivo, com sua intensidade e padrão variando conforme o nível da eleição e o contexto demográfico.
Referências:
Agresti, A. (2013). Categorical Data Analysis. John Wiley & Sons.
Bolognesi, B.; Ribeiro, E.; Codato, A. (2023). Uma Nova Classificação Ideológica dos Partidos Políticos Brasileiros. DADOS, Rio de Janeiro, 66(2): 1-29.
Borges, A.; Lloyd, R. (2016). Presidential coattails and electoral coordination in multilevel elections: comparative lessons from Brazil. Electoral Studies, 43: 104-114.
Breiman, L. (2001). Random Forests. Machine Learning, 45(1), 5-32.
Chen, T., & Guestrin, C. (2016). XGBoost: A Scalable Tree Boosting System. In Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (pp. 785-794).
Downs, A. (1957). An Economic Theory of Democracy. Harper & Row.
Hastie, T., Tibshirani, R., & Friedman, J. (2009). The Elements of Statistical Learning: Data Mining, Inference, and Prediction. Springer.
Limongi, F.; Vasselai, F. (2018). Entries and Withdrawals: Electoral Coordination across Different Offices and the Brazilian Party Systems. Brazilian Political Science Review, 12(3), 1-27.
Nicolau, J. (2014). Determinantes do voto no primeiro turno das eleições presidenciais brasileiras de 2010: uma análise exploratória. Opinião Pública, 20(3): 311-325.
Power, T. J., & Rodrigues-Silveira, R. (2019). Mapping Ideological Preferences in Brazilian Elections, 1994–2018: A Municipal-Level Study. Brazilian Political Science Review, 13(1).
Samuels, D., & Zucco, C. (2018). Partisans, Antipartisans, and Nonpartisans: Voting Behavior in Brazil. Cambridge University Press.
TRIBUNAL SUPERIOR ELEITORAL [TSE]. (2025). Processo Eleitoral Brasileiro. Disponível em: https://www. tse. jus. br/eleicoes/historia/processo-eleitoral-brasileiro. Acesso em: 10 junho 2025.
Resumo executivo oriundo de Trabalho de Conclusão de Curso de Especialização em Data Science e Analytics do MBA USP/Esalq
Saiba mais sobre o curso; clique aqui:




























