Imagem Fatores socioeconômicos e estruturais na abstenção de candidatos no ENEM

20 de fevereiro de 2026

Fatores socioeconômicos e estruturais na abstenção de candidatos no ENEM

Marco Asuncion dos Santos Caballero; Renato Máximo Sátiro

Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.

Esta pesquisa investiga os determinantes socioeconômicos e estruturais da abstenção no Exame Nacional do Ensino Médio (ENEM), utilizando uma abordagem estatística hierárquica. O objetivo é identificar perfis de candidatos com maior propensão à ausência e quantificar o impacto de variáveis contextuais, como tipo de escola e região geográfica, na probabilidade de não comparecimento. A análise busca subsidiar políticas públicas para mitigar barreiras à participação e promover equidade no acesso ao ensino superior, partindo da premissa de que a abstenção resulta da interação entre condições individuais e desigualdades estruturais.

O ENEM, criado em 1998 pelo Ministério da Educação, evoluiu de ferramenta de avaliação para o principal mecanismo de acesso ao ensino superior no Brasil. O número de inscritos saltou de 157 mil em seu primeiro ano para aproximadamente 3,9 milhões em 2023, refletindo sua centralidade nas políticas educacionais (Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira [INEP], 1998; INEP, 2023). A expansão foi impulsionada pelo Programa Universidade para Todos (PROUNI) em 2005 e pelo Sistema de Seleção Unificada (SISU) em 2010, que vincularam o desempenho no exame à concessão de bolsas e ao ingresso em universidades públicas federais (Junior, 2021).

A consolidação do ENEM, contudo, também o tornou um reflexo das desigualdades socioeconômicas e regionais. Estudos demonstram que o desempenho no exame está ligado a fatores como raça e tipo de escola, com estudantes autodeclarados brancos e de escolas privadas apresentando notas superiores (Jaloto e Primi, 2021). Essa disparidade se estende à participação: a taxa de abstenção, que atingiu 27,8% em 2023, não é uniformemente distribuída. Uma análise preliminar revela que os cinco estados com os maiores índices de ausência estão na região Norte, sugerindo que barreiras geográficas e de infraestrutura se somam às vulnerabilidades socioeconômicas.

Nesse contexto, a abstenção no ENEM torna-se um indicador de iniquidade educacional, podendo representar a interrupção de uma trajetória e a perpetuação de desigualdades. Esta pesquisa propõe uma análise que modela como estruturas institucionais e regionais condicionam as oportunidades e decisões dos estudantes. A metodologia multinível permite desagregar os efeitos do indivíduo e do contexto, oferecendo uma visão mais acurada dos gargalos que precisam ser enfrentados para que o ENEM cumpra sua função de democratizar o acesso à educação superior. A complexidade do fenômeno exige uma abordagem que reconheça a interdependência entre fatores como renda, acesso à internet e localização, que não são variáveis isoladas, mas componentes de um sistema que reproduz desigualdades.

Para este estudo, foram utilizados os microdados do ENEM de 2023, disponibilizados pelo INEP. Dada a volumetria dos dados, extraiu-se uma amostra aleatória simples de 10% do total de observações, com um estado aleatório fixo (random-state=42) para garantir a reprodutibilidade. O tratamento e a modelagem estatística foram realizados na linguagem Python, versão 3.11.5, com o suporte das bibliotecas pandas, numpy, statsmodels e pymer4.

A seleção de variáveis buscou capturar dimensões socioeconômicas e contextuais. A variável dependente foi dicotômica, indicando presença (0) ou ausência (1) do candidato. As variáveis explicativas de nível individual (nível 1) incluíram: faixa etária (TPFAIXAETARIA), sexo (TPSEXO), raça/cor (TPCORRACA), renda familiar (Q006), acesso à internet (Q025) e localização da escola (TPLOCALIZACAOESC). Para os efeitos contextuais (nível 2), considerou-se a combinação entre o tipo de escola (TPESCOLA, pública ou privada) e a macrorregião geográfica da prova (SGUFPROVA).

A técnica escolhida foi a regressão logística binária multinível, adequada para dados com estrutura hierárquica (Favero; Belfiore, 2017). No ENEM, os candidatos (nível 1) estão aninhados em contextos escolares e regionais (nível 2). Ignorar essa estrutura violaria a suposição de independência das observações, resultando na subestimação dos erros-padrão e em inferências estatísticas inflacionadas (Luke, 2020). Modelos hierárquicos são cruciais para separar os efeitos individuais dos contextuais, evitando vieses de agregação (Puente-Palacios e Laros, 2009).

Para validar a abordagem, comparou-se um modelo logístico tradicional com o modelo multinível utilizando o Critério de Informação de Akaike (AIC). Conforme Burnham e Anderson (2004), uma diferença de AIC superior a 10 indica suporte substancial para o modelo com menor valor. Os resultados mostraram uma diferença significativamente superior a 10, favorecendo o modelo multinível e confirmando a relevância da estrutura hierárquica para explicar a variabilidade na abstenção. A modelagem multinível permite, assim, estimar os efeitos fixos das características individuais e quantificar a variância atribuível às diferenças entre contextos (Raudenbush e Bryk, 2002; Gelman & Hill, 2007).

Os resultados confirmam que a abstenção no ENEM é determinada por uma interação de fatores individuais e contextuais. A análise dos efeitos fixos revelou que candidatos do sexo masculino apresentam uma chance aproximadamente 20% maior de se ausentarem em comparação com as candidatas (odds ratio [OR] ≈ 1,2), o que corrobora estudos sobre a maior persistência feminina na transição para o ensino superior (Mont’Alvão Neto, 2014).

A faixa etária demonstrou uma relação positiva com a abstenção. Utilizando a faixa de 18 a 25 anos como referência, todas as faixas etárias mais elevadas apresentaram odds ratios significativamente maiores que 1. Este resultado está alinhado com a literatura que destaca os desafios de estudantes mais velhos, muitos da Educação de Jovens e Adultos (EJA), que conciliam estudos com trabalho e família (Mariano et al., 2023). A renda familiar revelou um padrão não linear: candidatos nos extremos da distribuição – sem renda, com até 1,5 salário mínimo ou acima de 15 salários mínimos – mostraram maior propensão à ausência. Em contrapartida, candidatos de faixas de renda intermediárias (entre 3 e 15 salários mínimos) apresentaram menor probabilidade de abstenção, o que se alinha à discussão de Peres, Campos e Moraes (2025) sobre a relação entre recursos financeiros e trajetória acadêmica.

O acesso à internet emergiu como um fator protetivo, com um odds ratio de 0,736, indicando que candidatos com acesso à internet têm uma chance 26,4% menor de se ausentarem. Este resultado ressalta a importância da inclusão digital como ferramenta de engajamento e acesso à informação sobre o exame, reforçando o argumento de que o letramento digital é fundamental para a equidade educacional (Araújo e Glotz, 2009).

Em relação à localização da escola, estudantes de instituições urbanas possuem uma chance aproximadamente 10% menor de se ausentarem em comparação com os de escolas rurais, embora com significância estatística limítrofe (p=0,052). O resultado aponta para as dificuldades enfrentadas por estudantes de zonas rurais, como maiores distâncias de deslocamento, questão levantada por Bacha et al. (2006). A variável raça/cor não apresentou significância estatística para a maioria das categorias, com exceção dos candidatos autodeclarados brancos, que mostraram menor probabilidade de ausência. A baixa significância para candidatos pretos e pardos, embora contraintuitiva frente a estudos de desempenho (Alves, Soares e Xavier, 2016), sugere que outras barreiras socioeconômicas e logísticas podem se sobrepor aos fatores raciais na decisão de comparecer.

A contribuição mais robusta do estudo reside na análise dos efeitos contextuais. A variância do intercepto aleatório foi estimada em 0,896, um valor estatisticamente significativo que demonstra que uma parcela substancial da variabilidade na abstenção não pode ser explicada apenas pelas características individuais. Este resultado confirma que o contexto – a combinação do tipo de escola e da região geográfica – desempenha um papel crucial. Assim, dois estudantes com perfis individuais idênticos terão probabilidades diferentes de se ausentar do ENEM dependendo da escola que frequentaram e da região onde realizam a prova.

Essa constatação está em linha com a literatura que enfatiza a importância dos fatores institucionais e regionais (Andrade e Laros, 2007). A análise dos efeitos aleatórios revelou que o grupo de candidatos de escolas públicas na região Centro-Oeste apresenta a maior probabilidade basal de abstenção, com uma chance estimada em 36% apenas com base no intercepto do modelo. Este achado aponta para uma confluência de desvantagens estruturais naquela região para estudantes da rede pública.

A relevância dos fatores contextuais, também destacada por Melo et al. (2021), reforça a necessidade de se adotar modelos hierárquicos em análises educacionais. A abordagem multinível permitiu quantificar a magnitude das desigualdades estruturais, concluindo que o contexto importa tanto quanto as características individuais. Isso tem implicações diretas para políticas públicas, sugerindo que intervenções focadas apenas no indivíduo são insuficientes se não forem acompanhadas de ações que abordem as desigualdades entre escolas e regiões.

A análise integrada dos resultados evidencia que a abstenção no ENEM é um sintoma de barreiras sistêmicas. A decisão de não comparecer é, em muitos casos, uma consequência de desvantagens acumuladas. O perfil do candidato com maior risco de ausência – homem, mais velho, com renda nos extremos, sem acesso à internet e inserido em um contexto regional e escolar desfavorável – retrata uma vulnerabilidade multidimensional. O modelo multinível foi fundamental para desvendar essas camadas de influência, oferecendo um diagnóstico mais completo do que modelos que não consideram a estrutura hierárquica dos dados.

Em suma, os resultados atestam que a abstenção no ENEM é motivada por fatores socioeconômicos que operam no nível individual e contextual. A regressão logística binária multinível mostrou-se essencial para um entendimento mais vigoroso da problemática. As implicações práticas indicam que políticas públicas eficazes devem ser multifacetadas. É necessário desenvolver ações de suporte logístico e financeiro a grupos de risco, como homens, estudantes mais velhos e vulneráveis economicamente. É imperativo combinar políticas educacionais com iniciativas de inclusão digital. A variação regional acentuada, especialmente a alta propensão à abstenção entre estudantes de escolas públicas do Centro-Oeste, exige intervenções territorializadas, como a ampliação de locais de prova, garantia de transporte e campanhas de comunicação focadas. Sugere-se que o INEP desenvolva sistemas preditivos para identificar, na inscrição, candidatos com alto risco de abstenção, permitindo um apoio proativo para mitigar as barreiras.

Conclui-se que o objetivo foi atingido: demonstrou-se que a abstenção no ENEM é um fenômeno multifacetado, significativamente influenciado tanto por fatores socioeconômicos individuais quanto por desigualdades estruturais e regionais, que foram quantificadas através da modelagem multinível. A pesquisa fornece evidências robustas que podem orientar a criação de políticas públicas mais equitativas e eficazes, visando garantir que o exame seja, de fato, uma porta de entrada para o ensino superior para todos os brasileiros, independentemente de sua origem social ou geográfica.

Referências:
Alves, M. T. G.; Soares, J. F.; Xavier, F. P.; 2016. Desigualdades educacionais do ensino fundamental de 2005 a 2013: hiato entre grupos sociais. Revista Brasileira de Sociologia 4(7): 49-81.
Andrade, J. M; Laros, J. A. 2007. Fatores associados ao Desempenho Escolar: Estudo Multinível com Dados do SAEB/2001. Psicologia: Teoria e Pesquisa 23(1): 33-42.
Araújo, V. D; Glotz, R. E. 2009. O letramento digital enquanto instrumento de inclusão social e democratização do conhecimento: desafios atuais. Revista Paidéi@ -Revista Científica de Educação e Distância 2 (1).
Bacha, S. M. C; Brandão, C. C. R. D.; Sauer, L.; Bednaski, A. V; Camparoto, M. Y; 2006. Rendimento escolar de alunos da área rural em escola urbana. Revista CEFAC 8(4): 429-440.
Burnham, K.; Anderson D. 2004. Multimodel Inference – Understading AIC and BIC in Model Selection. SOCIOLOGICAL METHODS & RESEARCH 33 (2): 261-304.
Fávero, L. P.; Belfiore, P. 2017. Manual de análise de dados: estatística e modelagem multivariada com Excel®, SPSS® e Stata®. 1ed. LTC, Rio de Janeiro, RJ, Brasil.
Gelman, A.; Hill, J. 2007. Data analysis using regression and multilevel/hierarchical models. 1ed. Cambridge University Press, New York, United States of America.
Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira [INEP]. 2024. Microdados do Enem. Disponível em: https://www. gov. br/inep/pt-br/acesso-a-informacao/dados-abertos/microdados/enem . Acesso em: 6 fev. 2024.
Jaloto, A. ; Primi, R. 2021. Fatores socioeconômicos associados ao desempenho no Enem. Em Aberto 34(112): 125-141.
Luke, D. A. 2020. Multilevel Modeling. 2 ed. SAGE Publications Inc., London, United Kingdom.
Mariano, F. Z; Silva, M. C; Santos, M. M; Benevides, A. A. 2023. Desigualdade de desempenho no ensino médio: evidências sobre a educação de jovens e adultos. Nova Economia 33 (3): 719-747.
Melo, R. O; Freitas, A. C; Francisco, E. R; Motokane, M. T. 2021. Impacto das variáveis socioeconômicas no desempenho do Enem: uma análise espacial e sociológica. Revista de administração pública 55(6) 1271-1294.
Mont’Alvão Neto, A. L . 2014. Tendências das desigualdades de acesso ao ensino superior no Brasil: 1982-2010. Educação & Sociedade 35(127): 417-441.
Peres, R. T; Campos, L. B. A; Moraes, C. P. 2025. Considerações acerca dos impactos da renda familiar e da escolaridade materna no desempenho em Matemática no ENEM 2022. Revista Educação e Políticas em Debate 14(2): 1-15.
Puente-Palacios, K.; Laros, J. A. 2009. Análise multinível: contribuições para estudos sobre efeito do contexto social no comportamento individual. Estudos de psicologia 26 (3): 349-361.
Raudenbush, S. W.; Bryk A. S. 2002. Hierarchical Linear Models: Applications and Data Analysis Methods. 2 ed. SAGE Publications Inc.
Souza Junior, V. F. 2021. Uma breve história do Exame Nacional do Ensino Médio – ENEM: Avanços e ranços até a era digital. Brazilian Journal of Development 7(12) : 683-694.

Resumo executivo oriundo de Trabalho de Conclusão de Curso de Especialização em Data Science e Analytics do MBA USP/Esalq

Saiba mais sobre o curso; clique aqui:

Quem editou este artigo

Você também pode gostar

Quer ficar por dentro das nossas últimas publicações? Inscreva-se em nossa newsletter!

Receba conteúdos e fique sempre atualizado sobre as novidades em gestão, liderança e carreira com a Revista E&S.

Ao preencher o formulário você está ciente de que podemos enviar comunicações e conteúdos da Revista E&S. Confira nossa Política de Privacidade