Imagem Determinantes da pobreza extrema no Brasil (1990–2022): uma análise correlacional para políticas públicas

19 de fevereiro de 2026

Determinantes da pobreza extrema no Brasil (1990–2022): uma análise correlacional para políticas públicas

Ricardo Lima Cintra; Igor Pinheiro de Araújo Costa

Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.

Este estudo investiga a relação entre variáveis econômicas e sociais e a pobreza extrema no Brasil, definida como a população vivendo com menos de US$ 3 por dia (PPC 2021), no período de 1990 a 2022. O foco é gerar resultados para a formulação de políticas públicas através de uma abordagem associativa, empregando modelos lineares com verificação de pressupostos e testes de robustez para garantir a validade estatística. O trabalho utiliza dados públicos harmonizados e procedimentos transparentes, alinhado às práticas de políticas informadas por evidências, buscando fornecer um painel coeso para a tomada de decisão governamental sem estabelecer inferências de causalidade estrita. A pesquisa combina dados padronizados com um protocolo empírico explícito, orientado para a clareza interpretativa e a parcimônia metodológica.

A investigação se estrutura em torno de três questões: 1) identificar os fatores associados às variações anuais da pobreza extrema no Brasil entre 1990 e 2022 para apoiar o desenho de políticas nacionais; 2) avaliar o papel específico da renda média, desigualdade, consumo de energia per capita, mortalidade infantil, produtividade agrícola e abertura comercial na variação da pobreza, verificando as associações marginais controladas conforme procedimentos econométricos padrão (Wooldridge, 2016); e 3) identificar quais variáveis apresentam sinais e magnitudes mais consistentes para direcionar prioridades de política pública em áreas como crescimento, redistribuição, infraestrutura, saúde e produtividade.

O arcabouço conceitual baseia-se na inter-relação entre crescimento, desigualdade e pobreza, conhecida como o “triângulo crescimento-desigualdade-pobreza” (Bourguignon, 2003). Segundo essa teoria, os efeitos do crescimento na redução da pobreza dependem do perfil distributivo da sociedade. Uma maior desigualdade pode atenuar os benefícios do crescimento para os mais pobres (Ravallion, 2012). A linha de pobreza utilizada, de US$ 3 por dia em Poder de Paridade de Compra (PPC) de 2021, é uma atualização do Banco Mundial que melhora a comparabilidade internacional.

Com base nesse referencial, o estudo formulou cinco hipóteses. A primeira (H1) postula uma associação negativa entre o logaritmo do PIB per capita real e a pobreza extrema. A segunda (H2) espera que um maior índice de Gini esteja associado a uma maior taxa de pobreza. A terceira (H3) prevê uma relação negativa entre o consumo de energia per capita (proxy para infraestrutura) e a pobreza. A quarta (H4) antecipa que uma menor taxa de mortalidade infantil se associará negativamente à pobreza, servindo como indicador de melhores condições de vida. A quinta (H5) propõe que uma maior produtividade agrícola se associe negativamente à pobreza, devido aos seus impactos na renda rural e segurança alimentar.

A contribuição deste trabalho é fornecer um diagnóstico de longo prazo, baseado em uma série histórica harmonizada de 1990 a 2022, que identifique as relações mais estáveis entre a pobreza extrema e seus determinantes estruturais, oferecendo subsídio para a priorização de intervenções governamentais. O estudo se compromete com a transparência e a reprodutibilidade, documentando fontes de dados, transformações de variáveis e diagnósticos estatísticos, reforçando os padrões de formulação de políticas informadas por evidências.

A metodologia é um estudo correlacional com série temporal anual para o Brasil (1990-2022, n=33). A técnica principal é a regressão linear múltipla por Mínimos Quadrados Ordinários (OLS), com erros-padrão robustos à heterocedasticidade e autocorrelação (HAC) conforme Newey e West (1987), uma prática recomendada para dados em série temporal (Wooldridge, 2016). O banco de dados foi construído a partir de séries da plataforma “Our World in Data” (OWID), cuja fonte primária é o “World Bank Open Data” (World Bank, 2023). A unidade de análise é o país-ano, e cada observação foi incluída apenas se houvesse registros simultâneos para todas as variáveis do modelo, evitando o uso de imputação de dados.

A variável dependente (DV) é a povertysharebelow3ppp, a participação percentual da população vivendo com menos de US$ 3 por dia (PPC 2021). As variáveis explicativas (IVs) são: renda média, operacionalizada como o logaritmo natural do PIB per capita em dólares constantes de 2015 (lngdppcconst2015usd); infraestrutura, medida pelo logaritmo natural do consumo de energia primária per capita em kWh (lnenergypckwh); condições de saúde, representadas pela taxa de mortalidade de menores de 5 anos por mil nascidos vivos (childmortalityu5per1000); produtividade agrícola, mensurada pela produção de cereais em toneladas por hectare (cerealyieldtha); abertura comercial, definida como a soma de exportações e importações como percentual do PIB (tradegdppct); e desigualdade de renda, medida pelo índice de Gini (escala 0-100, giniindex_100). A aplicação do logaritmo em renda e energia permite a interpretação dos coeficientes como semielasticidades.

O modelo de regressão base foi especificado como: Pobreza𝑡 = 𝛽0 + 𝛽1ln(PIBpc𝑡) + 𝛽2ln(Energia𝑡) + 𝛽3MortInf𝑡 + 𝛽4Yields𝑡 + 𝛽5Trade𝑡 + 𝛽6Gini𝑡 + 𝜀𝑡. Para assegurar a validade, foram conduzidos exercícios de robustez, incluindo a substituição de variáveis colineares (energia por emissões de CO₂ per capita), a introdução de defasagens temporais (t-1) e a reestimação dos modelos com diferentes especificações. A colinearidade foi avaliada pela matriz de correlação e pelo Fator de Inflação da Variância (VIF), adotando-se a regra de VIF > 10 como indicativo de colinearidade severa para motivar ajustes de parcimônia nos modelos (Belsley et al., 1980).

A análise descritiva dos dados revelou variações significativas. A taxa de pobreza extrema apresentou média de 14,01%, variando de um máximo de 30,34% no início do período para um mínimo de 2,77% em meados da década de 2010. A mortalidade infantil caiu de um pico de 52 para um mínimo de 12,60 por mil nascidos vivos. A matriz de correlação de Pearson confirmou as associações esperadas: a pobreza extrema apresentou correlações negativas fortes com o PIB per capita (-0.961), o consumo de energia (-0.975) e a produtividade agrícola (-0.925), e correlação positiva forte com a mortalidade infantil (0.978) e o índice de Gini (0.840). A abertura comercial mostrou correlação negativa moderada (-0.696). As explorações bivariadas reforçaram esses padrões, confirmando a relevância das variáveis e a necessidade de um modelo multivariado para controlar os efeitos simultâneos.

A estimação do modelo OLS base, com todas as seis variáveis e erros-padrão HAC, resultou em um ajuste geral alto (R² = 0,980; R² ajustado = 0,975) e uma estatística F significativa (F=313,7; p<0,001). A análise dos coeficientes individuais revelou que a mortalidade infantil foi o preditor mais robusto, com um coeficiente positivo e estatisticamente significativo (coef = 0.461; p=0.001), indicando que um aumento de uma unidade na taxa de mortalidade infantil está associado a um aumento de 0,46 ponto percentual na pobreza. A abertura comercial também foi significativa (p=0.046), mas com um sinal positivo inesperado (coef = 0.1241).

O coeficiente para a renda média (log do PIB per capita) apresentou o sinal negativo esperado (coef = -12.1565), consistente com a H1, mas com significância estatística marginal (p=0.085). A interpretação sugere que um aumento de 1% no PIB per capita está associado a uma redução de 0,12 ponto percentual na pobreza. As variáveis de consumo de energia, produtividade agrícola e índice de Gini não foram estatisticamente significativas no modelo completo, um forte indicativo do impacto da multicolinearidade, que inflaciona os erros-padrão (Belsley et al., 1980).

Os diagnósticos do modelo confirmaram essa suspeita. O Fator de Inflação da Variância (VIF) revelou multicolinearidade alta, com valores de 58.2 para energia, 30.8 para PIB per capita, 19.8 para mortalidade infantil e 12.3 para produtividade agrícola, todos acima do limiar de 10. Apenas abertura comercial (VIF=3.1) e Gini (VIF=4.8) estavam em níveis aceitáveis. Testes de heterocedasticidade (Breusch-Pagan, White) e autocorrelação (Durbin-Watson, Breusch-Godfrey) não indicaram problemas, validando o uso de erros-padrão HAC como medida de precaução. A análise de resíduos identificou duas observações potencialmente influentes, reforçando a necessidade de checagens de sensibilidade.

Para lidar com a multicolinearidade, foram estimados modelos mais parcimoniosos. A comparação com base nos critérios de informação de Akaike (AIC) e Bayesiano (BIC) indicou que a especificação que excluía a variável de consumo de energia era a mais equilibrada. Nesses modelos, a estabilidade dos sinais dos coeficientes foi confirmada: a renda manteve seu efeito negativo, a mortalidade infantil permaneceu positiva e significativa, e a produtividade agrícola apresentou um efeito negativo consistente, embora nem sempre significativo. O sinal do índice de Gini permaneceu positivo, mas sua significância foi sensível à especificação, enquanto a abertura comercial manteve seu coeficiente positivo.

Os exercícios de robustez adicionais fortaleceram os achados. A substituição do consumo de energia por emissões de CO₂ per capita não alterou os resultados. A introdução de defasagens de um ano para renda, energia e produtividade também não modificou os sinais dos coeficientes. A exclusão dos anos da pandemia (2020-2021) resultou em uma melhora no ajuste, mas manteve a direção e a significância dos principais preditores, confirmando que os resultados não são impulsionados apenas por esses anos.

A discussão dos resultados à luz das hipóteses consolida as conclusões. A hipótese H1 (crescimento) foi confirmada, com o PIB per capita se associando negativamente à pobreza. A hipótese H4 (saúde) recebeu o suporte mais forte, com a mortalidade infantil emergindo como o preditor mais robusto. A hipótese H5 (produtividade agrícola) também encontrou suporte, com a produtividade de cereais se relacionando negativamente com a pobreza, embora com menor significância. Em contrapartida, a hipótese H2 (desigualdade) não foi consistentemente validada; o índice de Gini manteve o sinal positivo esperado, mas sua falta de significância estável impede conclusões firmes sobre seu efeito marginal. A hipótese H3 (infraestrutura/energia) não pôde ser validada de forma isolada devido à sua colinearidade com a renda.

Em conclusão, a análise econométrica dos determinantes da pobreza extrema no Brasil entre 1990 e 2022 revela que o crescimento econômico, a melhoria nas condições de saúde infantil e o aumento da produtividade agrícola emergiram como os elementos mais consistentemente relacionados à redução da pobreza. Embora a desigualdade de renda e a abertura comercial tenham apresentado associações menos estáveis, os resultados principais se mostraram resilientes a diferentes especificações. A principal limitação econométrica foi a multicolinearidade estrutural entre variáveis-chave, que foi mitigada por meio de modelos parcimoniosos e diagnósticos rigorosos. Do ponto de vista das políticas públicas, os achados sugerem que estratégias eficazes devem integrar, de forma sinérgica, políticas que promovam o crescimento econômico inclusivo, investimentos contínuos em saúde básica, especialmente materno-infantil, e iniciativas que visem o aumento da produtividade do setor agrícola. Conclui-se que o objetivo foi atingido.

Referências:
Belsley, D. A.; Kuh, E.; Welsch, R. E. 1980. Regression diagnostics: identifying influential data and sources of collinearity. New York: John Wiley & Sons.
Bourguignon, F. 2003. The growth–inequality–poverty triangle. New Delhi: Indian Council for Research on International Economic Relations (ICRIER).
Breusch, T. S.; Godfrey, L. G. 1978. Testing for autocorrelation in dynamic linear models. Australian Economic Papers 17(31): 334-355.
Breusch, T. S.; Pagan, A. R. 1979. A simple test for heteroscedasticity and random coefficient variation. Econometrica 47(5): 1287-1294.
Durbin, J.; Watson, G. S. 1950. Testing for serial correlation in least squares regression. Biometrika 37(3-4): 409-428.
Manski, C. F. 2013. Public policy in an uncertain world. Cambridge, MA: Harvard University Press.
Newey, W. K.; West, K. D. 1987. A simple, positive semi-definite, heteroskedasticity and autocorrelation consistent covariance matrix. Econometrica 55(3): 703-708.
Our World in Data (OWID). 2023. Data on poverty, inequality, health and agriculture. Disponível em: https://ourworldindata. org/. Acesso em: 07 set. 2025.
Ravallion, M. 2012. Poor, or just feeling poor? On using subjective data in measuring poverty. Policy Research Working Paper 5968. Washington, DC: World Bank.
White, H. 1980. A heteroskedasticity-consistent covariance matrix estimator and a direct test for heteroskedasticity. Econometrica 48(4): 817-838.
Wooldridge, J. M. 2016. Introductory econometrics: a modern approach. 6 ed. Boston: Cengage Learning.
World Bank. 2023. World development indicators. Disponível em: https://databank. worldbank. org/source/world-development-indicators. Acesso em: 07 set. 2025.

Resumo executivo oriundo de Trabalho de Conclusão de Curso de Especialização em Data Science e Analytics do MBA USP/Esalq

Saiba mais sobre o curso; clique aqui:

Quem editou este artigo

Você também pode gostar

Quer ficar por dentro das nossas últimas publicações? Inscreva-se em nossa newsletter!

Receba conteúdos e fique sempre atualizado sobre as novidades em gestão, liderança e carreira com a Revista E&S.

Ao preencher o formulário você está ciente de que podemos enviar comunicações e conteúdos da Revista E&S. Confira nossa Política de Privacidade