Imagem Previsão de Despesas Públicas com Requisições de Pequeno Valor via Séries Temporais

26 de fevereiro de 2026

Previsão de Despesas Públicas com Requisições de Pequeno Valor via Séries Temporais

João Paulo Nunes; José Guilherme Martins Dos Santos

Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.

Este trabalho aprimora o processo de previsão anual de despesas com requisições de pequeno valor (RPVs) pagas pela Justiça Federal, utilizando modelos de séries temporais para identificar os que melhor se ajustam às diferentes classificações orçamentárias. O objetivo é fornecer uma base mais acurada para a alocação de recursos na Lei Orçamentária Anual (LOA). Previsões precisas são necessárias devido ao pagamento mandatório das RPVs em até 60 dias, conforme o artigo 100, §3º, da Constituição Federal (Brasil, 1988). Essa exigência representa um desafio ao planejamento orçamentário da União, que opera sob a Lei de Responsabilidade Fiscal (Lei Complementar nº 101/2000) e frequentemente necessita de créditos adicionais para cobrir despesas variáveis e de difícil antecipação.

A pesquisa se insere nas atribuições do Conselho da Justiça Federal (CJF), órgão responsável pela supervisão administrativa e orçamentária da Justiça Federal. O CJF supervisiona os pagamentos de sentenças judiciais, que em 2023 totalizaram R$ 138,5 bilhões, beneficiando mais de 2,8 milhões de pessoas (CJFa, 2023). As RPVs, com teto de 60 salários-mínimos (Brasil, 2001), constituem uma parcela substancial e volátil desse montante, cuja imprevisibilidade torna a estimação orçamentária complexa. A análise de dados, conforme defendem Fávero e Belfiore (2017), é a abordagem mais eficiente para a predição e um pilar para a tomada de decisão baseada em evidências.

A análise de séries temporais, definida por Nielsen (2020) como a extração de informações de observações ordenadas cronologicamente, permite modelar padrões subjacentes como tendência e sazonalidade. A decomposição da série em seus componentes — tendência (direção geral), sazonalidade (padrões repetitivos) e resíduos (variações não explicadas) — é fundamental para a compreensão da dinâmica dos dados (Oliveira et al., 2024). Este estudo avalia a aplicabilidade de modelos estatísticos tradicionais para gerar previsões anuais (12 meses) que possam subsidiar o ciclo orçamentário federal.

A investigação compara o desempenho dos modelos Autorregressivo Integrado de Médias Móveis Sazonal (SARIMA) e de suavização exponencial de Holt-Winters. A escolha se justifica por sua capacidade de lidar com tendência e sazonalidade, características presentes nos dados. O modelo SARIMA é reconhecido por sua flexibilidade em capturar a influência temporal de pontos adjacentes (Nielsen, 2020), enquanto o Holt-Winters é eficaz quando tendência e sazonalidade são componentes explícitos, modelados de forma aditiva ou multiplicativa (Oliveira et al., 2024).

A avaliação comparativa dos modelos foi conduzida com métricas de erro e testes estatísticos. O Erro Percentual Absoluto Médio (MAPE) foi a principal métrica para quantificar a precisão, enquanto o Teste de Ljung-Box foi utilizado para verificar a ausência de autocorrelação nos resíduos, um indicativo crucial de que o modelo capturou adequadamente a estrutura temporal dos dados. A pesquisa visa identificar o modelo mais aderente para cada categoria de despesa e discutir limitações e caminhos para trabalhos futuros, como a exploração de modelos mais complexos (Aggarwal, 2018; De Angelo et al., 2011; Brownlee, 2020).

Este é um estudo de caso quantitativo focado nas despesas federais com RPVs. Os dados primários, de janeiro de 2020 a dezembro de 2024, foram extraídos da plataforma Siga Brasil, mantida pelo Senado Federal. Utilizando a funcionalidade “Gráficos Customizados”, foi construída uma tabela com valores mensais pagos, segregados pela ação orçamentária (código 0625), unidade orçamentária, grupo de despesa e unidade gestora. Os dados brutos, em formato XLSX, foram tratados e analisados com scripts desenvolvidos na linguagem de programação Python.

A metodologia iniciou com a decomposição aditiva das séries temporais de cada categoria para identificar visualmente tendência, sazonalidade e resíduos (Oliveira et al., 2024). A estacionariedade, premissa para muitos modelos, foi verificada com o Teste Aumentado de Dickey-Fuller, que avalia a hipótese de raiz unitária (Nielsen, 2020). Séries não estacionárias foram tratadas com diferenciação para estabilizar suas propriedades estatísticas. Foram aplicados e comparados dois modelos. O primeiro, SARIMA (p, d, q)(P, D, Q)s, teve seus parâmetros ótimos selecionados pela função auto_arima. O segundo, suavização exponencial de Holt-Winters, foi testado em suas variantes aditiva e multiplicativa, esta última apropriada quando a amplitude da sazonalidade varia com o nível da série (Oliveira et al., 2024).

A seleção do modelo mais adequado para cada categoria foi baseada em um processo de duas etapas. Primeiramente, calculou-se o Erro Percentual Absoluto Médio (MAPE) para medir a acurácia. Em segundo lugar, aplicou-se o Teste de Ljung-Box aos resíduos para garantir a ausência de autocorrelação (ruído branco), validando estatisticamente o modelo. Um p-valor superior a 0,05 no teste indica que o modelo capturou com sucesso a estrutura temporal dos dados (Nielsen, 2020). Foi escolhido o modelo que combinava baixo MAPE com resíduos estatisticamente robustos.

A análise dos dados exigiu a segmentação da série temporal em seis subconjuntos, correspondentes às principais classificações orçamentárias: FRGPS (Fundo do Regime Geral de Previdência Social), FNAS (Fundo Nacional de Assistência Social), FAT (Fundo de Amparo ao Trabalhador), Pessoal (despesas com servidores), Custeio (demais despesas correntes) e Desapropriações. Cada categoria demonstrou comportamentos únicos. A categoria FRGPS apresentou a maior média e desvio padrão, refletindo seu volume e variabilidade, enquanto Desapropriações mostrou valores menores, mas com comportamento mais errático. A extração de informações resumidas é um passo essencial para diagnosticar comportamentos e fundamentar previsões (Nielsen, 2020).

A análise gráfica confirmou as distintas dinâmicas. A série FRGPS (benefícios previdenciários) exibiu tendência de crescimento consistente. A série FNAS (benefícios assistenciais) mostrou crescimento acentuado a partir de 2021. As categorias Pessoal e Custeio apresentaram maior constância com picos sazonais. Em contraste, a série de Desapropriações demonstrou um comportamento errático, sem tendência ou sazonalidade claras. A decomposição das séries revelou, para a maioria, uma sazonalidade bem definida, com quedas no início do ano (reflexo do recesso judiciário) e picos em abril e julho, possivelmente associados a prazos processuais e à cultura organizacional (Brasil, 1988; CJFb, 2023).

Os testes de estacionariedade confirmaram as observações visuais. O Teste de Dickey-Fuller indicou que as séries FRGPS, FNAS, Pessoal e Custeio eram não estacionárias (p-valor > 0,05), exigindo diferenciação. As séries FAT e Desapropriações foram consideradas estacionárias. Após a divisão dos dados em treino (80%) e teste (20%), a função auto_arima determinou os parâmetros ótimos para o modelo SARIMA em cada série, identificando componentes sazonais para todas, exceto FAT. A análise dos resíduos do modelo SARIMA, via Teste de Ljung-Box, revelou um problema crítico: para as séries FRGPS, Pessoal e Custeio, os p-valores foram baixos, indicando a presença de autocorrelação nos resíduos. Isso significava que o modelo SARIMA não conseguiu capturar toda a estrutura temporal dessas séries, comprometendo sua confiabilidade.

Diante da inadequação do SARIMA para três categorias, foram avaliados os modelos de suavização exponencial de Holt-Winters (aditivo e multiplicativo). A comparação de desempenho foi decisiva. Para as séries FRGPS e Custeio, o modelo Holt-Winters Multiplicativo não apenas apresentou um MAPE inferior ao do SARIMA, mas também passou no teste de Ljung-Box. Para a série Pessoal, embora o MAPE do Holt-Winters Multiplicativo (14,43%) fosse ligeiramente superior ao do SARIMA (11,59%), sua superioridade estatística, com um p-valor satisfatório no teste de Ljung-Box (0, 1329), justificou sua escolha, priorizando a robustez do modelo. Para as séries FNAS e FAT, o modelo SARIMA original demonstrou ser o mais adequado, com o menor MAPE e resíduos bem-comportados.

A análise da série de Desapropriações revelou uma limitação dos modelos. O modelo Holt-Winters Multiplicativo apresentou o menor MAPE entre os testados (581,85%), mas o valor extremamente elevado indica uma completa falta de aderência. Este resultado corrobora a análise de que o comportamento errático e a ausência de padrões nesta série a tornam de difícil previsão por modelos univariados. A natureza dessa despesa, influenciada por eventos únicos, sugere a necessidade de abordagens distintas, como a incorporação de variáveis exógenas.

A consolidação dos melhores modelos resultou em um mix de abordagens: Holt-Winters Multiplicativo para FRGPS, Pessoal e Custeio, e SARIMA para FNAS e FAT. O MAPE médio ponderado das previsões, desconsiderando a série de Desapropriações, situou-se em 13,25%, um resultado satisfatório dada a complexidade das séries. As previsões geradas para os 12 meses subsequentes (exercício de 2025) demonstraram alinhamento com os padrões históricos de tendência e sazonalidade para a maioria das séries, fornecendo uma projeção quantitativa para o planejamento orçamentário.

A previsão para a série FAT, contudo, resultou em uma linha constante, o que pode indicar uma limitação do modelo ARIMA (0,1,1) ajustado para uma série com poucas observações. No entanto, a baixa materialidade dessa despesa (0,23% do total em 2024) minimiza o impacto prático dessa limitação. A pesquisa evidencia que uma abordagem segmentada e a seleção de modelos com base em diagnósticos estatísticos rigorosos são essenciais para aprimorar a acurácia das previsões de despesas públicas complexas.

O estudo demonstrou a viabilidade e os benefícios da aplicação de modelos de séries temporais para a previsão de despesas com RPVs. A principal contribuição prática é um framework metodológico que permite segmentar a despesa, avaliar diferentes modelos e selecionar a abordagem mais robusta para cada componente, resultando em uma previsão agregada mais confiável. Os resultados indicam que, para a maioria das categorias, os modelos SARIMA e Holt-Winters são capazes de capturar os padrões de tendência e sazonalidade, gerando previsões com um nível de erro aceitável. A identificação de uma série com comportamento errático (Desapropriações) também é um resultado valioso, pois sinaliza a necessidade de abordagens alternativas.

Apesar do êxito, o trabalho reconhece limitações, como a ausência de variáveis exógenas. A inclusão de fatores como tipo de ação judicial, localização geográfica ou mudanças legislativas poderia enriquecer os modelos. Pesquisas futuras poderiam explorar modelos avançados como redes neurais recorrentes (Skansi, 2018), modelos multivariados (VAR/VARMAX) ou o Prophet da Meta, que lida com múltiplas sazonalidades. Conclui-se que o objetivo foi atingido: demonstrou-se que a aplicação de um mix de modelos de séries temporais, selecionados com base em métricas de erro e diagnósticos de resíduos, aprimora o processo de previsão anual das despesas com RPVs, fornecendo uma ferramenta mais consistente para a gestão orçamentária federal.

Referências:
Aggarwal, C. 2018. Neural Networks and Deep Learning: A Textbook. Springer, Cham, Switzerland.
Brasil. 1988. Constituição da República Federativa do Brasil.
Brasil. 2001. Lei nº 10.259, de 12 de julho de 2001. Dispõe sobre a instituição dos Juizados Especiais Cíveis e Criminais no âmbito da Justiça Federal. Diário Oficial da União, Brasília, 13 jul. 2001. Seção 1, p. 1.
Brownlee, Jason. 2020. Time Series Forecasting with Prophet in Python. Disponível em: <https://machinelearningmastery. com/time-series-forecasting-with-prophet-in-python/>.
Conselho da Justiça Federal [CJF]a. 2023. RelatorioGestão2024. pdf. Disponível em: <https://www. cjf. jus. br/cjf/transparencia-publica-1/informacoes-gerenciais-e-de-planejamento/relatorios-de-gestao-1/relatorios-de-gestao/relatorio-de-gestao-2023/@@download/arquivo>.
Conselho da Justiça Federal [CJF]b. 2023. Res 822-2023. pdf. Dispõe sobre os procedimentos relativos à expedição de ofícios requisitórios e ao cumprimento da ordem cronológica dos pagamentos de obrigações de pagar quantia certa pela Fazenda Pública no âmbito da Justiça Federal de primeiro e segundo graus. Diário Oficial da União, Brasília, 09 nov. 2023. Seção 1, p. 43-45.
De Angelo, C. F.; Zwicker, R.; Fouto, N. M. M. D.; Luppe, M. R. 2011. Séries temporais e redes neurais: uma análise comparativa de técnicas na previsão de vendas do varejo brasileiro. REAd – Revista Eletrônica de Administração (Vitória) 8(2): 01-21.
Fávero, Luiz Paulo; Belfiore, Patrícia. 2017. Manual de análise de dados. Elsevier, Rio de Janeiro, RJ, Brasil.
Nielsen, A. 2020. Practical Time Series Analysis: Prediction with Statistics and Machine Learning. O’Reilly Media, Sebastopol, CA, USA.
Oliveira, Rogério de; Albarracin, Orlando Yesid Esparza; Silva, Gustavo Rocha da. 2024. Introdução às séries temporais: uma abordagem prática em Python. São Paulo: Editora Mackenzie. Disponível em: <https://github. com/Introducao-Series-Temporais-em-Python/Book>.
Skansi, Sandro. 2018. Introduction to Deep Learning: from logical calculus to artificial intelligence. Springer, Cham, Switzerland.

Resumo executivo oriundo de Trabalho de Conclusão de Curso de Especialização em Data Science e Analytics do MBA USP/Esalq

Saiba mais sobre o curso; clique aqui:

Quem editou este artigo

Você também pode gostar

Quer ficar por dentro das nossas últimas publicações? Inscreva-se em nossa newsletter!

Receba conteúdos e fique sempre atualizado sobre as novidades em gestão, liderança e carreira com a Revista E&S.

Ao preencher o formulário você está ciente de que podemos enviar comunicações e conteúdos da Revista E&S. Confira nossa Política de Privacidade