Imagem Predição da demanda por engenheiros de produção com redes neurais LSTM

04 de fevereiro de 2026

Predição da demanda por engenheiros de produção com redes neurais LSTM

Carlos Henrique Blanco de Oliveira; Lauro Marques Vicari

Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.

O objetivo desta pesquisa foi desenvolver e otimizar um modelo preditivo para a demanda por engenheiros de produção no Brasil, identificando a configuração de rede neural Long Short-Term Memory (LSTM) com a melhor capacidade preditiva. O estudo determinou, por meio de um processo experimental, os hiperparâmetros e técnicas de pré-processamento mais eficazes para prever o saldo líquido de admissões e demissões de profissionais do Código Brasileiro de Ocupações (CBO) 2149. Utilizou-se como variáveis preditoras o Produto Interno Bruto (PIB) e a taxa Selic. O desempenho do modelo foi avaliado sistematicamente com as métricas Erro Quadrático Médio (MSE), Erro Absoluto Médio (MAE) e o coeficiente de determinação (R²), para validar sua robustez em um mercado de trabalho dinâmico.

Nas últimas décadas, transformações globais aumentaram a demanda por profissionais de ciência, tecnologia, engenharia e matemática (STEM), essenciais para a inovação e produtividade. Existe uma correlação documentada entre a participação de profissionais de tecnologia na força de trabalho e o desempenho econômico de um país. Segundo Lins et al. (2014), nações com maior Produto Interno Bruto (PIB) per capita tendem a ter uma maior participação percentual de carreiras tecnológicas no total de ocupados, reforçando a importância de investir nesses talentos.

Dentro das carreiras tecnológicas, a engenharia tem papel central. Engenheiros estão ligados ao desenvolvimento e aplicação de novas tecnologias, sendo cruciais para o aumento da produtividade industrial. Souza e Domingues (2014) destacam sua influência em soluções sustentáveis e inovação tecnológica em grandes projetos de investimento, vitais para o crescimento nacional. Portanto, estimar a demanda futura por engenheiros no Brasil é uma tarefa de relevância estratégica para alinhar políticas educacionais às necessidades do mercado, utilizando classificações detalhadas por ocupação, setor e região.

O mercado de trabalho para engenheiros no Brasil, contudo, é complexo. Segundo análise do Dieese (2019), as ocupações de engenharia são fortemente influenciadas por ciclos de crescimento econômico e pela geografia. A sensibilidade aos ciclos econômicos é maior para engenheiros do que para outras ocupações, com oscilações acentuadas em fases de expansão e retração. Geograficamente, há uma concentração de profissionais em regiões com grandes obras e corporações, em detrimento de áreas menos desenvolvidas, o que cria desequilíbrios regionais na oferta e demanda por esses especialistas (Dieese, 2019).

Nesse cenário, técnicas de análise preditiva como aprendizado de máquina são promissoras. Estudos anteriores exploraram essa área, como o de Silva (2021), que modelou a transição entre estados ocupacionais, e o de Nunes e Dos Anjos (2021), que usou ARIMA para analisar o impacto da pandemia de Covid-19 no setor de serviços. O presente estudo avança ao empregar uma arquitetura de rede neural LSTM, mais sofisticada, para capturar dependências temporais complexas e não lineares, buscando testar a eficácia do modelo e auxiliar na elaboração de políticas públicas e no planejamento da formação de mão de obra especializada.

A metodologia baseou-se na coleta e tratamento de séries temporais de fontes oficiais, de janeiro de 2020 a abril de 2025, com frequência mensal. A variável-alvo (Y), demanda líquida por engenheiros de produção, foi construída a partir do saldo de admissões e desligamentos do Cadastro Geral de Empregados e Desempregados (CAGED) para o CBO 2149, processando 64 arquivos mensais que totalizavam aproximadamente 23 GB. As variáveis preditoras foram a taxa Selic, obtida via API do Banco Central, e o Produto Interno Bruto (PIB), com dados trimestrais do Instituto Brasileiro de Geografia e Estatística (IBGE).

Um desafio metodológico foi compatibilizar as frequências das séries. O PIB, originalmente trimestral, foi convertido para frequência mensal por interpolação polinomial de segundo grau, escolhida por proporcionar uma transição mais suave que a linear, representando melhor a evolução contínua da atividade econômica. A variável do PIB foi então transformada em sua variação percentual mensal (MoM) para capturar oscilações de curto prazo, que se presume terem impacto mais imediato nas contratações. Para o treinamento do modelo LSTM, as variáveis preditoras (variação do PIB e Selic) foram padronizadas com a técnica z-score, que, em testes preliminares, apresentou melhor desempenho que a normalização Min-Max.

O núcleo da metodologia foi uma Rede Neural Recorrente (RNN) com arquitetura Long Short-Term Memory (LSTM), escolhida por sua capacidade de modelar dependências de longo prazo em dados sequenciais, superando limitações de RNNs tradicionais como o desvanecimento do gradiente (Géron, 2019). Funções de ativação como a Tangente Hiperbólica (tanh) são cruciais por introduzirem não linearidade. A função tanh, que mapeia saídas para o intervalo [-1, 1] e é centrada na origem, mostrou-se particularmente eficaz neste estudo, especialmente quando combinada com a padronização z-score.

A arquitetura LSTM, proposta por Hochreiter e Schmidhuber (1997), é uma evolução das RNNs projetada para lembrar informações por longos períodos. Isso é alcançado por uma estrutura interna com três mecanismos de controle chamados “portas” (gates): a porta de esquecimento (decide o que descartar), a porta de entrada (seleciona novos dados para armazenar) e a porta de saída (determina a informação a ser propagada). Esse mecanismo permite que a rede aprenda seletivamente quais informações manter, tornando-a poderosa para prever séries temporais complexas como as de dados macroeconômicos e de mercado de trabalho (Aggarwal, 2018). O modelo foi implementado em Python com Keras e TensorFlow, visando minimizar o Erro Quadrático Médio (MSE).

A análise descritiva das variáveis (janeiro de 2020 a abril de 2025) revelou dinâmicas significativas. A variação mensal do PIB mostrou o impacto negativo da pandemia em 2020, seguido de recuperação e estabilização, com média de -0,09% e desvio padrão de 0,66%, indicando volatilidade. A taxa Selic refletiu a política monetária: expansionista em 2020-2021 (mínimas de 2%), seguida por um ciclo de alta agressivo até 2023 (próximo a 11%) para combater a inflação, com média de 6,76% e desvio padrão de 2,22%. A variável-alvo, demanda líquida por engenheiros de produção, variou entre -13 e +144 profissionais mensais, com média de 51, indicando crescimento líquido e aparente sazonalidade com picos no início dos anos. A matriz de correlação inicial, sem defasagem, mostrou correlações fracas: 0,124 entre PIB e demanda, e -0,069 entre Selic e demanda.

O desenvolvimento do modelo LSTM partiu de uma configuração base (uma camada com 20 unidades, ativação ReLU, divisão 70/30 para treino/teste), que resultou em um Erro Quadrático Médio (MSE) de 33.100 no conjunto de teste. Este valor serviu como ponto de partida para a otimização. A primeira rodada de ajustes, combinando a padronização z-score nas entradas com a função de ativação tangente hiperbólica (tanh) nas camadas, reduziu o MSE para 30.825, validando essas escolhas metodológicas.

A otimização mais impactante foi a introdução de um intervalo de tempo (lag) entre as variáveis preditoras e a alvo, reconhecendo que os efeitos macroeconômicos não são instantâneos. A introdução de um lag de um mês nas variáveis PIB e Selic reduziu drasticamente o MSE de 30.825 para 14.343. Testes com lags superiores (2, 3, 4 meses) também melhoraram o desempenho em relação ao modelo sem lag, mas nenhum superou o resultado do lag de um mês. Este achado confirma que o mercado de trabalho para engenheiros de produção responde às variações econômicas com um atraso relativamente curto, e que capturar essa defasagem é determinante para a predição.

A fase final de otimização, após definir o lag ótimo de um mês, focou no ajuste fino de macro-parâmetros, como a semente de aleatoriedade (seed) e a taxa de aprendizado (learning rate). A análise dos resultados mostrou que a configuração com uma semente igual a 3 e uma taxa de aprendizado de 0,00009 produziu o menor erro. Com esses ajustes, o modelo atingiu seu desempenho ótimo, com um MSE final de 13.352,32 e um Erro Absoluto Médio (MAE) de 88,12 no conjunto de teste.

A discussão dos resultados revela um panorama misto. O MSE final de 13.352 representa uma redução de aproximadamente 60% em relação ao modelo inicial (33.100), demonstrando a eficácia dos ajustes metodológicos, especialmente a introdução do lag temporal, o que corrobora as observações de Géron (2019) sobre o potencial da arquitetura LSTM. Contudo, o MAE de 88,12 indica que, em média, as previsões do modelo desviam-se em cerca de 88 profissionais por mês dos valores reais, um erro de magnitude considerável, apontando limitações na precisão.

O resultado mais preocupante foi o coeficiente de determinação (R²) de -0,7454. Um R² negativo indica que o desempenho do modelo é inferior ao de um modelo que simplesmente prevê a média histórica da variável-alvo. Isso sugere que, apesar da significativa redução do MSE, o modelo final não explica adequadamente a variabilidade na demanda por engenheiros. Essa limitação pode ser atribuída à complexidade do mercado de trabalho, influenciado por múltiplos fatores econômicos, geográficos e setoriais não capturados pelas duas variáveis preditoras utilizadas, conforme apontado pelo Dieese (2019). Ainda assim, a eficácia do lag de um mês permanece como um insight valioso sobre a resposta rápida deste mercado a estímulos macroeconômicos.

Em suma, este estudo buscou prever a demanda por engenheiros de produção no Brasil com redes LSTM. Embora a capacidade preditiva final, avaliada pelo R² negativo, tenha sido limitada, o trabalho oferece contribuições metodológicas importantes. A demonstração de que um lag temporal de um mês, combinado com padronização z-score e ativação tangente hiperbólica, pode reduzir o erro de previsão em mais de 60% é um resultado significativo. Uma limitação central foi o uso de apenas duas variáveis preditoras (PIB e Selic) para um fenômeno multifacetado. Fatores como investimento em infraestrutura e indicadores setoriais, como sugerido por Souza e Domingues (2014), poderiam enriquecer futuras modelagens. Adicionalmente, o período analisado, marcado por eventos como a pandemia, pode ter introduzido padrões atípicos,

Referências:
Aggarwal, C. 2018. Neural Networks and Deep Learning: A Textbook. 1. ed. Cham: Springer.
Departamento Intersindical de Estatística e Estudo Socioeconômicos [DIEESE]. 2019. O mercado de trabalho e a formação dos engenheiros no Brasil. DIEESE e Sindicato dos Engenheiros no Estado do Paraná, 1. ed., Rio de Janeiro, FISENGE.
Gerón, A. 2019. Mãos à Obra: Aprendizado de Máquina com Scikit-Learn, Keras e TensorFlow: Conceitos, Ferramentas e Técnicas para Construção de Sistemas Inteligentes. 2. ed. Rio de Janeiro: Alta Books.
Hochreiter, S.; Schmidhuber, J. 1997. Long short-term memory. Neural Computation, v. 9, n. 8, p. 1735–1780.
Lins, L. M.; Salerno, M. S.; Araújo, B. S.; Gomes, L. A. V.; Paulo A. Nascimento, P. A. M.; Toledo, D. 2014. Escassez de engenheiros no Brasil? Novos Estudos 98.
Nunes, W. C.; Dos Anjos, E. C. 2021. Aplicabilidades de IA: análise preditiva do setor de serviços no mercado de trabalho de Florianópolis. IX SINGEP e a 9ª Conferência Internacional do CIK [Cyrus Institute of Knowledge]. Universidade Federal de Santa Catarina [UFSC].
Silva, V. H. M. C. 2021. Previsão de transição no mercado de trabalho com modelos de machine learning e classes desbalanceadas. Programa de Pós-Graduação em Economia Rural (PPGER/UFC), Área 13 – Economia do Trabalho.
Souza, K. B.; Domingues, E. P. 2014. Mapeamento e projeção da demanda por engenheiros por categoria, setor e microrregiões brasileiras. Pesquisa e planejamento econômico [PPE], v. 44, n. 2.


Resumo executivo oriundo de Trabalho de Conclusão de Curso de Especialização em Data Science e Analytics do MBA USP/Esalq

Saiba mais sobre o curso; clique aqui:

Quem editou este artigo

Você também pode gostar

Quer ficar por dentro das nossas últimas publicações? Inscreva-se em nossa newsletter!

Receba conteúdos e fique sempre atualizado sobre as novidades em gestão, liderança e carreira com a Revista E&S.

Ao preencher o formulário você está ciente de que podemos enviar comunicações e conteúdos da Revista E&S. Confira nossa Política de Privacidade