
04 de fevereiro de 2026
Predição da demanda por engenheiros de produção com redes neurais LSTM
Carlos Henrique Blanco de Oliveira; Lauro Marques Vicari
Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.
O objetivo desta pesquisa foi desenvolver e otimizar um modelo preditivo para a demanda por engenheiros de produção no Brasil, identificando a configuração de rede neural Long Short-Term Memory (LSTM) com a melhor capacidade preditiva. O estudo determinou, por meio de um processo experimental, os hiperparâmetros e técnicas de pré-processamento mais eficazes para prever o saldo líquido de admissões e demissões de profissionais do Código Brasileiro de Ocupações (CBO) 2149. Utilizou-se como variáveis preditoras o Produto Interno Bruto (PIB) e a taxa Selic. O desempenho do modelo foi avaliado sistematicamente com as métricas Erro Quadrático Médio (MSE), Erro Absoluto Médio (MAE) e o coeficiente de determinação (R²), para validar sua robustez em um mercado de trabalho dinâmico.
Nas últimas décadas, transformações globais aumentaram a demanda por profissionais de ciência, tecnologia, engenharia e matemática (STEM), essenciais para a inovação e produtividade. Existe uma correlação documentada entre a participação de profissionais de tecnologia na força de trabalho e o desempenho econômico de um país. Segundo Lins et al. (2014), nações com maior Produto Interno Bruto (PIB) per capita tendem a ter uma maior participação percentual de carreiras tecnológicas no total de ocupados, reforçando a importância de investir nesses talentos.
Dentro das carreiras tecnológicas, a engenharia tem papel central. Engenheiros estão ligados ao desenvolvimento e aplicação de novas tecnologias, sendo cruciais para o aumento da produtividade industrial. Souza e Domingues (2014) destacam sua influência em soluções sustentáveis e inovação tecnológica em grandes projetos de investimento, vitais para o crescimento nacional. Portanto, estimar a demanda futura por engenheiros no Brasil é uma tarefa de relevância estratégica para alinhar políticas educacionais às necessidades do mercado, utilizando classificações detalhadas por ocupação, setor e região.
O mercado de trabalho para engenheiros no Brasil, contudo, é complexo. Segundo análise do Dieese (2019), as ocupações de engenharia são fortemente influenciadas por ciclos de crescimento econômico e pela geografia. A sensibilidade aos ciclos econômicos é maior para engenheiros do que para outras ocupações, com oscilações acentuadas em fases de expansão e retração. Geograficamente, há uma concentração de profissionais em regiões com grandes obras e corporações, em detrimento de áreas menos desenvolvidas, o que cria desequilíbrios regionais na oferta e demanda por esses especialistas (Dieese, 2019).
Nesse cenário, técnicas de análise preditiva como aprendizado de máquina são promissoras. Estudos anteriores exploraram essa área, como o de Silva (2021), que modelou a transição entre estados ocupacionais, e o de Nunes e Dos Anjos (2021), que usou ARIMA para analisar o impacto da pandemia de Covid-19 no setor de serviços. O presente estudo avança ao empregar uma arquitetura de rede neural LSTM, mais sofisticada, para capturar dependências temporais complexas e não lineares, buscando testar a eficácia do modelo e auxiliar na elaboração de políticas públicas e no planejamento da formação de mão de obra especializada.
A metodologia baseou-se na coleta e tratamento de séries temporais de fontes oficiais, de janeiro de 2020 a abril de 2025, com frequência mensal. A variável-alvo (Y), demanda líquida por engenheiros de produção, foi construída a partir do saldo de admissões e desligamentos do Cadastro Geral de Empregados e Desempregados (CAGED) para o CBO 2149, processando 64 arquivos mensais que totalizavam aproximadamente 23 GB. As variáveis preditoras foram a taxa Selic, obtida via API do Banco Central, e o Produto Interno Bruto (PIB), com dados trimestrais do Instituto Brasileiro de Geografia e Estatística (IBGE).
Um desafio metodológico foi compatibilizar as frequências das séries. O PIB, originalmente trimestral, foi convertido para frequência mensal por interpolação polinomial de segundo grau, escolhida por proporcionar uma transição mais suave que a linear, representando melhor a evolução contínua da atividade econômica. A variável do PIB foi então transformada em sua variação percentual mensal (MoM) para capturar oscilações de curto prazo, que se presume terem impacto mais imediato nas contratações. Para o treinamento do modelo LSTM, as variáveis preditoras (variação do PIB e Selic) foram padronizadas com a técnica z-score, que, em testes preliminares, apresentou melhor desempenho que a normalização Min-Max.
O núcleo da metodologia foi uma Rede Neural Recorrente (RNN) com arquitetura Long Short-Term Memory (LSTM), escolhida por sua capacidade de modelar dependências de longo prazo em dados sequenciais, superando limitações de RNNs tradicionais como o desvanecimento do gradiente (Géron, 2019). Funções de ativação como a Tangente Hiperbólica (tanh) são cruciais por introduzirem não linearidade. A função tanh, que mapeia saídas para o intervalo [-1, 1] e é centrada na origem, mostrou-se particularmente eficaz neste estudo, especialmente quando combinada com a padronização z-score.
A arquitetura LSTM, proposta por Hochreiter e Schmidhuber (1997), é uma evolução das RNNs projetada para lembrar informações por longos períodos. Isso é alcançado por uma estrutura interna com três mecanismos de controle chamados “portas” (gates): a porta de esquecimento (decide o que descartar), a porta de entrada (seleciona novos dados para armazenar) e a porta de saída (determina a informação a ser propagada). Esse mecanismo permite que a rede aprenda seletivamente quais informações manter, tornando-a poderosa para prever séries temporais complexas como as de dados macroeconômicos e de mercado de trabalho (Aggarwal, 2018). O modelo foi implementado em Python com Keras e TensorFlow, visando minimizar o Erro Quadrático Médio (MSE).
A análise descritiva das variáveis (janeiro de 2020 a abril de 2025) revelou dinâmicas significativas. A variação mensal do PIB mostrou o impacto negativo da pandemia em 2020, seguido de recuperação e estabilização, com média de -0,09% e desvio padrão de 0,66%, indicando volatilidade. A taxa Selic refletiu a política monetária: expansionista em 2020-2021 (mínimas de 2%), seguida por um ciclo de alta agressivo até 2023 (próximo a 11%) para combater a inflação, com média de 6,76% e desvio padrão de 2,22%. A variável-alvo, demanda líquida por engenheiros de produção, variou entre -13 e +144 profissionais mensais, com média de 51, indicando crescimento líquido e aparente sazonalidade com picos no início dos anos. A matriz de correlação inicial, sem defasagem, mostrou correlações fracas: 0,124 entre PIB e demanda, e -0,069 entre Selic e demanda.
O desenvolvimento do modelo LSTM partiu de uma configuração base (uma camada com 20 unidades, ativação ReLU, divisão 70/30 para treino/teste), que resultou em um Erro Quadrático Médio (MSE) de 33.100 no conjunto de teste. Este valor serviu como ponto de partida para a otimização. A primeira rodada de ajustes, combinando a padronização z-score nas entradas com a função de ativação tangente hiperbólica (tanh) nas camadas, reduziu o MSE para 30.825, validando essas escolhas metodológicas.
A otimização mais impactante foi a introdução de um intervalo de tempo (lag) entre as variáveis preditoras e a alvo, reconhecendo que os efeitos macroeconômicos não são instantâneos. A introdução de um lag de um mês nas variáveis PIB e Selic reduziu drasticamente o MSE de 30.825 para 14.343. Testes com lags superiores (2, 3, 4 meses) também melhoraram o desempenho em relação ao modelo sem lag, mas nenhum superou o resultado do lag de um mês. Este achado confirma que o mercado de trabalho para engenheiros de produção responde às variações econômicas com um atraso relativamente curto, e que capturar essa defasagem é determinante para a predição.
A fase final de otimização, após definir o lag ótimo de um mês, focou no ajuste fino de macro-parâmetros, como a semente de aleatoriedade (seed) e a taxa de aprendizado (learning rate). A análise dos resultados mostrou que a configuração com uma semente igual a 3 e uma taxa de aprendizado de 0,00009 produziu o menor erro. Com esses ajustes, o modelo atingiu seu desempenho ótimo, com um MSE final de 13.352,32 e um Erro Absoluto Médio (MAE) de 88,12 no conjunto de teste.
A discussão dos resultados revela um panorama misto. O MSE final de 13.352 representa uma redução de aproximadamente 60% em relação ao modelo inicial (33.100), demonstrando a eficácia dos ajustes metodológicos, especialmente a introdução do lag temporal, o que corrobora as observações de Géron (2019) sobre o potencial da arquitetura LSTM. Contudo, o MAE de 88,12 indica que, em média, as previsões do modelo desviam-se em cerca de 88 profissionais por mês dos valores reais, um erro de magnitude considerável, apontando limitações na precisão.
O resultado mais preocupante foi o coeficiente de determinação (R²) de -0,7454. Um R² negativo indica que o desempenho do modelo é inferior ao de um modelo que simplesmente prevê a média histórica da variável-alvo. Isso sugere que, apesar da significativa redução do MSE, o modelo final não explica adequadamente a variabilidade na demanda por engenheiros. Essa limitação pode ser atribuída à complexidade do mercado de trabalho, influenciado por múltiplos fatores econômicos, geográficos e setoriais não capturados pelas duas variáveis preditoras utilizadas, conforme apontado pelo Dieese (2019). Ainda assim, a eficácia do lag de um mês permanece como um insight valioso sobre a resposta rápida deste mercado a estímulos macroeconômicos.
Em suma, este estudo buscou prever a demanda por engenheiros de produção no Brasil com redes LSTM. Embora a capacidade preditiva final, avaliada pelo R² negativo, tenha sido limitada, o trabalho oferece contribuições metodológicas importantes. A demonstração de que um lag temporal de um mês, combinado com padronização z-score e ativação tangente hiperbólica, pode reduzir o erro de previsão em mais de 60% é um resultado significativo. Uma limitação central foi o uso de apenas duas variáveis preditoras (PIB e Selic) para um fenômeno multifacetado. Fatores como investimento em infraestrutura e indicadores setoriais, como sugerido por Souza e Domingues (2014), poderiam enriquecer futuras modelagens. Adicionalmente, o período analisado, marcado por eventos como a pandemia, pode ter introduzido padrões atípicos,
Referências:
Aggarwal, C. 2018. Neural Networks and Deep Learning: A Textbook. 1. ed. Cham: Springer.
Departamento Intersindical de Estatística e Estudo Socioeconômicos [DIEESE]. 2019. O mercado de trabalho e a formação dos engenheiros no Brasil. DIEESE e Sindicato dos Engenheiros no Estado do Paraná, 1. ed., Rio de Janeiro, FISENGE.
Gerón, A. 2019. Mãos à Obra: Aprendizado de Máquina com Scikit-Learn, Keras e TensorFlow: Conceitos, Ferramentas e Técnicas para Construção de Sistemas Inteligentes. 2. ed. Rio de Janeiro: Alta Books.
Hochreiter, S.; Schmidhuber, J. 1997. Long short-term memory. Neural Computation, v. 9, n. 8, p. 1735–1780.
Lins, L. M.; Salerno, M. S.; Araújo, B. S.; Gomes, L. A. V.; Paulo A. Nascimento, P. A. M.; Toledo, D. 2014. Escassez de engenheiros no Brasil? Novos Estudos 98.
Nunes, W. C.; Dos Anjos, E. C. 2021. Aplicabilidades de IA: análise preditiva do setor de serviços no mercado de trabalho de Florianópolis. IX SINGEP e a 9ª Conferência Internacional do CIK [Cyrus Institute of Knowledge]. Universidade Federal de Santa Catarina [UFSC].
Silva, V. H. M. C. 2021. Previsão de transição no mercado de trabalho com modelos de machine learning e classes desbalanceadas. Programa de Pós-Graduação em Economia Rural (PPGER/UFC), Área 13 – Economia do Trabalho.
Souza, K. B.; Domingues, E. P. 2014. Mapeamento e projeção da demanda por engenheiros por categoria, setor e microrregiões brasileiras. Pesquisa e planejamento econômico [PPE], v. 44, n. 2.
Resumo executivo oriundo de Trabalho de Conclusão de Curso de Especialização em Data Science e Analytics do MBA USP/Esalq
Saiba mais sobre o curso; clique aqui:





































