Imagem Previsão de Preços de Petróleo com Redes Neurais Híbridas LSTM e CNN

26 de fevereiro de 2026

Previsão de Preços de Petróleo com Redes Neurais Híbridas LSTM e CNN

Juliana Alves Marques; Ricardo Janes

Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.

Este trabalho desenvolve e avalia combinações de redes neurais Long Short-Term Memory (LSTM) e Convolutional Neural Networks (CNN) para a previsão do preço do petróleo, buscando superar o desempenho de métodos convencionais. A pesquisa estabelece um modelo de previsão mais preciso para o volátil e não linear mercado de commodities energéticas. Estimativas acuradas subsidiam decisões estratégicas de governos, investidores e empresas do setor de óleo e gás, que dependem de projeções confiáveis para mitigar riscos e otimizar operações. A previsão é complexa devido à sensibilidade do preço a fatores como dinâmicas geopolíticas, estoques, crescimento econômico global e mudanças climáticas, que geram padrões não lineares nos dados (Bristone et al., 2020; Gao e Lei, 2017). Modelos tradicionais frequentemente falham em capturar essa complexidade, justificando a exploração de técnicas avançadas de aprendizado de máquina.

O petróleo permanece como a principal fonte energética mundial. Em 2023, respondeu por 30% do fornecimento total, à frente do carvão (27%) e do gás natural (23%), segundo a International Energy Agency (IEA, 2024). Essa predominância reforça a importância de compreender a dinâmica de seus preços, cujas oscilações afetam indicadores macroeconômicos como inflação, desemprego, câmbio e crescimento econômico. O impacto é acentuado em nações dependentes de importação ou exportação; a volatilidade pode desestabilizar orçamentos e políticas públicas (Gupta e Nigam, 2020; Gupta e Pandey, 2018), posicionando o petróleo como um pilar da estabilidade econômica internacional.

Apesar da transição para energias limpas, a demanda global por energia continua a crescer, impulsionada por economias emergentes, o que dificulta a redução do consumo de combustíveis fósseis como o petróleo (York e Bell, 2019). A IEA (2024) projeta que, em um cenário baseado nas políticas atuais, a participação do petróleo na matriz energética mundial seria de 24% em 2050. Em um cenário de emissões líquidas zero, essa participação cairia para 7%, sendo substituído por energias renováveis. Mesmo no cenário mais otimista para a transição energética, o petróleo manterá relevância nas próximas décadas, tornando a previsibilidade de seus preços fundamental para o planejamento de longo prazo.

A natureza não linear e volátil do preço do petróleo (Jovanovic et al., 2022; Mostafa e El-Masry, 2016) justifica o uso de Redes Neurais Artificiais (RNAs), técnicas de aprendizado de máquina capazes de modelar relações complexas em séries temporais financeiras (Bristone et al., 2020). Inspiradas em sistemas nervosos, as RNAs são compostas por neurônios interconectados cujos pesos são ajustados durante o treinamento para aprender padrões nos dados. Após treinada, a rede generaliza o conhecimento para prever valores futuros com base em novos dados, sendo uma ferramenta poderosa em diversas áreas (Aggarwal, 2018).

Dentre as arquiteturas de RNAs, a Long Short-Term Memory (LSTM) e a Convolutional Neural Networks (CNN) destacam-se em séries temporais. A LSTM, uma arquitetura recorrente, é projetada para capturar dependências de longo prazo em dados sequenciais (Sha, 2024), utilizando células de memória com portões que regulam o fluxo de informação para decidir o que reter ou descartar (Gupta e Pandey, 2018). A CNN, originária da visão computacional, é eficaz na extração de padrões locais. Em séries temporais, suas camadas de convolução atuam como filtros para identificar tendências de curto prazo nos preços (He et al., 2019). Este estudo explora o potencial de modelos híbridos que combinam as forças de ambas as arquiteturas.

Foram utilizadas cotações diárias do petróleo Brent Europeu “Free On Board” (FOB), em dólares por barril, da U. S. Energy Information Administration (EIA, 2025). O conjunto de dados, após a remoção de 441 valores ausentes (4,38%), abrange o período de 1 de junho de 1987 a 30 de abril de 2025, totalizando 9.621 observações. O projeto foi desenvolvido em Python no ambiente Google Colab. A análise exploratória com as bibliotecas “pandas” e “numpy” não identificou duplicatas ou outliers. No pré-processamento, aplicou-se a transformação de logaritmo natural aos preços para estabilizar a variância e linearizar tendências (Hyndman e Athanasopoulos, 2021; Lütkepohl e Xu, 2012). Os dados foram divididos cronologicamente em conjuntos de treino (80%) e teste (20% mais recentes), conforme práticas de validação para séries temporais (Joseph et al., 2024).

A metodologia comparou o desempenho de seis modelos: um heurístico (“naïve”), um econométrico (ARIMA) e quatro baseados em redes neurais (LSTM, CNN, LSTM-CNN e CNN-LSTM). O modelo “naïve”, que assume que o preço futuro é igual ao atual, foi incluído como benchmark, pois frequentemente supera abordagens mais complexas para a previsão de preços de petróleo (Gao e Lei, 2017). Para o modelo ARIMA, um padrão na literatura econométrica (Alquist et al., 2013), foram realizadas análises estatísticas com o pacote “statsmodels”. Foram analisados os gráficos das funções de autocorrelação (ACF) e autocorrelação parcial (PACF) e aplicado o teste de Dickey-Fuller aumentado (ADF) para verificar a estacionariedade. Após a modelagem, os resíduos foram submetidos aos testes de Ljung-Box (autocorrelação), Kolmogorov-Smirnov (normalidade) e ARCH (heterocedasticidade) para avaliar a adequação do modelo (Fávero e Belfiore, 2024; Greene, 2003).

A análise estatística para o modelo ARIMA confirmou a não estacionariedade da série de preços. A análise visual das funções ACF e PACF mostrou um decaimento lento e correlação significativa no primeiro “lag”, respectivamente. O teste de Dickey-Fuller aumentado resultou em um p-valor de 0,294, indicando a presença de uma raiz unitária, comportamento típico de séries econômicas com tendências (Greene, 2003). Após uma diferenciação de primeira ordem, a série tornou-se estacionária, com o teste ADF produzindo um p-valor inferior a 0,001 e as funções ACF e PACF não mostrando autocorrelações significativas, validando a necessidade da diferenciação.

A avaliação de desempenho revelou a superioridade dos modelos de redes neurais sobre as abordagens tradicionais. O modelo “naïve” registrou o pior desempenho (RMSE de 23,3961), servindo como limite inferior de performance (Hyndman e Athanasopoulos, 2021). O modelo ARIMA(0,1,1), selecionado pela função “auto_arima”, apresentou uma melhoria, com um RMSE de 17,6176, uma redução de 25% em relação ao “naïve”. A ordem (0,1,1) indica que o modelo não utiliza termos autorregressivos, aplica uma diferenciação e considera o erro de previsão do período anterior (Morettin e Toloi, 2018).

A análise dos resíduos do ARIMA mostrou que, embora capturasse a estrutura temporal dos dados (ausência de autocorrelação nos resíduos, conforme o teste de Ljung-Box), ele violou os pressupostos de normalidade e homocedasticidade. Os testes de Kolmogorov-Smirnov e ARCH rejeitaram as hipóteses nulas de normalidade e variância constante, respectivamente. Essa violação implica que os intervalos de confiança gerados pelo modelo ARIMA são imprecisos, limitando sua confiabilidade (Hyndman e Athanasopoulos, 2021). Em contraste, todos os modelos de RNA demonstraram desempenho superior, com valores de RMSE aproximadamente 90% menores que os do ARIMA, evidenciando sua capacidade de modelar a não linearidade dos preços.

O modelo LSTM alcançou um RMSE de 1,7817, uma melhoria de 3% sobre o CNN. O resultado era esperado, pois a arquitetura LSTM é projetada para processar sequências e reter informações ao longo de extensos períodos (Aggarwal, 2018; Bristone et al., 2020). Suas células de memória e portões permitem que a rede aprenda dependências de longo prazo, tornando-a uma escolha robusta para séries temporais complexas (Goodfellow et al., 2016).

O modelo híbrido LSTM-CNN emergiu como o de melhor desempenho, registrando o menor RMSE: 1,7796. Este resultado, embora represente uma melhora marginal de 0,1% em relação ao LSTM puro, confirma a sinergia entre as arquiteturas. A combinação permite que a camada LSTM inicial processe a sequência e capture dependências de longo prazo, enquanto a camada CNN subsequente extrai padrões locais dessa representação temporal, uma abordagem eficaz em outros estudos (He et al., 2019).

A arquitetura híbrida invertida, CNN-LSTM, teve desempenho inferior ao LSTM, com um RMSE de 1,7880. Este resultado sugere que a aplicação inicial de uma camada convolucional pode comprometer a ordem temporal dos dados ao extrair características. Com a sequência parcialmente desordenada, a camada LSTM subsequente perde eficácia em capturar as dependências sequenciais, funcionando de maneira similar a uma camada densa, como teorizado por He et al. (2019). Este achado contrasta com trabalhos que defendem a abordagem CNN-LSTM (Lu et al., 2020; Widiputra et al., 2021), indicando que a ordem das camadas é um fator crítico e dependente do problema.

A escolha do modelo não se baseou apenas no RMSE. O desempenho dos três melhores modelos (LSTM, LSTM-CNN e CNN-LSTM) foi extremamente próximo. O MAE, que representa o erro médio em dólares, foi de $1,23, $1,22 e $1,24, respectivamente. O MAPE para os três foi idêntico, de 1,84%. O ganho de performance do LSTM-CNN sobre o LSTM foi marginal. Diante de um ganho incremental tão pequeno, a maior complexidade computacional e o maior número de parâmetros do modelo híbrido não se justificam. A literatura defende modelos mais simples quando o ganho de desempenho de um mais complexo não é substancial (Domingos, 2012; Huyen, 2022; Kuhn e Johnson, 2013). Portanto, o modelo LSTM foi selecionado como a escolha final, pois oferece o melhor equilíbrio entre eficácia, simplicidade e interpretabilidade.

Este trabalho demonstrou que os modelos de redes neurais, especialmente LSTM e suas variantes híbridas, são superiores aos modelos tradicionais (ARIMA, “naïve”) para a previsão de preços do petróleo. O modelo LSTM destacou-se por capturar dependências de longo prazo, enquanto a combinação LSTM-CNN alcançou o menor erro ao integrar o processamento sequencial com a extração de padrões locais. No entanto, o ganho de desempenho do modelo híbrido foi mínimo em comparação com o LSTM puro.

Considerando a maior complexidade e o custo computacional do modelo híbrido, o modelo LSTM se justifica como a escolha final, oferecendo um equilíbrio ideal entre desempenho e simplicidade. As previsões geradas reforçam o potencial das RNAs como ferramentas para apoiar a tomada de decisões no setor energético. Para trabalhos futuros, sugere-se avaliar a inclusão de um mecanismo de atenção na arquitetura híbrida e analisar o desempenho em horizontes de previsão mais longos, de maior aplicabilidade estratégica. Conclui-se que o objetivo foi atingido: demonstrou-se que as redes neurais artificiais, em particular o modelo LSTM, fornecem previsões mais acuradas para o preço do petróleo em comparação com métodos tradicionais, oferecendo um equilíbrio eficaz entre complexidade e desempenho.

Referências:
Aggarwal, C. C. 2018. Neural Networks and Deep Learning: A Textbook. Springer, Cham, Suíça.
Alquist, R.; Kilian, L.; Vigfusson, R. J. 2013. Forecasting the price of oil. p. 427-507. In: Elliott, G.; Timmermann, A. Handbook of Economic Forecasting. v. 2, Parte A. Elsevier, Amsterdam, Holanda.
Baumeister, C.; Kilian, L. 2012. Real-time forecasts of the real price of oil. Journal of Business & Economic Statistics 30(2): 326-336.
Baumeister, C.; Kilian, L. 2015. Forecasting the real price of oil in a changing world: A forecast combination approach. Journal of Business & Economic Statistics 33(3): 338-351.
Bristone, M.; Prasad, R.; Abubakar, A. A. 2020. CPPCNDL: Crude oil price prediction using complex network and deep learning algorithms. Petroleum 6(4): 353-361.
Domingos, P. 2012. A few useful things to know about machine learning. Communications of the ACM 55(10): 78-87.
Fávero, L. P.; Belfiore, P. 2024. Manual de Análise de Dados: Estatística e Machine Learning com Excel®, SPSS®, Stata®, R® e Python®. 2ed. GEN LTC, São Paulo, SP, Brasil.
Gao, S.; Lei, Y. 2017. A new approach for crude oil price prediction based on stream learning. Geoscience Frontiers 8(1): 183-187.
Géron, A. 2022. Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems. 3ed. O’Reilly Media, Sebastopol, CA, EUA.
Goodfellow, I.; Bengio, Y.; Courville, A. 2016. Deep Learning. MIT Press, Cambridge, MA, EUA.
Greene, W. H. 2003. Econometric Analysis. 5ed. Prentice Hall, Upper Saddle River, NJ, EUA.
Gupta, N.; Nigam, S. 2020. Crude oil price prediction using artificial neural network. Procedia Computer Science 170: 642-647.
Gupta, V.; Pandey, A. 2018. Crude oil price prediction using LSTM networks. International Journal of Computer and Information Engineering 12(3): 226-230.
He, Z.; Zhou, J.; Dai, H. N.; Wang, H. 2019. Gold price forecast based on LSTM-CNN model. In: IEEE International Conference on Dependable, Autonomic and Secure Computing, International Conference on Pervasive Intelligence and Computing, International Conference on Cloud and Big Data Computing, International Conference on Cyber Science and Technology Congress, 2019, Fukuoka, Japão. Anais… p. 1046-1053.
Huyen, C. 2022. Designing Machine Learning Systems: An Iterative Process For Production-Ready Applications. 1ed. O’Reilly Media, Sebastopol, CA, EUA.
Hyndman, R. J.; Athanasopoulos, G. 2021. Forecasting: Principles and Practice. 3ed. OTexts, Melbourne, Austrália.
International Energy Agency [IEA]. 2024. World Energy Outlook 2024.
Joseph, M

Resumo executivo oriundo de Trabalho de Conclusão de Curso de Especialização em Data Science e Analytics do MBA USP/Esalq

Saiba mais sobre o curso; clique aqui:

Quem editou este artigo

Você também pode gostar

Quer ficar por dentro das nossas últimas publicações? Inscreva-se em nossa newsletter!

Receba conteúdos e fique sempre atualizado sobre as novidades em gestão, liderança e carreira com a Revista E&S.

Ao preencher o formulário você está ciente de que podemos enviar comunicações e conteúdos da Revista E&S. Confira nossa Política de Privacidade