Resumo Executivo

Imagem Integrando deep learning na otimização relativa robusta de portfólios brasileiros

24 de fevereiro de 2026

Integrando deep learning na otimização relativa robusta de portfólios brasileiros

Lucas Rossi Granziol; Orlando da Silva Junior

Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.

Esta pesquisa investiga a integração de redes neurais Long Short-Term Memory (LSTM) à metodologia de Otimização Relativa Robusta (RRO) para a construção de portfólios de ações no mercado brasileiro, avaliando se a abordagem gera desempenho superior a um benchmark passivo. O estudo combina previsões de deep learning com um modelo de otimização focado na gestão de risco relativo em um mercado emergente, verificando a resiliência e a capacidade de preservação de capital da estratégia, especialmente durante períodos de instabilidade.

A teoria moderna de portfólios, iniciada por Markowitz (1952) com o modelo de Média-Variância (MV), formalizou o conceito de diversificação. Em vez de focar apenas no retorno, como em abordagens anteriores (Williams, 1938; Hicks, 1946), Markowitz propôs otimizar a relação entre o retorno esperado e o risco, medido pela variância, resultando na “fronteira eficiente”. O modelo foi posteriormente expandido com conceitos como o Capital Asset Pricing Model (CAPM), que se tornou a base para a precificação de ativos sob a hipótese de mercados eficientes (Milhomem & Dantas, 2020).

Apesar da elegância teórica, a aplicação do modelo MV enfrenta desafios, sendo a principal crítica sua sensibilidade a erros de estimação nos retornos esperados e na matriz de covariância (Fabozzi et al., 2007). Pequenas alterações nesses inputs, inerentemente incertos, podem gerar alocações de portfólio instáveis e concentradas, comprometendo a robustez da estratégia e aumentando custos de transação. Em resposta, a Otimização Robusta (RO) foi desenvolvida para criar decisões ótimas que sejam imunes à incerteza dos dados de entrada (Ghahtarani et al., 2022).

A Otimização Robusta não assume uma distribuição de probabilidade para os parâmetros incertos, mas define um “conjunto de incerteza” que contém todos os cenários futuros possíveis. A otimização é realizada considerando o pior cenário dentro desse conjunto, garantindo que o desempenho seja satisfatório mesmo em condições adversas. A literatura descreve diversas formas para esses conjuntos, como os de caixa (Soyster, 1973), elipsoidais (Ben-Tal & Nemirovski, 1998) e poliédricos (Bertsimas & Melvyn, 2004). Contudo, essa abordagem de “minimax” é frequentemente criticada por gerar portfólios excessivamente conservadores, que podem sacrificar retornos em cenários mais prováveis (Salo et al., 2024).

Para mitigar o conservadorismo da RO, a Otimização Relativa Robusta (RRO), formalizada por Hauser et al. (2013) e aprimorada por Simões et al. (2018), alinha-se aos objetivos de gestores de fundos avaliados contra um benchmark. Em vez de minimizar o risco absoluto, a RRO otimiza o desempenho controlando o desvio (ou “regret”) em relação a esse benchmark, permitindo uma assunção de risco mais flexível. Paralelamente, avanços em deep learning, como as redes LSTM, demonstraram capacidade superior de capturar padrões não lineares em séries temporais financeiras, oferecendo previsões de retorno potencialmente mais acuradas para alimentar os modelos de otimização (Fischer & Krauss, 2018; Ma et al., 2021).

A metodologia utiliza dados secundários de preços diários (abertura, máximo, mínimo, fechamento) e volume da plataforma Investing. com, e a composição teórica do Ibovespa da B3. O universo de análise partiu de uma seleção aleatória de 10 ações do Ibovespa, com seis sendo mantidas para o estudo: ALOS3, AZZA3, BBAS3, COGN3, SBSP3 e VIVT3. As demais foram excluídas por possuírem séries temporais mais curtas. O período de análise compreende de 01 de janeiro de 2019 a 31 de dezembro de 2024, abrangendo diferentes regimes de mercado, como a crise da COVID-19.

A arquitetura do modelo possui duas camadas. A primeira, de previsão de retornos, consiste em um conjunto de seis redes neurais LSTM, uma para cada ativo. A arquitetura LSTM foi escolhida por sua eficácia comprovada na modelagem de séries temporais complexas, sendo capaz de reter informações de longo prazo através de suas células de memória (Deswal, 2024). Cada LSTM foi treinada para prever o preço de fechamento do dia seguinte (t+1) utilizando como features os preços de abertura, máximo, mínimo, fechamento e volume do dia corrente. A segunda camada é o modelo de otimização RRO, formulado como um problema de Programação por Cones de Segunda Ordem (SOCP), que recebe como input os retornos esperados gerados pelas LSTMs.

O modelo de otimização RRO, implementado com base na formulação de Simões et al. (2018), tem como função objetivo maximizar o retorno esperado do portfólio. A principal restrição é a de “regret” proporcional, que limita a volatilidade do portfólio a não exceder a volatilidade do benchmark em mais do que um fator de tolerância predefinido (θ=0,5). O benchmark utilizado foi uma carteira igualmente ponderada (1/n). Para capturar diferentes regimes de mercado, o conjunto de incerteza foi construído de forma multi-período, utilizando o algoritmo de detecção de changepoints de Barnett e Onnela (2016) para identificar mudanças estruturais na matriz de correlação dos retornos. O problema foi reformulado como um SOCP através da decomposição de Cholesky da matriz de covariância. O backtest foi realizado com rebalanceamento diário, sem considerar custos de transação, e o desempenho foi avaliado por retorno acumulado, volatilidade anualizada, Sharpe Ratio e Maximum Drawdown (MaxDD).

A camada de previsão revelou um desempenho geralmente satisfatório dos modelos LSTM, mas com particularidades. Para os ativos ALOS3 e VIVT3, os modelos alcançaram bom ajuste, com R² no conjunto de teste de 0,810 e 0,899, respectivamente. Em contraste, os modelos para COGN3 e BBAS3 inicialmente sofreram overfitting severo, com R² de treino próximo a 0,97 e R² de teste negativo. O problema foi corrigido ao reduzir a paciência do callback EarlyStopping, o que elevou o R² de teste para 0,808 e 0,744, respectivamente.

O caso mais desafiador foi o do ativo SBSP3, cujo modelo LSTM apresentou um R² negativo no teste, mesmo após ajustes. A hipótese para o desempenho insatisfatório não é overfitting, mas a influência de variáveis exógenas não incluídas no modelo, como notícias sobre a privatização da companhia. Apesar de um R² negativo sugerir que a média histórica seria um preditor melhor, o ativo foi mantido na análise, corroborando ressalvas da literatura sobre a dependência exclusiva de modelos de deep learning (Heydarpour et al., 2025). Outra peculiaridade foi observada no modelo para AZZA3, que apresentou um Mean Squared Error (MSE) elevado, embora o R² de treino (0,895) e de teste (0,730) fossem razoáveis. A causa provável é um erro no processo de escalonamento dos dados que, no entanto, não parece ter comprometido a capacidade direcional do modelo.

Na camada de otimização, o algoritmo de detecção de changepoints de Barnett e Onnela (2016) identificou nove pontos de mudança estrutural na matriz de correlação, segmentando a amostra em dez regimes de mercado distintos. Notavelmente, o principal aglomerado de changepoints ocorreu durante o primeiro semestre de 2020, coincidindo com o choque da pandemia de COVID-19, o que valida a capacidade do método de capturar eventos de mercado. Essa segmentação dinâmica permitiu que o modelo RRO ajustasse sua aversão ao risco de acordo com o regime vigente, formando a base do conjunto de incerteza multi-período.

Os resultados do backtest demonstram uma superioridade expressiva da estratégia RRO sobre o benchmark 1/n. Ao longo dos cinco anos, o benchmark passivo sofreu uma perda acumulada de -70,69%, resultando em um patrimônio final de R$292,20 a partir de um investimento inicial de R$1.000. Em contraste, a carteira RRO encerrou o período com um retorno acumulado positivo de 0,22%, com um patrimônio final de R$1.007,36. A resiliência do modelo RRO é ainda mais evidente na métrica de Maximum Drawdown (MaxDD): -36,14% contra -75,06% do benchmark, evidenciando uma capacidade de preservação de capital significativamente maior.

Em termos de risco e retorno ajustado, a carteira RRO apresentou uma volatilidade anualizada ligeiramente superior à do benchmark (27,20% contra 24,64%). No entanto, seu Sharpe Ratio foi consideravelmente melhor (-0,36) em comparação com o do benchmark (-1,28). Embora ambos os valores sejam negativos, indicando que nenhuma das estratégias superou a taxa livre de risco (Selic) no período, a performance relativa do modelo RRO foi substancialmente superior. O desempenho abaixo da taxa livre de risco pode ser atribuído às restrições do modelo (long-only, 100% alocado) e à forte alta da taxa Selic no período.

A significância estatística desses resultados foi confirmada por testes de hipóteses. O teste de Newey e West (1987) para a diferença nos retornos médios resultou em uma estatística t de 3,178, com um p-valor de 0,0007, levando à rejeição da hipótese nula de que o retorno da RRO é menor ou igual ao do benchmark. Isso confirma que a superioridade do retorno da carteira RRO é estatisticamente significativa. Por outro lado, o teste de bootstrap para a diferença de volatilidade produziu um p-valor de 0,502, indicando que não há evidência estatística para afirmar que a volatilidade da carteira RRO foi superior à do benchmark. Portanto, o modelo conseguiu gerar retornos significativamente maiores sem um aumento estatisticamente significativo no risco.

Estes achados corroboram a literatura, reforçando que modelos de otimização robusta são eficazes em cenários de estresse de mercado (Oberoi et al., 2020; Xidonas et al., 2020) e que a abordagem RRO é prática para a gestão de portfólios (Caçador et al., 2021; Simões et al., 2018). O estudo também evidencia o potencial e as limitações do uso de deep learning para previsão de retornos, mostrando que as LSTMs, embora úteis, não são imunes a ruídos e choques exógenos (Yaqoob & Abdullah, 2025). As principais limitações deste trabalho incluem a amostra reduzida de ativos, a ausência de custos de transação e os gargalos computacionais.

O trabalho demonstrou a viabilidade e os benefícios da integração de deep learning com a Otimização Relativa Robusta de portfólios no mercado de ações brasileiro. A abordagem proposta provou ser mais resiliente e eficaz na preservação de capital em comparação com uma estratégia passiva, especialmente em um ambiente volátil. Os resultados indicam que a combinação de previsões de retorno mais sofisticadas com um framework de otimização que gerencia ativamente o risco relativo a um benchmark pode gerar ganhos para a gestão de investimentos. As conclusões reforçam o valor da aplicação de métodos quantitativos avançados, embora a complexidade computacional e a sensibilidade dos modelos a eventos não capturados pelos dados permaneçam como desafios.

O estudo contribui para a literatura aplicada com evidências empíricas em um mercado emergente e abre caminhos para pesquisas futuras, que poderiam explorar universos de ativos mais amplos, incluir custos de transação e outras restrições do mundo real, bem como incorporar dados alternativos e arquiteturas preditivas mais complexas. Conclui-se que o objetivo foi atingido: demonstrou-se que o modelo de Otimização Relativa Robusta, alimentado por previsões de deep learning, foi capaz de superar um benchmark passivo em termos de retorno e resiliência no mercado de ações brasileiro.

Referências:
Auer, B. R.; Schuhmacher, F. 2013. Performance hypothesis testing with the Sharpe ratio: the case of hedge funds. Finance Research Letters 10(4): 196-208.
Barnett, I.; Onnela, J. P. 2016. Change point detection in correlation networks. Scientific Reports 6(1): 1-11.
Ben-Tal, A.; Nemirovski, A. 1998. Robust convex optimization. Mathematics of Operations Research 23(4): 769-805.
Bertsimas, D.; Sim, M. 2004. The price of robustness. Operations Research 52(1): 35-53.
Caçador, S.; Dias, J. M.; Godinho, P. 2021. Portfolio selection under uncertainty: a new methodology for computing relative-robust solutions. International Transactions in Operational Research 28(3): 1296-1329.
Chung, H.; Shin, K. S. 2018. Genetic algorithm-optimized long short-term memory network for stock market prediction. Sustainability 10(10): 3765.
Deswal, V. 2024. Hyperparameter tuning of the LSTM model for stock price prediction. International Journal of Intelligent Systems and Applications in Engineering 12(4): 705-712.
Fabozzi, F. J.; Kolm, P. N.; Pachamanova, D. A.; Focardi, S. M. 2007. Robust Portfolio Optimization and Management. Hoboken: John Wiley & Sons.
Fischer, T.; Krauss, C. 2018. Deep learning with long short-term memory networks for financial market predictions. European Journal of Operational Research 270(2): 654-669.
Ghahtarani, A.; Saif, A.; Ghasemi, A. 2022. Robust portfolio selection problems: a comprehensive review. Operational Research 22: 3203-3264.
Hauser, R.; Krishnamurthy, V.; Tütüncü, R. 2013. Relative robust portfolio optimization. arXiv Preprint arXiv:1305.0144.


Resumo executivo oriundo de Trabalho de Conclusão de Curso de Especialização em Data Science e Analytics do MBA USP/Esalq

Saiba mais sobre o curso; clique aqui:

Quem editou este artigo

Você também pode gostar

Quer ficar por dentro das nossas últimas publicações? Inscreva-se em nossa newsletter!

Receba conteúdos e fique sempre atualizado sobre as novidades em gestão, liderança e carreira com a Revista E&S.

Ao preencher o formulário você está ciente de que podemos enviar comunicações e conteúdos da Revista E&S. Confira nossa Política de Privacidade