
30 de março de 2026
Suporte à Decisão na B3 com Python, Excel e Redes Neurais LSTM
André Henrique Baroni Grange; Jéssica Eloá Poletto
Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.
O mercado financeiro desempenha um papel fundamental no crescimento econômico e na geração de riqueza, oferecendo aos investidores oportunidades diversificadas de alocação de capital (Portal do Investidor, 2024). Dentro desse ecossistema, o Ibovespa surge como o principal índice do mercado acionário brasileiro, servindo como referência para o desempenho das ações negociadas na Bolsa de Valores de São Paulo. Composto por uma carteira teórica dos ativos mais representativos e líquidos, o índice reflete o comportamento médio das principais empresas listadas, englobando diversos setores da economia nacional. Ao acompanhar essa métrica, investidores avaliam tendências gerais, comparam a performance de ativos específicos e buscam fundamentação para decisões estratégicas. A relevância desse indicador é reforçada pelo papel que desempenha na análise de estratégias de investimento e no balizamento de mercado, tornando-se um parâmetro essencial para ferramentas que visam prever o comportamento das ações brasileiras.
Contudo, investidores individuais frequentemente enfrentam desafios significativos, como falta de tempo, dificuldade em acessar dados confiáveis e limitações na análise de informações complexas. A ausência de ferramentas acessíveis e otimizadas que auxiliem a tomada de decisões pode desmotivar investimentos em renda variável, especialmente para aqueles com janelas temporais restritas para monitoramento. Conforme discutido por Karasan (2022), a utilização de técnicas de aprendizado de máquina aprimora significativamente a modelagem de riscos financeiros, permitindo que padrões não lineares sejam identificados em meio à volatilidade dos preços. Nesse sentido, a análise descritiva surge como o primeiro passo fundamental, permitindo sumarizar e organizar dados de forma compreensível. A linguagem Python destaca-se nesse cenário pela versatilidade e eficiência, oferecendo bibliotecas como pandas e numpy, que disponibilizam funções para explorar e interpretar conjuntos de dados volumosos (Python Software Foundation, 2025).
A integração de bibliotecas gráficas, como matplotlib e seaborn, facilita a comunicação de resultados de maneira intuitiva, tornando a interpretação dos dados mais direta para o usuário final. Além disso, a capacidade de integração com modelos preditivos, como as redes neurais, permite que trabalhos exploratórios evoluam para sistemas de suporte à decisão robustos (Fávero e Belfiore, 2024). Paralelamente, o Excel mantém sua posição como ferramenta amplamente utilizada no mercado financeiro devido à acessibilidade e familiaridade. Embora não possua nativamente recursos avançados de modelagem preditiva, a combinação entre Python e Excel representa uma solução híbrida que une a robustez da inteligência artificial com a praticidade das planilhas. Essa sinergia possibilita que investidores realizem análises complexas diretamente em ambientes tabulares, visualizando indicadores financeiros e recebendo previsões automatizadas baseadas em modelos de memória de longo e curto prazo.
No universo das bolsas de valores, a identificação precisa dos ativos ocorre por meio de códigos denominados tickers. Esses identificadores, compostos por letras e números, garantem que cada instrumento financeiro seja negociado sem ambiguidades (Nomad Global, 2025). No Brasil, a estrutura desses códigos segue padrões específicos, onde as quatro letras iniciais representam a empresa emissora e os numerais subsequentes indicam a natureza do ativo, como ações ordinárias, preferenciais ou unidades de investimento. Além da identificação, a análise fundamentalista utiliza métricas como o índice Preço Sobre Valor Patrimonial para avaliar se uma ação está sendo negociada acima ou abaixo do seu valor contábil líquido (Status Invest, 2020). Esse indicador permite identificar empresas subvalorizadas, auxiliando na tomada de decisões estratégicas, desde que contextualizado com o segmento de atuação e outros fatores qualitativos da gestão.
As redes neurais do tipo Long Short-Term Memory representam uma variante das redes neurais recorrentes projetadas para superar limitações relacionadas à preservação de informações em séries temporais extensas. Enquanto modelos tradicionais enfrentam dificuldades com a dissipação do gradiente, as arquiteturas de memória seletiva incorporam mecanismos de células que permitem a manutenção de informações relevantes através do tempo. Esse diferencial torna tais modelos particularmente eficazes na modelagem de dados financeiros, onde a evolução temporal e a contextualização histórica são cruciais para a performance preditiva (Hochreiter e Schmidhuber, 1997). O objetivo central reside no desenvolvimento de uma ferramenta que integre essas capacidades tecnológicas para fornecer suporte à decisão no investimento em ações, oferecendo uma interface simplificada que reúna indicadores financeiros, avaliação histórica e previsões de curto prazo.
A implementação do algoritmo para suporte à decisão caracteriza-se pelo uso de dados quantitativos e análise estatística rigorosa (Rodrigues, 2007). O processo operacional inicia-se com a instalação e configuração do ambiente de desenvolvimento, utilizando o gerenciador de pacotes para garantir a presença de bibliotecas essenciais como yfinance, pandas, numpy, matplotlib, seaborn e tensorflow. A obtenção da base de dados é realizada via interface de programação de aplicações, conectando o script diretamente aos servidores que fornecem cotações históricas da B3. Para a análise descritiva, define-se um quadro de dados abrangendo todas as ações ativas, focando especificamente nos dados dos dois últimos anos. Esse recorte temporal é estratégico, pois busca capturar a dinâmica recente do mercado sem a interferência de eventos de magnitude extrema que poderiam distorcer as médias estatísticas.
A função de análise estatística aplicada gera indicadores fundamentais como contagem de observações, média aritmética, desvio padrão, valores mínimos e máximos, além dos percentis de 25%, 50% e 75%. O foco recai sobre a variável de fechamento ajustado, que reflete o valor real do ativo após distribuições de proventos. Um dos critérios operacionais mais relevantes da ferramenta é a identificação de ativos cujo preço atual esteja próximo ao primeiro quartil dos últimos dois anos. Estatisticamente, isso significa que a ação está sendo negociada na faixa dos 25% menores valores históricos do período, o que pode indicar uma oportunidade de valorização futura. Após o processamento em Python, os dados são exportados para o Excel, onde a função de transposição organiza as informações em colunas, facilitando a leitura dos tickers e seus respectivos índices estatísticos.
O desenvolvimento da vertente preditiva utiliza uma arquitetura de rede neural profunda configurada com 35 unidades de memória, camadas de dropout para evitar o ajuste excessivo aos dados de treinamento e uma camada densa de saída. O modelo é treinado utilizando o otimizador Adam e a função de perda de erro quadrático médio. A base de dados para o treinamento abrange um período de 10 anos, garantindo que a rede aprenda padrões de comportamento em diferentes ciclos de mercado. Os dados são normalizados por meio de escalonamento padrão para garantir que a magnitude dos preços não prejudique a convergência do algoritmo. A divisão da amostra reserva 80% dos dados para o treinamento e 20% para a validação, permitindo monitorar o desempenho do modelo em dados não vistos durante o ajuste dos pesos sinápticos.
O fluxo operacional da ferramenta prevê a execução de loops de previsão para um horizonte de 15 dias úteis. A cada iteração, o modelo utiliza os últimos 15 valores observados para gerar a estimativa do dia seguinte, incorporando essa previsão ao conjunto de dados para a próxima etapa. Esse método de janela deslizante permite projetar tendências de curto prazo com maior assertividade. Além da análise de preços, a ferramenta integra a coleta automatizada do índice Preço Sobre Valor Patrimonial para cada ticker selecionado, permitindo que o investidor combine a análise técnica da rede neural com a análise fundamentalista de valor contábil. A integração final ocorre por meio de scripts que automatizam a geração de planilhas prontas para o consumo do usuário, eliminando a necessidade de manipulação manual de códigos complexos.
A aplicação prática da ferramenta com dados reais da CPFL Energia demonstra a capacidade do sistema em processar séries históricas de fechamento ao longo de uma década. A análise visual dos dados históricos permite identificar períodos de alta volatilidade e estabilidade, servindo como base para o entendimento da evolução do preço do ativo. Durante a fase de treinamento do modelo de redes neurais, o monitoramento das perdas de treinamento e validação revela o processo de aprendizado. Uma convergência equilibrada entre essas duas métricas indica que o modelo atingiu um estado robusto, sendo capaz de generalizar padrões sem sofrer de subajuste ou sobreajuste. A comparação direta entre o preço real de fechamento e os valores previstos pelo modelo reflete a precisão da ferramenta em capturar a probabilidade de subida do valor da ação quando esta se encontra abaixo do primeiro quartil.
Os resultados obtidos através de investimentos reais fundamentados pela ferramenta evidenciam um desempenho superior em comparação ao índice Ibovespa no mesmo período. Ao analisar ativos como WHRL3, observou-se uma valorização de 4,44% enquanto o índice de referência apresentou apenas 0,41%. Outros ativos como TAEE11 e LEVE3 também demonstraram resiliência, superando as métricas de mercado. O caso da Kepler Weber destaca-se com uma valorização de 7,96% frente a um Ibovespa de 0,87% no intervalo correspondente. Esses dados quantitativos validam a premissa de que a seleção criteriosa baseada em quartis estatísticos e modelos preditivos de memória de curto prazo potencializa o retorno sobre o capital investido. A análise individualizada de cada ativo permite ao investidor diversificar o risco enquanto busca alfa em relação ao benchmark nacional.
A inclusão de dividendos na análise de performance altera significativamente o panorama de rentabilidade total. Quando somados os proventos distribuídos à valorização nominal dos preços, o ganho de capital acumulado supera consistentemente o desempenho do Ibovespa. No caso do Banco Santander, a valorização de 16,11% saltou para 18,89% com a incorporação de dividendos. O ativo CPFE3 manteve sua performance sólida em 22,01%, enquanto o Bradesco apresentou resultados expressivos, atingindo 27,92% e 32,59% em suas diferentes classes de ações quando considerados os proventos. Essa evidência reforça a importância de uma estratégia de investimento abrangente que não foque apenas na oscilação de preços, mas também na capacidade de geração de renda passiva das empresas selecionadas. A ferramenta, ao consolidar esses dados, oferece uma visão holística do retorno total ao investidor.
A discussão dos resultados à luz da literatura contemporânea revela uma forte consonância com as teorias de ciência de dados aplicadas às finanças. Karasan (2022) enfatiza que a adoção de métodos de aprendizado de máquina representa um avanço na gestão de riscos, permitindo maior assertividade em decisões de compra e venda. Os achados deste estudo corroboram tal perspectiva, uma vez que a ferramenta não apenas identificou oportunidades, mas validou a eficácia de modelos complexos em ambientes de alta incerteza. No entanto, é imperativo reconhecer que a precisão de qualquer modelo preditivo está sujeita a fatores externos não capturados em séries históricas, como choques geopolíticos ou mudanças abruptas na política monetária. A limitação do horizonte preditivo em 15 dias é uma resposta técnica a essa incerteza, priorizando a confiabilidade no curto prazo em detrimento de projeções de longo prazo inerentemente mais falhas.
A racionalidade na tomada de decisão financeira é frequentemente limitada pela assimetria informacional, onde diferentes agentes possuem acesso desigual a dados relevantes. A ferramenta proposta atua como um equalizador, fornecendo ao investidor individual capacidades analíticas antes restritas a grandes instituições. Conforme apontado por Prado (2018), o uso de algoritmos sofisticados para lidar com grandes volumes de dados e mitigar vieses estatísticos é essencial na análise financeira moderna. O emprego de redes neurais profundas proporciona ganhos expressivos na gestão de riscos, alinhando-se à necessidade de abordagens interdisciplinares que considerem tanto a estatística pura quanto o contexto macroeconômico. A validação metodológica realizada através de investimentos reais demonstra que a integração entre a teoria clássica de quartis e a tecnologia de ponta em inteligência artificial cria um sistema de suporte à decisão resiliente.
A análise da valorização dos ativos isoladamente mostra que, em grande parte das situações, os retornos obtidos foram superiores ao desempenho do Ibovespa. Esse resultado reforça a premissa de que a seleção baseada em dados estatísticos de quartis pode identificar pontos de entrada favoráveis. A estratégia de buscar ativos negociados próximos ao seu valor mínimo de dois anos baseia-se na reversão à média e no potencial de recuperação cíclica. Quando essa análise é complementada pela previsão da rede neural, o investidor ganha uma camada adicional de segurança, confirmando se a tendência de curto prazo é de fato ascendente. A robustez do modelo é testada diariamente pela volatilidade do mercado, e a manutenção de uma correlação forte entre preços reais e previstos é o principal indicador de sucesso técnico da implementação.
Apesar dos resultados positivos, o reconhecimento das limitações é fundamental para o uso responsável da ferramenta. O modelo demonstrou eficácia especificamente no contexto do mercado brasileiro e para o horizonte temporal de 15 dias. Fatores como conflitos internacionais em regiões produtoras de petróleo podem impactar ativos de energia e commodities de forma imprevisível por modelos baseados exclusivamente em preços históricos. Portanto, a ferramenta deve ser utilizada como um suporte à decisão, e não como um substituto para o julgamento crítico do investidor. A sugestão para pesquisas futuras inclui a integração de análise de sentimento de notícias e indicadores macroeconômicos globais ao modelo de redes neurais, visando aumentar a robustez frente a eventos sistêmicos. A evolução contínua do algoritmo e a inclusão de novas variáveis podem expandir a capacidade preditiva para horizontes mais longos e outros mercados internacionais.
A integração técnica entre Python e Excel provou ser o diferencial para a usabilidade do sistema. Ao automatizar a coleta, o tratamento, a modelagem e a exportação dos dados, reduziu-se drasticamente o tempo necessário para a análise de uma carteira diversificada. O que antes exigiria horas de pesquisa manual em diferentes plataformas de investimento agora é processado em minutos por scripts otimizados. A facilidade de visualizar os resultados em um ambiente familiar como o Excel permite que o investidor foque na estratégia e na gestão de portfólio, deixando a carga de processamento pesado para o algoritmo. Essa democratização do acesso a ferramentas de ciência de dados é um passo importante para o amadurecimento do investidor individual no Brasil, promovendo decisões baseadas em evidências quantitativas em vez de intuições ou especulações sem fundamento técnico.
A análise dos dados de valorização do Ibovespa no período, que variou entre quedas de 4,28% em meses de baixa e altas de 6,54% em momentos de recuperação, serve como o pano de fundo necessário para avaliar o mérito das escolhas de ativos. Superar o índice em meses de retração ou acompanhar com ganhos superiores em meses de alta demonstra a eficácia da filtragem por primeiro quartil. A consistência dos resultados em diferentes janelas mensais sugere que a ferramenta possui uma capacidade de adaptação às mudanças de humor do mercado. A validação final, dada pelo retorno financeiro real e pela superação dos benchmarks, consolida a ferramenta como um instrumento valioso para a navegação no complexo cenário da renda variável brasileira, unindo rigor acadêmico e aplicabilidade prática.
Conclui-se que o objetivo foi atingido, uma vez que a ferramenta híbrida integrando Python e Excel demonstrou ser eficaz no suporte à decisão de investimentos em ações na B3. A utilização de redes neurais Long Short-Term Memory, aliada à análise descritiva baseada no primeiro quartil e indicadores como Preço Sobre Valor Patrimonial, permitiu a identificação de ativos com potencial de valorização superior ao índice Ibovespa. Os testes práticos e investimentos reais validaram a precisão do modelo para previsões de curto prazo, evidenciando que a inclusão de dividendos na análise de performance é essencial para a maximização do retorno total. Embora existam limitações relacionadas a fatores geopolíticos e horizontes temporais extensos, a solução desenvolvida oferece uma interface acessível e robusta para investidores que buscam fundamentação estatística e tecnológica em suas estratégias de alocação de capital.
Referências Bibliográficas:
Fávero, L.P.; Belfiore, P. 2024. Análise de dados: Modelos estatísticos e computacionais aplicados. 3ed. Elsevier, São Paulo, SP, Brasil.
Hochreiter, S.; Schmidhuber, J. 1997. Long short-term memory. Neural Computation 9(8):1735-1780.
Karasan, A. 2022. Machine Learning for Financial Risk Management with Python. 1ed. O’Reilly Media, Sebastopol, CA, Estados Unidos.
Nomad Global. 2025. Tickers: o que são, como funcionam e como interpretar? Disponível em: <https://www.nomadglobal.com/portal/artigos/tickers>. Acesso em: 15 jul. 2025.
Portal do Investidor. 2024. Noções Fundamentais de Investimento: Construindo um Futuro Financeiro Sólido. Disponível em:< https://www.gov.br/investidor/pt-br/nocoes-fundamentais-de-investimento-construindo-um-futuro-financeiro-solido-3>. Acesso em: 25 jun. 2025.
Prado, M. L. 2018. Advances in Financial Machine Learning. 1ed. Wiley, Hoboken, NJ, Estados Unidos.
Python Software Foundation. 2025. The Python Language Reference. Disponível em: <https://docs.python.org/pt-br/3.13/reference/index.html>. Acesso em: 16 mar. 2025.
Rodrigues, W.C. 2007. Metodologia Científica (PPT). 1ed. FAETEC/IST, Paracambi, Rio de Janeiro, Brasil.
Status Invest. 2020. P/VP. Disponível em: <https://statusinvest.com.br/termos/p/p-vp>. Acesso em: 15 jul. 2025.
Resumo executivo oriundo de Trabalho de Conclusão de Curso da Especialização em Data Science e Analytics do MBA USP/Esalq
Para saber mais sobre o curso clique aqui






































