
19 de fevereiro de 2026
Aplicação da Regressão múltipla na estimativa de P/B e identificação de desvios de precificação
Ricardo da Cunha Seifert Claudio; Edilson José Rodrigues
Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.
O objetivo deste estudo é explorar como a regressão múltipla, uma técnica de Machine Learning, pode ser utilizada para estimar o indicador P/B (Price to Book Ratio) no setor bancário do mercado espanhol. A pesquisa busca construir um modelo preditivo para observar como o mercado precifica as instituições bancárias em função de seus fundamentos, permitindo identificar desvios de valoração e compreender quais fatores explicam o comportamento do P/B Ratio. A análise se baseia em um conjunto de indicadores financeiros chave: Return on Equity (ROE), Common Equity Tier 1 (CET1), Net Interest Margin (NIM), Non Performing Loan (NPL) e o Efficiency Ratio, visando contribuir para a tomada de decisão baseada em evidências quantitativas.
O ambiente financeiro contemporâneo exige o aprimoramento contínuo das metodologias de avaliação. Nesse contexto, algoritmos de Machine Learning surgem como ferramentas indispensáveis para analisar o grande volume de dados gerado pelos mercados e identificar padrões complexos que escapam às abordagens tradicionais. A valoração de ações, especialmente a identificação de ativos subvalorizados, é um desafio perene no campo das finanças, como documentado por Damodaran (2012). Tradicionalmente, essa tarefa depende de métodos de análise fundamentalista, que se baseiam na avaliação de demonstrativos financeiros e variáveis macroeconômicas, uma abordagem consolidada por estudos como o de Ohlson (1995).
Indicadores financeiros são essenciais para diagnosticar a saúde de uma empresa, mas a comparação entre companhias é dificultada pela heterogeneidade de suas operações. A dificuldade em encontrar pares de comparação perfeitamente alinhados exige a gestão das dissonâncias por meio de mecanismos estatísticos, como o modelo de regressão multivariada, conforme sugere Damodaran (2012). Estudos recentes reforçam a sinergia entre Machine Learning e os métodos clássicos de avaliação. Gu, Kelly e Xiu (2020) demonstram que a integração de algoritmos de aprendizado de máquina pode melhorar substancialmente a identificação de ações com potencial de valorização, superando as limitações da análise puramente humana.
Investidores enfrentam o desafio de determinar se o preço de mercado de uma ação reflete seus fundamentos, já que o mercado frequentemente incorpora ruídos e movimentos especulativos. Isso cria uma demanda por metodologias quantitativas robustas para avaliar o “valor justo” de uma ação. No setor bancário, indicadores como ROE, CET1, NIM e NPL são amplamente empregados para mensurar a saúde e o potencial de uma instituição financeira, como evidenciado nos trabalhos de Barth, Beaver e Landsman (1996), Demirguç-Kunt e Huizinga (1999) e Calomiris e Nissim (2007). Esses indicadores permitem uma compreensão da eficiência na utilização do capital e da resiliência da instituição.
A importância deste estudo reside na necessidade de soluções inovadoras para a análise de investimentos em um ambiente de alta volatilidade e volume de informações. Ao adotar uma abordagem baseada em dados e metodologias estatísticas, a pesquisa visa oferecer subsídios para investidores aprimorarem seus processos decisórios. A delimitação do estudo ao setor bancário espanhol, utilizando três dos principais ativos do índice IBEX 35, permite uma exploração focada. A representatividade desses ativos é notável: em 25 de setembro de 2025, o volume de ações negociadas desses três bancos representou 64% do total, enquanto o valor transacionado atingiu 84% do total na Bolsa da BME (Bolsas y Mercados Españoles), sublinhando sua relevância sistêmica.
Para a condução do estudo, foram coletados dados trimestrais de três importantes ativos do setor bancário espanhol, abrangendo o período de 2020 a 2024. A escolha por dados trimestrais visou uma análise mais granular do comportamento das instituições. Os ativos selecionados são integrantes do IBEX 35, principal índice do mercado acionista espanhol. Os dados foram extraídos de relatórios de resultados e portais de relacionamento com investidores de cada empresa, garantindo a fidedignidade das informações.
A partir dessa base, foram calculados os indicadores financeiros para servirem como variáveis independentes. O Return on Equity (ROE), razão entre lucro líquido e patrimônio líquido, mede a capacidade de gerar lucro a partir do capital dos acionistas. Conforme Wet e Toit (2007), o ROE é um dos múltiplos mais utilizados para analisar o desempenho financeiro. O Common Equity Tier 1 (CET1), capital de mais alta qualidade, é calculado pela divisão do capital principal pelos ativos ponderados pelo risco e sinaliza a solidez do banco. A Net Interest Margin (NIM) mede a diferença entre a receita de juros e o custo dos depósitos, dividida pelos ativos que geram juros. Saksonova (2014) aponta que o NIM oferece uma síntese da eficiência da gestão de ativos.
Adicionalmente, o Efficiency Ratio, calculado pela divisão dos gastos operacionais pela receita bruta, foi incluído para mensurar o controle de custos. Por fim, o Non Performing Loans (NPL), proporção de empréstimos com pagamentos em atraso sobre o total da carteira, foi utilizado como medida do risco de crédito. Cheng (2025) ressalta que o NPL é essencial para mensurar a eficácia na gestão do risco. Com esses indicadores, foi formulado o modelo de regressão múltipla, tendo o P/B Ratio como variável dependente, conforme a equação: P/B Ratio = α + β₁·ROE + β₂·CET1 + β₃·NIM + β₄·NPL + β₅·Eficiência + ε. Esta escolha permite investigar como os fundamentos influenciam a percepção de valor do mercado.
A implementação e os cálculos foram realizados em Python, com os pacotes pandas, numpy, statsmodels e statstests. Essa abordagem computacional garantiu agilidade, precisão e replicabilidade. O processo de modelagem incluiu o tratamento das variáveis, testes de multicolinearidade para verificar a correlação entre as preditoras e a análise de resíduos para validar os pressupostos do modelo de regressão. Este cuidado metodológico foi fundamental para garantir que as conclusões fossem consistentes e estatisticamente fundamentadas.
A adoção de critérios metodológicos rigorosos foi imprescindível. Como todas as variáveis eram quantitativas, o pré-processamento para variáveis categóricas foi desnecessário. A estatística descritiva inicial revelou uma média de P/B Ratio de 0.735, com desvio padrão de 0.184, indicando diferentes níveis de valoração. O ROE médio de 10.78% e o CET1 médio de 12.47% sugerem um setor com rentabilidade e capitalização saudáveis no período. Desde o início, foi dedicada atenção à verificação da correlação entre as variáveis para evitar multicolinearidade, que, segundo Fávero e Belfiorde (2017), ocorre quando há elevada correlação entre preditoras, comprometendo a estabilidade do modelo.
A análise da matriz de correlação confirmou a suspeita. Observou-se que a variável dependente, P/B Ratio, demonstrava forte correlação positiva com o ROE e elevada correlação negativa com o Efficiency Ratio. Mais importante, foi identificada correlação significativa entre as próprias variáveis explicativas, reforçando a necessidade de mitigar os efeitos da multicolinearidade. Essa constatação indicava que o modelo final provavelmente não incluiria todas as variáveis originais. Diante disso, tornou-se imprescindível a adoção do método de seleção de variáveis “stepwise” para selecionar, de forma objetiva, o subconjunto de variáveis mais relevante.
Como resultado do procedimento “stepwise”, as variáveis Net Interest Margin (NIM) e Efficiency Ratio foram removidas do modelo. Embora estatisticamente significantes em modelos de regressão simples, sua inclusão no modelo multivariado tornou-se desnecessária, pois a presença de outras variáveis com forte capacidade explicativa absorveu seu efeito. A exclusão, realizada com um nível de significância de 5%, resultou em um modelo mais parcimonioso. Como alertam Fávero e Belfiorde (2017), o processo “stepwise” pode gerar um problema de especificação pela omissão de variáveis relevantes, mas, neste contexto, o ajuste garantiu maior precisão à análise.
O modelo final ajustado, contendo as variáveis ROE, CET1 e NPL, apresentou um R² de 70,3%, indicando que explica 70,3% da variabilidade do P/B Ratio, uma capacidade explicativa excelente. O R² ajustado atingiu 68,7%, corroborando a alta qualidade do ajuste. A análise dos coeficientes revelou que todas as variáveis preditoras remanescentes têm um impacto estatisticamente significativo. O coeficiente para o ROE foi de 0.0307, indicando que, para cada ponto percentual de aumento no retorno sobre o patrimônio, o P/B Ratio tende a aumentar 0.0307 unidades. Isso sugere que investidores pagam múltiplos mais altos por ações de bancos mais rentáveis.
O coeficiente da variável Common Equity Tier 1 (CET1) foi de 0.0509, mostrando que bancos com níveis mais elevados de capital de alta qualidade são mais bem avaliados pelo mercado. Este resultado reflete a preferência dos investidores por estruturas patrimoniais robustas, percebidas como um sinal de menor risco e maior resiliência. Em contrapartida, a variável Non Performing Loans (NPL) apresentou um coeficiente negativo de -0.1293. Isso indica que, para cada ponto percentual de aumento na proporção de empréstimos não performados, o P/B Ratio sofre uma queda de 0.1293 unidades. O mercado penaliza severamente instituições com má qualidade na carteira de crédito, interpretando NPLs elevados como falha no controle de risco.
Para garantir a validade estatística do modelo, foram realizados testes de diagnóstico. Para verificar a normalidade dos resíduos, foi empregado o teste de Shapiro-Francia, que apresentou um p-valor de 0.1389, superior ao nível de significância de 0.05. Portanto, a hipótese nula de que os resíduos seguem uma distribuição normal não foi rejeitada. Para confirmar que o método “stepwise” resolveu a multicolinearidade, foi calculado o VIF (Variance Inflation Factor). Os valores foram de 1.169 para ROE, 1.140 para CET1 e 1.153 para NPL, todos baixos e próximos de 1, indicando ausência de multicolinearidade problemática.
A capacidade preditiva do modelo foi avaliada comparando os valores de P/B Ratio estimados com os valores reais observados em 2024. Os resultados demonstraram consistência. Para o Banco Nº 3 no quarto trimestre de 2024, o P/B real foi de 0,85 e o estimado foi de 0,86. Para o Banco Nº 2 no segundo trimestre de 2024, o modelo previu exatamente o valor real de 1,00. Embora algumas previsões tenham apresentado desvios maiores, como no caso do Banco Nº 2 no primeiro trimestre de 2024 (diferença de -0,29), a proximidade geral entre os valores calculados e os reais evidencia o potencial preditivo da metodologia.
A análise dos indicadores e a construção do modelo de regressão demonstraram a importância de uma abordagem metodológica rigorosa. O estudo revelou a forte correlação entre as variáveis explicativas, um desafio comum em análises financeiras. A mitigação da multicolinearidade através do método “stepwise” foi fundamental para a robustez dos resultados, culminando em um modelo parcimonioso. A exclusão de variáveis como NIM e Efficiency Ratio não diminui sua importância isolada, mas indica que seus efeitos já estavam capturados por outras variáveis mais dominantes no modelo final.
As variáveis cruciais no modelo final foram ROE, CET1 e NPL. Estes indicadores destacaram-se por sua significância estatística e por oferecerem uma perspectiva quantitativa sobre os critérios de valoração do mercado. Os resultados evidenciam que o mercado valoriza instituições que aliam elevada rentabilidade (ROE positivo), solidez de capital (CET1 positivo) e gestão de crédito de alta qualidade, refletida em baixos níveis de inadimplência (NPL negativo). Esse equilíbrio é essencial para sustentar valuations elevados no setor. O modelo desenvolvido pode servir como base para a avaliação de desempenho bancário e precificação de ativos. Conclui-se que o objetivo foi atingido: demonstrou-se que a regressão múltipla é uma ferramenta eficaz para estimar o P/B Ratio e identificar seus principais determinantes fundamentais no setor bancário espanhol.
Referências:
BARTH, M. E.; BEAVER, W. H.; LANDSMAN, W. R. Value-relevance of banks’ fair value disclosures under SFAS 107. The Accounting Review, v. 71, n. 4, p. 513-537, 1996.
CALOMIRIS, C. W.; NISSIM, D. Activity-based valuation of bank holding companies. Journal of Accounting, Auditing & Finance, v. 22, n. 1, p. 1-42, 2007.
CHENG, Sihan. Non-Performing Loan as a Metric of Credit Risk Management in Banking. In: Proceedings of ICMRED 2025 Symposium: Effective Communication as a Powerful Management Tool. DOI: 10.54254/2754-1169/2025. BL23894, p. 63, 2025.
DAMODARAN, A. Investment valuation: tools and techniques for determining the value of any asset. 3. ed. Hoboken: Wiley, 2012.
DEMIRGÜÇ-KUNT, A.; HUIZINGA, H. Determinants of commercial bank interest margins and profitability: some international evidence. The World Bank Economic Review, v. 13, n. 2, p. 379-408, 1999.
FÁVERO, Luiz Paulo Lopes; BELFIORE, Patrícia Prado. Manual de análise de dados: estatística e modelagem multivariada com Excel, SPSS e Stata. Rio de Janeiro: Elsevier, 2017.
GU, Shihao; KELLY, Bryan; XIU, Dacheng. Empirical asset pricing via machine learning. Review of Financial Studies, v. 33, n. 5, p. 2223–2273, 2020.
OHLSON, J. A. Earnings, book values, and dividends in equity valuation. Contemporary Accounting Research, v. 11, n. 2, p. 661-687, 1995.
SAKSONOVA, Svetlana. The Role of Net Interest Margin in Improving Banks’ Asset Structure and Assessing the Stability and Efficiency of their Operations. Procedia – Social and Behavioral Sciences, v. 150, p. 132–141, 2014.
WET, J. H. v. H. and TOIT, E. (2007). Return on equity: A popular, but flawed measure of corporate financial performance S. Afr. J. Bus. Manage., 38(1), 1-11.
Resumo executivo oriundo de Trabalho de Conclusão de Curso de Especialização em Data Science e Analytics do MBA USP/Esalq
Saiba mais sobre o curso; clique aqui:





































