Resumo Executivo

23 de fevereiro de 2026

Efeito do aporte financeiro das SAFs no desempenho de clubes de futebol brasileiro

Matheus Zicarelli Rojas Gomes; Felipe Nathan Ferreira Dos Santos

Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.

Esta pesquisa analisa o impacto do aporte financeiro, com ênfase nas Sociedades Anônimas do Futebol (SAFs), no desempenho esportivo dos clubes brasileiros, correlacionando o valor de mercado das equipes com indicadores como vitórias, gols e posição final. O futebol é um fenômeno cultural e econômico global (Giulianotti e Robertson, 2004), com especial relevância no Brasil. A profissionalização da gestão culminou na Lei nº 14.193/2021, que instituiu a SAF, permitindo que clubes, tradicionalmente associações civis, se transformassem em empresas para captar investimentos e adotar governança corporativa.

A premissa do modelo SAF é que a gestão empresarial e o aporte de capital melhoram o desempenho esportivo. Relatórios da Ernst & Young (2022) e da Sports Value (2023) indicam que clubes que aderiram ao modelo adotam governança mais transparente e que a valorização, esportiva e financeira, está ligada à qualidade da gestão e ao volume de capital investido. Isso se alinha à teoria dos recursos e capacidades (Barney, 1991); recursos valiosos e raros, como atletas de alto nível e infraestrutura, geram vantagem competitiva sustentável.

A literatura acadêmica sobre o contexto brasileiro pós-SAFs é incipiente, em contraste com estudos internacionais que já estabeleceram a correlação entre fatores econômicos e desempenho. Szymański e Kuypers (1999) demonstraram na Premier League inglesa que maiores folhas salariais resultam em melhores classificações, relação reforçada por Kuper e Szymański (2014). Mais recentemente, Heijboer (2022), usando aprendizado de máquina em cinco grandes ligas europeias, identificou variáveis financeiras como os preditores mais eficazes dos resultados, explicando até 53,7% da acurácia em modelos de Random Forest.

A eficácia desses investimentos no cenário brasileiro, contudo, carece de comprovação empírica detalhada. A dinâmica nacional pode modular a relação entre capital e desempenho de forma distinta da Europa. Esta pesquisa busca preencher essa lacuna com uma análise quantitativa rigorosa dos dados do Campeonato Brasileiro da Série A, abrangendo o período de 2003 a 2024. Utilizando modelos preditivos, o estudo testa a hipótese de que o poderio financeiro é determinante para o sucesso, quantificando a magnitude desse efeito e os mecanismos de sua manifestação, com o objetivo de oferecer insights para gestores, investidores e formuladores de políticas.

Foi conduzida uma pesquisa quantitativa, descritiva e aplicada, analisando dados estruturados para avaliar a relação entre valor de mercado e desempenho. A base de dados integrou informações da plataforma Basedosdados. org (estatísticas de partidas) e do site Transfermarkt (valores de mercado), com coleta via web scraping (Gomes, 2023). O período de análise compreendeu as temporadas de 2003 a 2024.

O tratamento dos dados foi uma etapa crítica. Registros de 2003 a 2006 foram excluídos devido à ausência de dados de valor de mercado. Colunas com mais de 60% de valores ausentes foram removidas. Para variáveis centrais com valores ausentes, como valor de mercado e idade média, foi adotada a imputação baseada na média do time no ano correspondente. Anomalias nos valores de mercado de 2023 e 2024 foram corrigidas com a substituição por médias históricas de 2020 a 2022, abordagem recomendada por Delen e Ram (2018).

A engenharia de features enriqueceu o conjunto de dados. Foram criadas variáveis como a diferença de valor de mercado (difvalormercado) e de colocação (difcolocacao), preditores importantes segundo Frick (2007) e Müller et al. (2017). Foram incorporadas variáveis institucionais para identificar clubes SAF (ehsafmandante, ehsaf_visitante) e de desempenho recente, como a média móvel de gols. A segmentação dos clubes em quartis de valor de mercado, inspirada em Tukey (1977), permitiu a comparação de desempenho entre diferentes faixas de investimento.

A análise ocorreu em duas fases: Análise Exploratória de Dados (EDA) e modelagem preditiva. Foram implementados dois algoritmos para prever o resultado das partidas: Random Forest, escolhido por sua robustez (Breiman, 2001), e Regressão Logística Multinomial, por sua interpretabilidade (James et al., 2013). Para lidar com o desbalanceamento de classes, aplicou-se SMOTE (Chawla et al., 2002) e ajuste de pesos de classe. A avaliação dos modelos baseou-se em métricas como precisão, recall e F1-score (Sokolova e Lapalme, 2009; Powers, 2011). A importância das variáveis foi estimada por redução de impureza e por permutação (Molnar, 2020).

A análise exploratória por quartis de valor de mercado revelou padrões consistentes. A comparação entre o quartil de menor investimento (Q1) e o de maior (Q4) demonstrou diferenças expressivas. Clubes com elencos mais valiosos (valor médio de R$ 38,67 milhões no Q4) tiveram uma posição média na tabela (7,19ª) substancialmente melhor que a dos clubes do Q1 (14,16ª). Essa superioridade se manifestou em campo: times do Q4 marcaram 25,5% mais gols em casa (1,67 contra 1,33), sofreram 17,6% menos gols (0,89 contra 1,08) e tiveram uma produção ofensiva no primeiro tempo 33,8% superior. O público médio nos estádios dos clubes do Q4 foi 28% maior.

A matriz de correlação confirmou uma correlação negativa moderada (-0,44) entre o valor do elenco mandante e sua colocação, indicando que maior valor corresponde a uma melhor classificação. A correlação com os gols marcados foi positiva, mas fraca (0,11). A idade média dos jogadores não se mostrou um fator preditivo relevante. A análise visual da distribuição dos resultados por quartil demonstrou que a proporção de vitórias do mandante aumenta progressivamente do Q1 para o Q4, enquanto vitórias do visitante e empates diminuem, mostrando que o investimento financeiro amplifica a vantagem de jogar em casa.

Na modelagem preditiva, o Random Forest apresentou o melhor desempenho geral. A versão otimizada sem SMOTE alcançou 56% de acurácia, mas com um baixo F1-score macro (0,35). A aplicação do SMOTE, embora tenha reduzido a acurácia para 49%, melhorou o equilíbrio do modelo, elevando o F1-score macro para 0,40 e a acurácia balanceada para 41%. A principal dificuldade de todos os modelos foi a previsão de empates, cujo F1-score máximo foi de apenas 0,24. Os modelos de Regressão Logística tiveram desempenho inferior, com o melhor modelo alcançando um F1-score macro de 0,44 e F1-score de 0,28 para empates.

A análise da importância das variáveis, em ambos os modelos, confirmou que a difvalormercado (diferença de valor de mercado entre os times) foi o preditor mais importante. No Random Forest, sua importância foi de 0,154, enquanto na Regressão Logística, a importância por permutação foi a mais alta, com 0,019. Este resultado confirma empiricamente que as assimetrias financeiras são o principal motor da hierarquia competitiva no futebol brasileiro, alinhando-se aos achados de Szymanski e Kuypers (1999). O valor bruto dos elencos também se mostrou decisivo, com valorequipetitularvisitante (importância de 0,123 no RF) e valorequipetitularmandante (0,119 no RF) entre os preditores mais relevantes. A alta importância do valor do time visitante sugere que o capital é um mecanismo para mitigar as desvantagens de jogar fora de casa, como proposto por Fort et al. (1995).

Crucialmente, as variáveis relacionadas à adoção do modelo SAF (ehsafmandante, ehsafvisitante, dif_saf) apresentaram importância preditiva próxima de zero em todas as configurações de modelo, com a soma da importância não ultrapassando 0,004 no Random Forest. Este achado indica que o modelo jurídico da SAF, por si só, não é um determinante direto do desempenho esportivo no curto prazo. Em vez disso, os resultados sugerem que as SAFs atuam como um mecanismo facilitador para a captação de capital, e o impacto no desempenho ocorre de forma indireta, mediado pelo aumento do valor de mercado do elenco que esse capital proporciona. Esta conclusão valida a perspectiva de que as SAFs são um instrumento de governança e financiamento, cujo sucesso esportivo depende da alocação eficiente dos recursos, conforme discutido por Macedo e Amorim (2023) e em linha com a teoria de mediação financeira de Andreff (2007).

Em síntese, os resultados demonstram que o poder financeiro, expresso principalmente pela diferença de valor de mercado entre os competidores, é o principal preditor do sucesso esportivo no Campeonato Brasileiro. A análise quantitativa e os modelos preditivos confirmam que clubes com maior capacidade de investimento tendem a obter melhores posições na tabela, marcar mais gols e vencer mais partidas, especialmente quando atuam como mandantes.

A dificuldade em prever empates e vitórias de visitantes, mesmo com técnicas avançadas como o SMOTE, sublinha a alta variabilidade e o componente de aleatoriedade presentes no futebol. O desempenho do modelo Random Forest, com uma acurácia balanceada de 41%, embora modesto, está alinhado com o estado da arte na literatura de predição de futebol; modelos raramente superam a barreira de 55-60% de acerto (Bunker e Susnjak, 2022).

As implicações práticas destes achados são relevantes para gestores e investidores. A adoção do modelo SAF deve ser vista não como um fim em si mesma, mas como um meio estratégico para atrair capital. O retorno esportivo não é automático e dependerá da capacidade de converter o investimento financeiro em um elenco mais valioso e competitivo. A forte influência do valor do time visitante também sugere que investimentos robustos podem ser uma estratégia eficaz para neutralizar a desvantagem de jogar fora de casa, o que pode acentuar a disparidade competitiva na liga a longo prazo.

O estudo confirmou a existência de uma relação direta e significativa entre o aporte financeiro e o sucesso esportivo no futebol brasileiro. A análise da importância das variáveis revelou que a diferença de valor de mercado entre as equipes é o preditor mais poderoso do resultado de uma partida. O modelo Random Forest se mostrou a ferramenta mais adequada para capturar as complexas relações não-lineares presentes nos dados. A pesquisa também esclareceu o papel das SAFs, que atuam como catalisadoras de capital, cujo impacto no desempenho é mediado pelo aumento do valor do elenco, e não como um fator direto de sucesso em curto prazo. Reconhece-se como limitação do estudo o horizonte temporal ainda curto desde a implementação massiva das SAFs, o que sugere a necessidade de futuras pesquisas longitudinais. Além disso, o uso do valor de mercado como principal proxy para o poder financeiro abre espaço para investigações futuras que incorporem outras variáveis. Conclui-se que o objetivo foi atingido: analisou-se o impacto do aporte financeiro no desempenho esportivo dos clubes brasileiros, verificando-se que a diferença de valor de mercado é o principal preditor de sucesso, enquanto o modelo SAF atua como um mediador indire

Referências:
Andreff, W. 2007. French football: a financial crisis rooted in weak governance. Journal of Sports Economics 8(6): 652-661.
Barney, J. 1991. Firm resources and sustained competitive advantage. Journal of Management 17(1): 99-120.
Breiman, L. 2001. Random forests. Machine Learning 45(1): 5-32.
Bunker, R.; Susnjak, T. 2022. The application of machine learning techniques for predicting match results in team sport: a review. Journal of Artificial Intelligence Research 73: 1285-1322.
Chawla, N. V.; Bowyer, K. W.; Hall, L. O.; Kegelmeyer, W. P. 2002. SMOTE: Synthetic Minority Over-sampling Technique. Journal of Artificial Intelligence Research, 16: 321-357.
Delen, D.; Ram, S. 2018. Research challenges and opportunities in sports analytics. Information Systems 87: 101-104.
Ernst & Young [EY]. 2022. O Futuro do Futebol Brasileiro: Uma Visão Estratégica para os Clubes. Disponível em: https://assets. ey. com. Acesso em: 03 ago. 2025.
Fort, R.; Quirk, J. 1995. Cross-subsidization, incentives, and outcomes in professional team sports leagues. Journal of Economic Literature 33(3): 1265-1299.
Frick, B. 2007. The football players’ labor market: empirical evidence from the major European leagues. Scottish Journal of Political Economy 54(3): 422-446.
Géron, A. 2019. Mãos à Obra: Inteligência Artificial com Scikit-Learn, Keras e TensorFlow. 2ed. Alta Books, Rio de Janeiro, RJ, Brasil.
Giulianotti, R.; Robertson, R. 2004. The globalization of football: a study in the glocalization of the ‘serious life’. The British Journal of Sociology 55(4): 545-568.
Gomes, L. J.; Oliveira, L. B.; Castro, R. S. 2023. Scraperci: um web scraper para coleta de dados científicos. Encontros Bibli: Revista Eletrônica de Biblioteconomia e Ciência da Informação 28(0): 1-21.
Heijboer, D. 2022. Using machine learning to predict football match outcomes in European leagues. Master’s Thesis. Delft University of Technology, Delft, Netherlands.
James, G.; Witten, D.; Hastie, T.; Tibshirani, R. 2013. An Introduction to Statistical Learning: with Applications in R. Springer, New York, NY, USA.
Kuper, S.; Szymański, S. 2014. Os Números do Jogo: Por que Tudo o que Você Sabe sobre Futebol está Errado. Paralela, São Paulo, SP, Brasil.
Macedo, G. A.; Amorim, P. K. F. 2023. A Sociedade Anônima do Futebol (SAF) como instrumento de recuperação e soerguimento do futebol brasileiro. Revista de Direito, Governança e Novas Tecnologias 9(1): 129-148.
Manning, C. D.; Raghavan, P.; Schütze, H. 2008. Introduction to Information Retrieval. Cambridge, UK: Cambridge University Press.
Molnar, C. 2020. Interpretable machine learning: a guide for making black box models explainable. 2. ed. Independently published, [S. l.]. Disponível em: https://christophm. github. io/interpretable-ml-book/. Acesso em: 03 ago. 2025.
Moore, D. S.; McCabe, G. P.; Craig, B. A. 2017. Introduction to the Practice of Statistics. 9ed. W. H. Freeman, New York, NY, USA.
Müller, O.; Simons, A.; Weinmann, M. 2017. Beyond crowd judgments: data-driven estimation of market value in association football. European Journal of Operational Research 263(2): 611-624.
Powers, D. M. W. 2011. Evaluation: from precision, recall and F-measure to ROC, informedness, markedness and correlation. Journal of Machine Learning Technologies 2(1): 37-63.
SCIKIT-LEARN DEVELOPERS. 2025. Scikit-learn: machine learning in Python. [s. n.], [s. l.]. Disponível em: https://scikit-learn. org. Acesso em: 6 set. 2025.
Silva, J. C. 2023. Efeito do Mando de Campo para os Clássicos de Maiores Torcidas de Brasil e Argentina. Dissertação de Mestrado em Economia Aplicada. Universidade Federal de Viçosa, Viçosa, MG, Brasil.
Sokolova, M.; Lapalme, G. 2009. A systematic analysis of performance measures for classification tasks. Information Processing & Management 45(4): 427-437.
Sports Value. 2023. Relatório Anual SAFs 2023. Disponível em: <https://sportsvalue. com. br/>. Acesso em: 03 ago. 2025.
Szymański, S.; Kuypers, T. 1999. Winners and Losers: The Business Strategy of Football. Viking, London, UK.
Tukey, J. W. 1977. Exploratory data analysis. 1. ed. Addison-Wesley, Reading, MA, USA.

Resumo executivo oriundo de Trabalho de Conclusão de Curso de Especialização em Data Science e Analytics do MBA USP/Esalq

Saiba mais sobre o curso; clique aqui:

Quem editou este artigo

Mais recentes

Você também pode gostar

Quer ficar por dentro das nossas últimas publicações? Inscreva-se em nossa newsletter!

Receba conteúdos e fique sempre atualizado sobre as novidades em gestão, liderança e carreira com a Revista E&S.

Ao preencher o formulário você está ciente de que podemos enviar comunicações e conteúdos da Revista E&S. Confira nossa Política de Privacidade