15 de janeiro de 2026
Avaliação de desempenho do Esporte Clube Vitória com análise de componentes principais
Autor(a): Victória De Jesus Macedo — Orientador(a): Ana Julia Righetto
Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.
Este trabalho aplicou a Análise de Componentes Principais (ACP) a bancos de dados de desempenho de equipes e jogadores do Esporte Clube Vitória nos campeonatos de 2022, 2023 e 2024, para identificar os fatores latentes que mais influenciam a performance esportiva. A investigação, por meio da redução dimensional de um vasto conjunto de variáveis, buscou extrair componentes que sintetizam padrões de jogo coletivos e características individuais dos atletas. A interpretação desses componentes visa orientar decisões táticas, técnicas e gerenciais, oferecendo um diagnóstico quantitativo para monitoramento contínuo, especialmente em um cenário de recursos financeiros limitados. A análise propõe a construção de rankings de desempenho comparáveis aos resultados reais das competições, validando a metodologia como instrumento de suporte à decisão para clubes que buscam otimizar sua competitividade.
O futebol brasileiro atravessa uma transformação estrutural impulsionada pela Lei nº 14.193/2021, que instituiu a Sociedade Anônima do Futebol (SAF). Este modelo tem atraído investimentos, elevando a competitividade. Segundo Garcia (2024), a governança robusta e a gestão financeira eficiente do modelo SAF influenciam diretamente a performance esportiva, resultando em desempenho superior em comparação com clubes de estruturas associativas. Este fenômeno cria um desequilíbrio, onde clubes com menor poder de investimento, como o Esporte Clube Vitória, enfrentam o desafio de se manterem relevantes. A crescente popularidade do esporte, com médias de público recordes no Campeonato Brasileiro (Globo Esporte, 2024; Lance, 2024), intensifica a pressão por resultados, tornando a gestão inteligente de recursos um fator crítico.
Neste cenário de disparidade econômica, a análise de dados emerge como ferramenta estratégica. A capacidade de extrair insights de estatísticas de desempenho permite que clubes com orçamentos restritos otimizem suas decisões. O caso do Oakland Athletics no beisebol, popularizado como “Moneyball”, demonstra como métodos analíticos podem identificar atletas subvalorizados, permitindo a montagem de um elenco competitivo com uma folha de pagamento inferior à dos concorrentes (Gavião et al., 2017). Esta abordagem, focada na eficiência de dados, contrasta com métodos tradicionais de avaliação subjetiva e oferece um caminho para instituições competirem em um ambiente dominado pelo poderio financeiro.
O Esporte Clube Vitória representa um estudo de caso relevante. Fundado em 1899, o clube opera sem os aportes de uma SAF, mas demonstrou notável capacidade de superação: acesso da Série C para a B em 2022, título da Série B em 2023 e a conquista do campeonato estadual em 2024. Essa jornada de altos e baixos, culminando com a classificação para uma competição continental, evidencia a resiliência do clube, mas também sublinha a necessidade de ferramentas analíticas para sustentar a consistência de desempenho. A análise aprofundada de suas performances pode revelar os fatores-chave que impulsionaram seus sucessos e as vulnerabilidades a serem corrigidas.
A aplicação da ACP aos dados do Esporte Clube Vitória e de seus adversários nas temporadas de 2022 a 2024 justifica-se como uma abordagem metodológica para fornecer um diagnóstico preciso e acionável. Ao identificar as características coletivas e individuais que mais impactam os resultados, o estudo oferece subsídios quantitativos para a comissão técnica e a diretoria. A análise busca explicar as dinâmicas subjacentes ao desempenho, transformando dados brutos em inteligência estratégica. Para um clube que depende da otimização de recursos, entender quais atributos são mais valiosos pode ser o diferencial entre o sucesso e o fracasso.
A metodologia quantitativa e exploratória foi desenvolvida em Python, com suporte da plataforma Anaconda Navigator e do ambiente Spyder. A base de dados foi construída a partir de arquivos “. csv” da plataforma FootyStats, abrangendo seis competições disputadas pelo Vitória entre 2022 e 2024: os Campeonatos Baianos de 2022, 2023 e 2024, e os Campeonatos Brasileiros das Séries C (2022), B (2023) e A (2024). Foram obtidos dados agregados por time (293 variáveis) e individuais de jogadores (277 variáveis), totalizando doze bancos de dados brutos.
O tratamento dos dados (Data Wrangling) foi crucial. Os doze arquivos foram consolidados em dois dataframes: um para times (dftimes) e outro para jogadores (dfjogadores). A limpeza envolveu a exclusão de variáveis com valores majoritariamente nulos ou zerados e, principalmente, a eliminação de variáveis com redundância matemática ou alta colinearidade. Conforme Hair et al. (2010) e Tabachnick e Fidell (2013), a alta correlação entre variáveis pode levar a uma matriz de correlação singular, inviabilizando testes como o de Esfericidade de Bartlett e comprometendo a estabilidade da solução fatorial. Adotou-se a premissa de utilizar apenas variáveis sem dependência direta, resultando em um conjunto de métricas mais robusto.
A aplicação da Análise Fatorial por Componentes Principais seguiu um protocolo rigoroso. A adequação do método foi verificada pelo Teste de Esfericidade de Bartlett e pela estatística Kaiser-Meyer-Olkin (KMO), que mede a proporção de variância comum. De acordo com Fávero e Belfiore (2017), valores de KMO acima de 0,70 indicam boa adequação. A quantidade de fatores a serem retidos foi determinada pelo critério de Kaiser, que sugere manter componentes com autovalores (eigenvalues) maiores ou iguais a 1 (Cielusinsky & Venson, 2023).
Para facilitar a interpretação, foi aplicada uma rotação ortogonal “varimax”, que, segundo Fávero e Belfiore (2017), redistribui a variância para maximizar as cargas fatoriais altas e minimizar as baixas, tornando a estrutura fatorial mais clara. Após a rotação, foram calculados os escores fatoriais para cada time e jogador. Com base nesses escores, construiu-se um ranking de desempenho para os times, utilizando uma soma ponderada onde cada fator é multiplicado por seu percentual de variância explicada. Para os jogadores, foi criado um “Fator Acumulado”, ponderando o escore pelos minutos jogados para avaliar o impacto real do atleta. A etapa final consistiu na comparação dos resultados analíticos com os desfechos reais dos campeonatos para validar o modelo.
A análise fatorial aplicada ao banco de dados dos times (df_times) foi estatisticamente adequada (Teste de Bartlett Qui² = 3043,95; p-valor < 0,001; KMO = 0,7868). O critério de Kaiser resultou na extração de três componentes principais, que explicaram 83,9% da variância total. Após a rotação varimax, os fatores foram interpretados como: Fator 1 (33,2% da variância), “Eficiência Geral e Controle de Jogo”, agrupando variáveis ofensivas, defensivas e de posse; Fator 2 (28,4% da variância), “Volume Ofensivo e Intensidade Tática”, representando equipes com alta produção de finalizações; e Fator 3 (22,3% da variância), “Risco e Vulnerabilidade”, associado à instabilidade defensiva.
A validação do ranking de times, construído a partir da soma ponderada dos fatores, mostrou alta aderência aos resultados reais. No Campeonato Brasileiro Série A de 2024, o modelo apresentou erro médio de 2,1 colocações. Para a Série B de 2023, o erro médio foi de 2,6 posições, e na Série C de 2022, de 1,7 posições. Nos campeonatos estaduais, a precisão foi ainda maior: o Baiano de 2024 registrou erro médio de 1,0 colocação, enquanto os de 2022 e 2023 tiveram erro médio de 1,2 colocações. Esses resultados confirmam que os fatores latentes extraídos pela ACP capturam com eficácia as dinâmicas de desempenho que determinam a classificação final.
A análise fatorial para os jogadores (df_jogadores) também se mostrou robusta (Teste de Bartlett Qui² = 47838,77; p-valor < 0,001; KMO = 0,7393). Foram extraídos sete componentes principais, explicando 71,2% da variância total. A interpretação dos fatores permitiu a identificação de perfis de atletas: Fator 1 (“Intensidade Física e Duelo Individual”); Fator 2 (“Distribuição e Qualidade de Passe”); Fator 3 (“Performance de Goleiro”); Fator 4 (“Produção Ofensiva e Finalização”); Fator 5 (“Capacidade Criativa”); Fator 6 (“Solidez Defensiva”); e Fator 7 (“Agressividade e Pressão Defensiva”). Essa taxonomia permite uma avaliação multifacetada do elenco.
A aplicação desses fatores ao elenco do Vitória revelou insights estratégicos. No Fator 4 (Finalização Ofensiva), a análise de 2023 mostrou que atacantes como Leonardo Gamalho foram bem aproveitados, refletindo-se no bom desempenho ofensivo da equipe. Em 2024, indicou-se um aproveitamento subótimo de peças como Iury Castilho, que tinha alto fator de finalização, mas poucos minutos em campo. Alerrandro, por outro lado, confirmou sua eficiência ao se tornar o artilheiro do time, validando o que o fator indicava.
A análise do Fator 6 (Solidez Defensiva) foi mais reveladora. Em 2023, os principais zagueiros (Cleidson Andrade, João Victor e Wagner Leonardo) apresentaram fatores defensivos elevados e foram amplamente utilizados, o que se traduziu em uma das defesas menos vazadas da Série B. O cenário de 2024 foi drasticamente diferente. O jogador com maior fator defensivo, o atacante Luiz Adriano, foi pouco utilizado. Os principais zagueiros, Wagner Leonardo e Cleidson Andrade, apareceram atrás de atacantes no ranking do fator. A análise do fator ponderado pelo tempo em campo mostrou que os maiores contribuintes defensivos foram um zagueiro e dois atacantes, evidenciando uma fragilidade estrutural.
Este desequilíbrio ajuda a explicar por que o Vitória sofreu 52 gols em 2024, terminando com uma das piores defesas do campeonato. Os dados sugerem que decisões de gestão, como o pouco aproveitamento do zagueiro Bruno Uvini e o empréstimo de Cleidson Andrade, podem ter contribuído para a vulnerabilidade defensiva. A análise comparativa entre os anos quantificou essa queda de consistência: enquanto em 2023, quatro dos cinco melhores jogadores no Fator 6 (defensivo) também estavam entre os mais utilizados, em 2024, apenas um atleta manteve essa posição, um indicativo da perda de solidez e de uma gestão de elenco menos eficiente no setor.
A análise do Fator 3 (Performance de Goleiro) confirmou a importância de Lucas Arcanjo como titular, garantindo estabilidade ao setor apesar das fragilidades da equipe em 2024. A avaliação dos demais fatores também apontou maior consistência na utilização de jogadores-chave em 2023 em comparação com 2024. Nos Fatores 2 (Distribuição) e 4 (Finalização), o número de atletas de alto desempenho que também tiveram alto impacto acumulado caiu de três para dois entre um ano e outro. Essa queda, drástica no componente defensivo, aponta para uma dificuldade maior em 2024 de traduzir o potencial individual em desempenho coletivo consistente.
A pesquisa demonstrou que a ACP é uma metodologia robusta e de alto valor estratégico para o futebol. A capacidade de condensar dezenas de variáveis em fatores interpretáveis permitiu a criação de um modelo de avaliação de times com alta aderência aos resultados reais. Para o Vitória, a análise individualizada revelou os pilares do sucesso em 2023, como o aproveitamento eficiente de peças ofensivas e uma sólida base defensiva. Em contrapartida, apontou as fragilidades de 2024, notadamente a queda na consistência defensiva, associada a uma gestão de elenco que não extraiu o máximo potencial de seus defensores mais qualificados.
As implicações práticas deste estudo são diretas. Para clubes com recursos limitados, a inteligência analítica é uma necessidade. Ferramentas como a ACP oferecem uma base objetiva para suportar decisões críticas, da montagem do elenco a ajustes táticos. A identificação de jogadores subutilizados com alto potencial ou a detecção de desequilíbrios setoriais, como o observado na defesa do Vitória em 2024, são exemplos de como a análise de dados pode guiar a gestão esportiva para a otimização de performance. Conclui-se que o objetivo foi atingido: demonstrou-se que a Análise de Componentes Principais é uma ferramenta eficaz para identificar os fatores latentes que mais influenciam a performance esportiva de equipes e jogadores, oferecendo subsídios relevantes para decisões técnicas, táticas e gerenciais.
Referências:
Abrahão, A. L.; Andrade Júnior, E. M.; Ferraz, A. F.; Hongyu, K.; Fett, C. 2022. Análise fatorial para detecção do talento esportivo em jogadores de futebol. Saúde e Pesquisa. Maringá 15 (1): 1-13.
Anaconda inc. Anaconda Navigator: versão 2025. Disponível em: <https://www. anaconda. com/>. Acesso em: 17 jun. 2025.
Angelleli, R. 2021. Previsão do valor de mercado de jogadores de futebol com base nos dados do jogo de videogame FIFA. Trabalho de Conclusão de Curso em Sistemas de Informação. Universidade Estadual de Campinas, Campinas, São Paulo, Brasil.
Cielusinsky, V.; Venson A. 2023. Avaliação e ranqueamento de “smartphones” a partir de suas especificações técnicas utilizando métodos multivariados exploratórios. Trabalho de Conclusão de Curso em Data Science & Analytics. Escola Superior de Agricultura “Luiz de Queiroz” – USP, Piracicaba, São Paulo, Brasil.
Exame. 2024. Brasileirão 2024 consolida-se como o de segunda maior média de público na história. Disponível em: https://exame. com/esporte/brasileirao-2024-consolida-se-como-o-de-segunda-maior-media-de-publico-na-historia/. Acesso em: 10 mar. 2025.
Favero, L. P.; Belfiore, P. 2024. Manual de Análise de Dados: estatística e Machine Learning com EXCEL®, SPSS®, STATA®, R® e Python®. 2ed. LTC, Rio de Janeiro, RJ, Brasil.
Figueiredo, D. H.; Figueiredo, D. H.; Gonçalves, H. R.; Stanganelli, L. C. R.; Dourado, A. C. 2019. Análise de componentes principais na identificação de características físicas primordiais em esportes coletivos. Revista Brasileira de Ciência e Movimento 27(3):41-51.
FOOTYSTATS. 2022. Liga Baiano 1. Disponível em: https://footystats. org/pt/download-stats-csv? season=2022. Acesso em: Acesso em: 10 jun. 2025.
FOOTYSTATS. 2022. Liga Série C. Disponível em: https://footystats. org/pt/download-stats-csv? season=2022. Acesso em: Acesso em: 10 jun. 2025.
FOOTYSTATS. 2023. Liga Baiano 1. Disponível em: https://footystats. org/pt/download-stats-csv? season=2023. Acesso em: Acesso em: 10 jun. 2025.
FOOTYSTATS. 2023. Liga Série B. Disponível em: https://footystats. org/pt/download-stats-csv? season=2023. Acesso em: Acesso em: 10 jun. 2025.
FOOTYSTATS. 2024. Liga Baiano 1. Disponível em: https://footystats. org/pt/download-stats-csv? season=2024. Acesso em: Acesso em: 10 jun. 2025.
FOOTYSTATS. 2024. Liga Série A. Disponível em: https://footystats. org/pt/download-stats-csv? season=2024. Acesso em: Acesso em: 10 jun. 2025.
Garcia, F. 2024. Governança e futebol no brasil: uma análise nos modelos de saf e sua relação com o endividamento e desempenho. Trabalho de Conclusão de Curso em Administração. Universidade Federal de Uberlândia, Uberlândia, Minas Gerais, Brasil.
Gavião, L. O.; Sant’anna A. P.; Lima, G. 2017. Uma nova abordagem aplicada ao conceito moneyball com apoio da composição probabilística de preferências. In: XLIX Simpósio Brasileiro de Pesquisa Operacional, 2017, Niterói, Rio de Janeiro, Brasil.
Globo Esporte, GE. 2024. Após viver fundo do poço, Vitória volta à Série A embalado por títulos e mirando vaga na Sul-Americana. Disponível em: https://ge. globo. com/ba/futebol/times/vitoria/noticia/2024/04/14/apos-viver-fundo-do-poco-vitoria-volta-a-serie-a-embalado-por-titulos-e-mirando-vaga-na-sul-americana. ghtml. Acesso em: 10 mar. 2025.
Globo Esporte, Ge. 2024. Brasileirão 2024 tem a segunda maior média de público da história do campeonato; veja balanço. Disponível em: https://ge. globo. com/espiao-estatistico/noticia/2024/12/10/brasileirao-2024-tem-a-segunda-maior-media-de-publico-da-historia-do-campeonato-veja-balanco. ghtml. Acesso em: 10 mar. 2025.
Hair, J. F.; Black, W. C.; Babin, B. J.; Anderson, R. E. 2019. Multivariate Data Analysis. 8ed. Cengage Learning EMEA, Andover, Hampshire, Reino Unido.
Lance. 2024. Brasileirão tem 6ª maior média de público do mundo; veja ranking. Disponível em: https://www. lance. com. br/lancebiz/torcidas/brasileirao-tem-6a-maior-media-de-publico-do-mundo-veja-ranking. html? form=MG0AV3&form=MG0AV3. Acesso em: 10 mar. 2025.
Moraes, I. F; Assis, R. B.; Rocco Junior, A. J. 2024. Análise da qualidade de uma competição de futebol profissional regional do Brasil. Retos 60: 622-631.
Spyder Developers. Spyder: versão 5. Disponível em: <https://www. spyder-ide. org/>. Acesso em: 17 jun. 2025.
Tabachnick, B. G.; Fidell, L. S. 2013. Using Multivariate Statistics. 6ed. Pearson Education. Upper Saddle River, New Jersey, EUA.
Resumo executivo oriundo de Trabalho de Conclusão de Curso de Especialização em Data Science e Analytics do MBA USP/Esalq
Saiba mais sobre o curso; clique aqui:




























