
28 de janeiro de 2026
Análise preditiva e visualização de dados para desempenho em League of Legends
Arthuro de Castro Stolf Giacomelli; Fernando Celso de Campos
Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.
O objetivo deste trabalho é desenvolver um dashboard interativo que integre análise exploratória, modelagem de machine learning e visualização de dados, oferecendo aos usuários uma interface para consulta personalizada de estatísticas de desempenho no jogo “League of Legends”. A proposta busca traduzir o volume de dados de cada partida em conhecimento acionável, permitindo que jogadores identifiquem padrões e áreas de melhoria. A ferramenta visa democratizar o acesso a análises de dados complexas, encapsulando-as em uma interface intuitiva. Espera-se entregar uma solução que apresente métricas de desempenho e facilite um ciclo de aprimoramento contínuo baseado em evidências.
A relevância da pesquisa se insere na expansão da indústria de jogos digitais. O mercado global de games atingiu uma receita superior a 180 bilhões de dólares em 2022, ultrapassando as indústrias cinematográfica e musical combinadas (Newzoo, 2023). Dentro deste ecossistema, “League of Legends” se destaca pela complexidade estratégica e pelo volume de dados gerados, pois cada ação de um jogador é registrada. Este cenário oferece uma oportunidade para explorar como a análise de dados pode gerar valor direto ao usuário, transformando dados brutos em insights estratégicos que influenciam o desempenho competitivo.
A fundamentação teórica repousa sobre três pilares da ciência de dados. O primeiro é a Análise Exploratória de Dados (EDA), abordagem de Tukey (1977) que prioriza a investigação inicial dos dados para descobrir padrões e testar hipóteses com estatísticas e gráficos. No contexto dos eSports, a EDA é fundamental para identificar as variáveis que mais impactam o resultado de uma partida. O segundo pilar é a visualização de dados, que, como defendido por Tufte (2001), deve comunicar uma narrativa para tornar padrões complexos compreensíveis. Dashboards interativos materializam este princípio, sintetizando métricas de forma clara para um público não especializado (Sadiku et al., 2016), e estudos corroboram seu valor para a tomada de decisão (Martins et al., 2020).
O terceiro pilar é o aprendizado de máquina, que permite a construção de modelos preditivos. A aplicação de algoritmos para prever o vencedor de uma partida de “League of Legends” já foi explorada, demonstrando que variáveis como abates, mortes e controle de mapa são preditores significativos (Maymin, 2021). A capacidade de um modelo em aprender relações não lineares e complexas é o que o torna uma ferramenta poderosa para a análise estratégica (Domingos, 2012). A integração dessas três áreas — análise exploratória, visualização e modelagem — em uma aplicação web cria um ecossistema analítico robusto; a comunicação eficaz dos dados garante o valor prático da ferramenta (Toasa et al., 2018).
A gamificação, ou a aplicação de elementos de design de jogos em contextos não lúdicos (Deterding et al., 2011), também informa a concepção do projeto. Ao apresentar as estatísticas de desempenho de forma visualmente atraente e interativa, o dashboard utiliza princípios de gamificação para engajar o usuário em seu próprio processo de melhoria. A interface não apenas informa, mas também motiva o jogador a explorar seus dados e acompanhar seu progresso. Portanto, a aplicação desenvolvida combina rigor analítico com um design centrado no usuário, tornando-se um parceiro estratégico para o jogador.
A metodologia adotada seguiu um fluxo de trabalho de ciência de dados. A primeira etapa foi a coleta de dados via API RESTful da Riot Games. Utilizando Python e a biblioteca requests, foi desenvolvido um script para extrair informações de 1.000 partidas competitivas do modo ranqueado Solo/Duo (queueId 420) no servidor brasileiro (BR1). A amostragem partiu de um conjunto de 50 jogadores de alto nível (liga Master) como sementes, coletando suas partidas mais recentes. Os dados foram armazenados em formato JSON.
A segunda etapa foi dedicada ao tratamento dos dados com as bibliotecas pandas e numpy (McKinney, 2010). O pré-processamento envolveu a padronização de colunas, o tratamento de valores ausentes e a remoção de registros incompletos. Uma etapa de engenharia de atributos (“feature engineering”) foi conduzida para criar novas variáveis, como agregados por equipe e por rota (ex: team100TOPkills) e séries temporais que capturavam a progressão da partida em intervalos de cinco minutos. Esta estruturação transformou os dados brutos em um dataset tabular com 367 colunas, pronto para a modelagem (Han, Pei & Kamber, 2011).
A terceira etapa combinou a análise exploratória de dados (EDA) e a modelagem preditiva. A EDA foi realizada com bibliotecas como matplotlib (Hunter, 2007) e seaborn para investigar a correlação entre variáveis e o resultado da partida. Na subetapa de modelagem, o foco foi construir um modelo para prever o time vencedor. Foram comparados dois algoritmos: Regressão Logística e “Random Forest” (Breiman, 2001). A implementação foi feita com a biblioteca scikit-learn (Pedregosa et al., 2011), avaliando os modelos com métricas como acurácia, precisão, “recall”, F1-Score e ROC AUC (Saito & Rehmsmeier, 2025).
As etapas finais concentraram-se na comunicação dos resultados e no desenvolvimento da interface. Gráficos interativos foram criados com a biblioteca plotly. O front-end da aplicação foi desenvolvido utilizando o micro-framework Flask para o back-end e o sistema de templates Jinja2. A interface foi projetada para que o usuário insira seu nome de invocador (“Riot ID”) e consulte seu histórico de partidas. Embora o modelo preditivo tenha sido desenvolvido, a decisão final foi não integrá-lo à aplicação devido a restrições práticas, focando a entrega em um dashboard explicativo e analítico.
Os resultados da análise exploratória, conduzida sobre 1.000 partidas, revelaram padrões consistentes. A variável alvo, winningTeam, apresentou uma distribuição equilibrada, com o time 100 (lado azul) vencendo em 52,5% dos casos e o time 200 (lado vermelho) em 47,5%, fornecendo uma base sólida para a modelagem. A análise da duração das partidas mostrou uma média de 26,72 minutos, com 50% dos jogos terminando entre 23 e 30 minutos, indicando um ritmo consistente no formato competitivo analisado.
Uma das descobertas mais impactantes foi a forte correlação entre a vantagem econômica acumulada (diff_gold) e a probabilidade de vitória. A análise temporal demonstrou que o poder preditivo desta variável aumenta progressivamente, atingindo o pico no minuto 25, com um coeficiente de correlação de -0,667. Este resultado sugere que o meio do jogo é um ponto de inflexão crítico; as vantagens acumuladas se consolidam e se tornam determinantes para o desfecho da partida.
O impacto dos objetivos estratégicos também se mostrou um fator determinante. A equipe que conquistou o primeiro dragão da partida viu sua taxa de vitória aumentar em 27,8%, o maior incremento percentual observado entre todas as variáveis. A obtenção do primeiro abate da partida (“First Blood”) conferiu uma vantagem significativa, aumentando a taxa de vitória em 13,1%. Estes achados quantificam a importância de eventos discretos que, em conjunto, constroem o momento que leva à vitória (Scholz, 2019).
Na fase de modelagem preditiva, o modelo “Random Forest” apresentou um desempenho superior em todas as métricas em comparação com a Regressão Logística. Com uma acurácia de 83,5%, um F1-Score de 85,07% e uma área sob a curva ROC (ROC AUC) de 0,939, o modelo demonstrou uma capacidade robusta de prever o time vencedor. A superioridade do “Random Forest” pode ser atribuída à sua habilidade de modelar relações não lineares e interações complexas entre as variáveis. O desempenho do modelo validou a hipótese de que o desfecho de uma partida é amplamente previsível a partir de indicadores econômicos e estratégicos.
Apesar do sucesso do modelo preditivo, uma análise crítica levou à decisão de não o incorporar na versão final do dashboard. A principal razão foi o desalinhamento entre os dados disponíveis para treinamento (pós-partida) e os dados acessíveis em um cenário de uso real. Para que o modelo tivesse utilidade prática, ele precisaria fazer previsões na fase de seleção de campeões, utilizando informações que a API de desenvolvedor padrão não fornece com a latência necessária. Além disso, as limitações de taxa de requisição da API tornariam inviável a coleta de dados ao vivo para alimentar o modelo.
Diante dessas restrições, o foco do desenvolvimento foi direcionado para a criação de um dashboard explicativo e analítico. A aplicação web final, desenvolvida em Flask, materializou os insights da análise exploratória em uma interface interativa. O fluxo de usuário é simples: ao inserir seu Riot ID, o back-end consulta a API da Riot Games, processa os dados e renderiza um painel de controle personalizado. Este painel é estruturado em três camadas de informação, do geral para o específico.
A primeira camada apresenta um resumo de alto nível com quatro indicadores principais: total de partidas, taxa de vitória, razão KDA média e o campeão mais jogado. A segunda camada oferece uma visão de tendências através de gráficos interativos, exibindo a distribuição de partidas por modo de jogo e a frequência de jogos por mês. A terceira e mais granular camada é uma tabela detalhada do “Histórico de Partidas”; cada linha representa um jogo e exibe informações como campeão, resultado e KDA, com um filtro interativo para focar em modos de jogo específicos.
A implementação do dashboard demonstrou um impacto significativo na capacidade do jogador de analisar seu próprio desempenho. A análise, antes lenta e fragmentada, tornou-se consolidada e instantânea. O acesso a insights, antes restrito a quem possuía conhecimento técnico, foi democratizado. O tempo para obter respostas a perguntas como “qual meu desempenho com determinado campeão?” foi reduzido para uma consulta de menos de um minuto. O conjunto de funcionalidades do front-end atingiu o objetivo de explicabilidade, fornecendo uma visão integrada do desempenho com indicadores, tendências e evidências granulares, capacitando o jogador com insumos para sua melhoria.
Em conclusão, este trabalho demonstrou com sucesso a aplicação de técnicas de ciência de dados para transformar dados brutos do jogo “League of Legends” em insights acionáveis por meio de um dashboard interativo. A análise exploratória confirmou a importância crítica de variáveis como a vantagem econômica, especialmente em torno do minuto 25, e o controle de objetivos estratégicos iniciais, como o primeiro dragão. O modelo preditivo “Random Forest” desenvolvido alcançou um desempenho notável, com um F1-Score de 85,07%, validando a viabilidade de prever desfechos de partidas com alta precisão. No entanto, a implementação prática do modelo foi preterida em favor de um dashboard explicativo devido a limitações de disponibilidade de dados em tempo real e restrições da API, uma decisão que priorizou a utilidade imediata para o usuário final.
O dashboard desenvolvido em Flask cumpriu seu papel de traduzir análises complexas em uma interface visualmente intuitiva e acessível, permitindo que os jogadores explorem seu desempenho de forma personalizada. As limitações do estudo, como a dependência de dados pós-jogo, abrem caminhos claros para trabalhos futuros, que poderiam incluir a análise de dados da fase de seleção de campeões e a exploração de modelos mais avançados. Conclui-se que o objetivo foi atingido: demonstrou-se que a aplicação interativa desenvolvida, mesmo sem a integração do modelo preditivo, cumpre o papel de tornar análises complexas de desempenho em “League of Legends” acessíveis ao jogador final, promovendo o aprendizado baseado em dados.
Referências:
Breiman, L. 2001. Random Forests. Machine Learning, v. 45, n. 1, p. 5–32.
Deterding, S.; Dixon, D.; Khaled, R.; Nacke, L. 2011. From Game Design Elements to Gamefulness: Defining Gamification. In: Proceedings of the 15th International Academic MindTrek Conference, p. 9–15.
Domingos, P. 2012. A Few Useful Things to Know About Machine Learning. Communications of the ACM, v. 55, n. 10, p. 78–87.
Han, J.; Pei, J.; Kamber, M. 2011. Data Mining: Concepts and Techniques. 3rd ed. Morgan Kaufmann Publishers.
Hunter, J. D. 2007. Matplotlib: A 2D Graphics Environment. Computing in Science & Engineering, v. 9, n. 3, p. 90–95.
Martins, V. F.; da Silva, S. A. F.; Furtado, E. S. 2020. A systematic mapping study on customizable dashboards. Journal of the Brazilian Computer Society, v. 26, n. 1, p. 1-25.
Maymin, P. Z. 2021. Smart kills and worthless deaths: eSports analytics for League of Legends. Journal of Quantitative Analysis in Sports, 17(1), 11-27.
McKinney, W. 2010. Data Structures for Statistical Computing in Python. In: Proceedings of the 9th Python in Science Conference, p. 51–56.
Newzoo. 2023. Global Games Market Report. Disponível em: https://newzoo. com.
Pedregosa, F. et al. 2011. Scikit-learn: Machine Learning in Python. Journal of Machine Learning Research, v. 12, p. 2825–2830.
Sadiku, M. N. O.; Shadare, A. E.; Musa, S. M.; Akujuobi, C. M. 2016. Data visualization. International Journal of Engineering Research and Advanced Technology (IJERAT), v. 2, n. 12, p. 11, Prairie View A&M University, USA.
Saito, T.; Rehmsmeier, M. 2025. The Precision-Recall Plot Is More Informative Than the ROC Plot. Journal of Machine Learning Research, v. 26, p. 1-23.
Scholz, T. M. 2019. eSports is Business: Management in the World of Competitive Gaming. Springer.
Toasa, R.; Maximiano, M.; Reis, C.; Guevara, D. 2018. Data visualization techniques for real-time information —A custom and dynamic dashboard for analyzing surveys’ results. In: 2018 13th Iberian Conference on Information Systems and Technologies (CISTI), Cáceres, Espanha, p. 1-7.
Tufte, E. R. 2001. The Visual Display of Quantitative Information. Cheshire, CT: Graphics Press.
Tukey, J. W. 1977. Exploratory Data Analysis. Reading, MA: Addison-Wesley.
Resumo executivo oriundo de Trabalho de Conclusão de Curso de Especialização em Data Science e Analytics do MBA USP/Esalq
Saiba mais sobre o curso; clique aqui:






































