Imagem Otimização de tempos de volta em simuladores com Machine Learning e Telemetria

02 de fevereiro de 2026

Otimização de tempos de volta em simuladores com Machine Learning e Telemetria

Danilo Duo Fini; Brayan Dias Dauria

Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.

O objetivo geral deste trabalho é aplicar machine learning para desenvolver um modelo preditivo de tempos de volta em um simulador de corrida, utilizando dados de telemetria. Os objetivos específicos são: coletar e tratar dados telemétricos (velocidade, freio, acelerador, RPM); avaliar comparativamente o impacto dessas variáveis nos diferentes setores do circuito para identificar trechos com maior potencial de otimização; identificar as variáveis de pilotagem e acerto com maior impacto na performance; e validar a capacidade preditiva do modelo. A premissa da investigação é que uma análise granular, setor por setor, revela insights sobre o desempenho que uma análise do tempo de volta total poderia mascarar, oferecendo um diagnóstico mais preciso.

A aplicação de ciência de dados e machine learning consolidou-se como ferramenta estratégica em domínios competitivos como o esporte de alto rendimento. No automobilismo, a busca por performance impulsiona a adoção de metodologias analíticas. A ideia de usar dados para obter vantagens competitivas foi popularizada pela abordagem “Moneyball” de Billy Beane no beisebol, documentada por Michael Lewis (2003), que usou análises estatísticas para montar uma equipe competitiva com orçamento limitado (Active BI, 2023). Este princípio é aplicável ao automobilismo; a análise de telemetria pode revelar ganhos de milissegundos.

Atualmente, organizações como a Federação Internacional de Automobilismo (FIA) exigem a captura extensiva de dados telemétricos. Corporações de tecnologia como a Amazon Web Services (AWS) têm parcerias com a Fórmula 1 para coletar, processar e analisar volumes massivos de dados em tempo real, aplicando machine learning para otimizar estratégias e desenvolvimento (Amazon Web Services, 2025). A tecnologia embarcada evoluiu, com sensores que capturam centenas de variáveis com alta frequência, fornecendo um fluxo contínuo de informações sobre o comportamento do carro e as ações do piloto (Chandiramani et al., 2014; Schlosser, 2024).

Essa revolução tecnológica estende-se ao automobilismo virtual (e-sports). Em simuladores de corrida, a predição de tempos de volta baseada em telemetria permite a otimização de desempenho, identificando padrões de pilotagem e auxiliando em decisões sobre configurações dos veículos (Redação Awari, 2023). A análise sistemática de dados transforma a intuição do piloto em insights acionáveis e quantitativos (Santos, 2025). A inteligência artificial, em particular, está redefinindo os limites do possível, desde a simulação de cenários até a personalização de setups (Mann-Bryans, 2024).

Apesar dos avanços, há uma lacuna na literatura. A maioria dos estudos foca no tempo de volta total ou em eventos isolados, como pontos de frenagem. Poucas pesquisas exploram a segmentação do circuito como unidade analítica fundamental. Falta uma abordagem que associe modelos preditivos a uma avaliação setorizada, capaz de identificar, para cada trecho, as variáveis de pilotagem e comportamento veicular de maior influência. Este estudo propõe-se a preencher essa lacuna, demonstrando que a análise por setor aumenta a precisão dos modelos e fornece um diagnóstico mais detalhado para a otimização da performance.

Este trabalho adota um método de pesquisa experimental, com coleta controlada de dados e aplicação de machine learning para modelar a relação entre telemetria e tempo de volta. Os dados foram extraídos de sessões virtuais com um veículo GT3 no Autódromo de Interlagos, por meio de uma API que gravou os dados em formato CSV. As variáveis coletadas incluíram tempo em milissegundos, temperatura dos pneus, posição dos pedais, nível de combustível, distância percorrida, velocidade, pressão do turbo, RPM, força G lateral e ativação do controle de tração. A frequência de amostragem foi de aproximadamente 17 milissegundos, gerando uma série temporal multivariada de alta resolução.

Para garantir a robustez do estudo, as condições de coleta foram controladas: todas as voltas foram realizadas pelo mesmo piloto, com o mesmo veículo e configuração de pista. Essa padronização minimizou a variabilidade de estilos de pilotagem, assegurando que as variações nos tempos de volta fossem atribuídas às nuances da condução. Variáveis com efeito determinístico, como nível de combustível e desgaste dos pneus, foram mantidas constantes para evitar que a redução de peso ou a degradação da aderência distorcessem a análise. A principal limitação é que os modelos gerados são específicos para o piloto em questão; a generalização exigiria um conjunto de dados mais diversificado.

O tratamento dos dados foi uma etapa fundamental. A base de dados original, com registros instantâneos, foi transformada para se adequar ao aprendizado supervisionado; cada linha representa uma unidade observacional consolidada: um setor de uma volta. O circuito de Interlagos (4.209 metros) foi dividido em três setores, conforme a prática profissional (Formula 1, 2025): Setor 1 (0 a 1.260 m), Setor 2 (1.260 a 3.070 m) e Setor 3 (3.070 a 4.209 m). A partir dos dados brutos, foram criadas variáveis agregadas para cada setor de cada volta, como média da posição do acelerador, tempo de ativação do controle de tração, velocidades mínima e máxima, e quantidade de trocas de marcha, através de engenharia de características.

Para a modelagem preditiva, foi utilizada a Regressão Linear Múltipla para explicar a relação entre o tempo do setor (variável dependente) e as métricas de telemetria (variáveis preditoras). Foram ajustados três modelos independentes, um para cada setor. Para selecionar as variáveis mais relevantes e evitar multicolinearidade e overfitting, aplicou-se o procedimento stepwise, que seleciona o subconjunto de preditores estatisticamente significativos com base em um nível de confiança de 95% (Fávero, 2024). A capacidade preditiva foi avaliada pelo coeficiente de determinação (R²), e a precisão foi medida pelo RMSE (Root Mean Squared Error), que representa o desvio padrão dos resíduos em milissegundos.

A análise dos dados, partindo de 466.721 registros de 88 voltas, foi consolidada em uma base final com 259 observações. Antes da modelagem, foram removidos outliers, excluindo-se voltas cujo tempo total se afastava em mais de um desvio padrão da média, para eliminar eventos atípicos. Uma análise de multicolinearidade revelou forte correlação entre as temperaturas dos pneus e entre a posição do acelerador e a pressão do turbo. Para estabilizar os modelos, variáveis redundantes como avgtyretempf e avgturboboostpressure foram removidas.

Os resultados para o Setor 1, trecho técnico que inclui a “Reta Oposta” e o “S do Senna”, foram robustos. O modelo alcançou um R² de 0,842, indicando que 84,2% da variação no tempo do setor é explicada pelas variáveis selecionadas. O RMSE foi de 193 milissegundos, confirmando alta precisão. As variáveis significativas com impacto negativo no tempo (melhora) foram: posição média do acelerador (β = -110,25), rotação média do motor (β = -0,55), velocidade mínima (β = -16,65), temperatura média dos pneus traseiros (β = -12,34), força G lateral média (β = -3113,12) e número de trocas de marcha (β = -45,33). Em contrapartida, a posição média do freio (β = 54,04) e o tempo de rolagem (β = 0,11) apresentaram coeficientes positivos, penalizando o tempo de volta. A interpretação é que o desempenho no Setor 1 é otimizado ao maximizar o acelerador, manter altas rotações, carregar mais velocidade nas curvas e minimizar frenagem e inércia.

Para o Setor 2, o trecho mais sinuoso, o modelo apresentou um R² de 0,845, mas com um RMSE maior, de 657 milissegundos, refletindo maior variabilidade de desempenho. As variáveis significativas foram a posição média do acelerador (β = -240,34), a rotação média do motor (β = -2,18), a velocidade mínima (β = -48,59) e o tempo de uso do controle de tração (TCS) (β = 0,20). O coeficiente positivo do tcsactivetime indica que cada milissegundo de ativação do TCS aumenta o tempo do setor. Isso sugere que a perda de tração na saída das curvas lentas é um gargalo de desempenho, e um piloto que modula o acelerador de forma mais suave, evitando a intervenção do sistema, ganha tempo.

O modelo para o Setor 3, caracterizado pela “Reta dos Boxes”, alcançou um R² de 0,790 e um RMSE de 553 milissegundos. As variáveis preditoras significativas foram a posição média do acelerador (β = -99,62), a rotação média do motor (β = -0,53), o tempo de uso do controle de tração (β = 0,12), a velocidade mínima (β = -25,97) e a velocidade máxima (β = -71,20). A inclusão da velocidade máxima como preditor forte era esperada. A significância do TCS neste setor de alta velocidade provavelmente se deve à sua ativação na saída da “Junção”, curva crítica que antecede a longa subida; a tração é essencial.

A discussão comparativa dos modelos revela que o modelo do Setor 1 foi o mais informativo, mantendo o maior número de variáveis significativas. Isso ocorre porque o Setor 1 combina trechos de alta velocidade, frenagens intensas e curvas técnicas, exigindo uma gama mais ampla de habilidades. Em contraste, o Setor 2 (curvas lentas) e o Setor 3 (reta longa) apresentam uma dinâmica de pilotagem mais constante, reduzindo a influência de certas variáveis. A análise dos coeficientes permite uma interpretação acionável. A posição do acelerador e a rotação do motor emergiram como fatores universais, com coeficientes negativos e significativos em todos os setores.

A variável tcsactivetime, com coeficiente positivo nos Setores 2 e 3, funciona como um indicador de ineficiência. Um tempo elevado de ativação do TCS sinaliza que o piloto está aplicando o acelerador de forma muito agressiva para as condições de aderência, resultando em perda de tração que o sistema corrige, comprometendo a aceleração. A velocidade mínima em curva (mingroundspeed) também se mostrou um preditor crítico em todos os setores, com seu coeficiente negativo destacando a importância de manter velocidade no ápice das curvas para reduzir o tempo no trecho e melhorar a velocidade de saída. A superioridade do modelo do Setor 1 sugere que trechos de circuito com maior complexidade técnica oferecem as melhores oportunidades para análise e otimização via telemetria.

Em suma, os modelos de regressão linear múltipla para cada setor demonstraram elevada capacidade preditiva, com R² entre 79% e 84,5%. A precisão, medida pelo RMSE, variou de 193 a 657 milissegundos, com o modelo do Setor 1 sendo o mais preciso. A abordagem de segmentação da pista provou-se eficaz, revelando que trechos tecnicamente exigentes, como o Setor 1 de Interlagos, oferecem maior riqueza de dados e permitem modelos mais informativos. Variáveis como posição do acelerador, rotação do motor e velocidade mínima em curva foram consistentemente identificadas como preditores cruciais. A análise também destacou o tempo de ativação do controle de tração como um importante indicador de ineficiência na pilotagem, especialmente em saídas de curvas de baixa velocidade. Os resultados fornecem um diagnóstico detalhado para pilotos e engenheiros otimizarem a performance. A pesquisa valida a hipótese de que a análise de telemetria segmentada por setor fornece um diagnóstico mais preciso sobre os maiores ganhos potenciais de performance. Conclui-se que o objetivo foi atingido: demonstrou-se que a aplicação de machine learning em dados de telemetria segmentados por setor permite prever com alta acurácia os tempos de volta e identificar as variáveis de pilotagem mais críticas para a otimização de desempenho.

Referências:
Active BI. 2023. “Moneyball: A revolução da análise de dados no esporte e nos negócios”. Disponível em: <https://www. activebi. com. br/post/moneyball-a-revolucao-da-analise-de-dados-no-esporte-e-nos-negocios/47>. Acesso em: 02 mar. 2025.
Amazon Web Services [AWS]. 2025. Estudo de caso da Fórmula 1. Disponível em: <https://aws. amazon. com/pt/solutions/case-studies/formula-one/>. Acesso em: 01 mar. 2025.
Chandiramani, J. R.; Bhandari, S.; Hariprasad, S. A. 2014. Vehicle Data Acquisition and Telemetry. Disponível em: <https://ieeexplore. ieee. org/document/6754874>. Acesso em 13 jun. 2025.
Fávero, L. P.; Belfiore, P. 2024. Manual de análise de dados: estatística e machine learning com Excel®, SPSS®, Stata®, R® e Python®. 2ed. LTC, Rio de Janeiro, RJ, Brasil.
Formula 1. 2025. “FORMULA 1 MSC CRUISES GRANDE PRÊMIO DE SÃO PAULO 2025”. Disponível em: <https://www. formula1. com/en/racing/2025/brazil/circuit>. Acesso em: 15 jun. 2025.
Lewis, M. D. 2003. Moneyball: The Art of Winning an Unfair Game. New York: W. W. Norton. ISBN 0-393-05765-8.
Mann-Bryans, M. 2024. “Como a inteligência artificial está mudando a F1?”. Disponível em: <https://motorsport. uol. com. br/f1/news/como-a-inteligencia-artificial-esta-mudando-a-formula-1/10659645/>. Acesso em: 15 mar. 2025.
Redação Awari. 2023. Inteligência Artificial na Fórmula 1: Como a tecnologia está revolucionando as corridas. Disponível em: <https://awari. com. br/inteligencia-artificial-na-formula-1-como-a-tecnologia-esta-revolucionando-as-corridas/>. Acesso em: 08 mar. 2025.
Santos, R. 2025. “A Fórmula 1 é mais tecnológica do que você imagina – e serve de exemplo”. Disponível em: <https://olhardigital. com. br/2025/03/30/pro/a-formula-1-e-mais-tecnologica-do-que-voce-imagina-e-serve-de-exemplo/>. Acesso em: 01 mar. 2025.
Schlosser, M. 2024. Unifying the Data Highway: A Harmonized Telemetry Format for Driver Analytics. Disponível em: <https://ieeexplore. ieee. org/document/10796414>. Acesso em 13 jun. 2025.

Resumo executivo oriundo de Trabalho de Conclusão de Curso de Especialização em Data Science e Analytics do MBA USP/Esalq

Saiba mais sobre o curso; clique aqui:

Quem editou este artigo

Você também pode gostar

Quer ficar por dentro das nossas últimas publicações? Inscreva-se em nossa newsletter!

Receba conteúdos e fique sempre atualizado sobre as novidades em gestão, liderança e carreira com a Revista E&S.

Ao preencher o formulário você está ciente de que podemos enviar comunicações e conteúdos da Revista E&S. Confira nossa Política de Privacidade