Imagem Previsão de Tráfego em Redes Móveis: Uma abordagem híbrida com Prophet e LSTM

04 de março de 2026

Previsão de Tráfego em Redes Móveis: Uma abordagem híbrida com Prophet e LSTM

Cíntia Porcher de Oliveira; Miriam Martin

Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.

A trajetória das redes móveis representa uma jornada de constante evolução tecnológica que se iniciou na década de 80 com o lançamento das redes de primeira geração, denominadas Advanced Mobile Phone Service. Naquele período, o serviço concentrava-se exclusivamente na comunicação por voz sem fio. Com o advento da segunda geração na década de 90, as redes celulares transitaram do sistema analógico para o digital, o que incrementou a segurança e introduziu o serviço de mensagens de texto. A terceira geração, surgida em 1999, marcou o início do acesso à internet móvel, possibilitando a navegação web e o uso de correio eletrônico. Entretanto, a consolidação do uso massivo de dados ocorreu apenas em 2013 com a quarta geração, o Long Term Evolution, que proveu a banda larga necessária para o ecossistema de aplicativos e streaming (Rodriguez, 2015). Atualmente, as redes de quinta geração, conhecidas como New Radio, encontram-se em expansão, oferecendo velocidades na ordem de 1 GB, latência ultrabaixa e a capacidade de conectar um número massivo de dispositivos simultaneamente (CNI, 2021).

Essa evolução tecnológica impõe desafios estratégicos para as operadoras de telecomunicações, especialmente no que tange ao gerenciamento e à previsão do volume de tráfego de dados. A capacidade de antecipar a demanda é fundamental para o planejamento de expansão da infraestrutura e a definição de investimentos eficazes. Previsões inadequadas podem resultar em sobrecarga da rede, degradando a qualidade do serviço, ou em superdimensionamento, gerando gastos desnecessários (Bastos, 2019). A rede analisada neste estudo pertence a uma operadora de telefonia móvel de relevância nacional, cuja importância cresce continuamente no cenário contemporâneo (CGI.br, 2024). O aumento significativo no tráfego, impulsionado pelas novas aplicações da tecnologia 5G, exige métodos de previsão cada vez mais robustos (MCom, 2025).

Prever o crescimento em uma rede complexa envolve múltiplos fatores, como características geográficas, demográficas e a participação de mercado em cada região (Khodabandelou et al., 2016). Atualmente, a rede LTE ainda detém o maior volume de tráfego, mas atravessa uma fase de migração de demanda para a rede New Radio. Essa dinâmica de transferência tecnológica, conhecida como offload, representa um desafio adicional para os modelos de forecasting tradicionais (Haidine et al., 2016). Na literatura, métodos como o Arima são frequentemente aplicados em séries temporais (Moayedi e Masnadi-Shirazi, 2008), assim como o modelo Arimax, que incorpora variáveis exógenas para melhorar a precisão (Box et al., 2015). Abordagens mais complexas utilizam deep learning, como redes neurais recorrentes e redes convolucionais, que apresentam acurácias variando entre 70% e 80% (Huang et al., 2017).

Diante da complexidade inerente às redes móveis, a utilização de modelos como o Prophet, desenvolvido pela Meta, mostra-se adequada para capturar tendências de longo prazo e sazonalidades (Taylor e Letham, 2018). Paralelamente, as redes neurais Long Short-Term Memory possuem a capacidade de aprender padrões não-lineares complexos que modelos estatísticos convencionais muitas vezes ignoram (Hochreiter e Schmidhuber, 1997). A proposta de uma abordagem híbrida visa unir a especialidade do Prophet em modelar a base do tráfego com a competência da rede LSTM em processar o comportamento específico do offload entre tecnologias. Essa integração busca fornecer previsões mais acuradas para auxiliar na tomada de decisões estratégicas e na alocação eficiente de recursos de rede.

A metodologia empregada para o desenvolvimento do modelo de predição estruturou-se em quatro etapas fundamentais: análise exploratória, pré-processamento, treinamento dos modelos e avaliação de performance. O conjunto de dados utilizado compreende indicadores de performance de uma rede móvel com tecnologias LTE e New Radio coletados ao longo de três anos. Os indicadores incluem o volume de dados trafegados, o número médio de usuários conectados, a taxa média de transferência e o percentual de ocupação dos recursos da rede. O tratamento inicial dos dados foi realizado com o auxílio da biblioteca Pandas em linguagem Python, onde arquivos mensais foram concatenados e agrupados por município, resultando em uma instância temporal por mês para cada localidade.

No pré-processamento, aplicou-se a normalização Min-Max para redimensionar os dados em um intervalo entre zero e um, garantindo estabilidade aos modelos de aprendizado de máquina sensíveis à escala (Fávero e Belfiore, 2024). O cálculo utilizou o valor original subtraído pelo mínimo da série, dividido pela diferença entre o máximo e o mínimo. Para evitar o vazamento de dados, os parâmetros de normalização foram calculados exclusivamente no conjunto de treino (Kaufman et al., 2012). Variáveis intrinsicamente relacionadas, como o número de sites 4G e 5G, foram normalizadas de forma conjunta para preservar a relação de magnitude original entre elas. No caso do modelo Prophet, a normalização restringiu-se aos regressores adicionais, uma vez que o modelo realiza o escalonamento interno da variável-alvo.

A análise exploratória utilizou a matriz de correlação de Pearson para quantificar as relações lineares. O volume 5G apresentou correlações fortes com o número de usuários e a utilização de recursos no uplink, com valores superiores a 0,5. Para a tecnologia 4G, o indicador de recursos de downlink mostrou-se mais relevante devido à arquitetura de Duplexação por Divisão de Frequência, enquanto no 5G a Duplexação por Divisão de Tempo confere maior variabilidade ao tráfego de uplink (Rodriguez, 2015). A chegada da tecnologia 5G no Brasil em 2022 alterou significativamente o perfil do tráfego 4G, iniciando a fase de offload (Anatel, 2023). Portanto, a modelagem considerou a relação entre as duas tecnologias em vez de analisá-las de forma isolada.

O modelo Prophet foi configurado como um modelo aditivo generalizado que decompõe a série em tendência e sazonalidade (Taylor e Letham, 2018). Devido à granularidade mensal e ao foco no longo prazo, omitiram-se os componentes de alta frequência, como sazonalidade diária e semanal. A sazonalidade anual foi aplicada apenas a municípios com perfil turístico identificado, evitando o sobreajuste em séries sem esse padrão. Como regressores adicionais, incluíram-se o número de usuários, a ocupação de recursos e o volume da rede secundária. A divisão dos dados reservou os 12 meses mais recentes para teste, garantindo que o conjunto de treinamento contivesse ao menos 70% das observações para um ajuste robusto.

Para cenários com histórico limitado, como municípios onde o 5G foi recém-ativado, desenvolveu-se uma rede neural LSTM. Diferente do Prophet, a rede LSTM consegue aprender com a experiência de múltiplas localidades (Taylor e Letham, 2018). A arquitetura foi projetada para receber sete variáveis de entrada: marcador de maturidade temporal, infraestrutura legada, infraestrutura nova, volume agregado e as variações mensais desses indicadores. Os dados foram estruturados em sequências de seis meses por meio de uma janela deslizante. O núcleo do modelo consistiu em duas camadas LSTM empilhadas com 128 e 64 neurônios, respectivamente, utilizando a função de ativação tangente hiperbólica.

A regularização foi implementada através de camadas Dropout com taxa de 0,3 para prevenir o overfitting (Srivastava et al., 2014). Um mecanismo de atenção foi integrado após as camadas recorrentes para permitir que o modelo ponderasse a importância de cada um dos seis passos temporais da sequência (Bahdanau et al., 2014). Na sequência, uma camada densa com 32 neurônios e ativação ReLU processou as características extraídas, seguida por um neurônio de saída com ativação linear para prever o percentual de tráfego 5G. O treinamento utilizou o otimizador Adam e a função de perda Erro Quadrático Médio, buscando minimizar a diferença entre valores preditos e reais (Hastie et al., 2009).

A avaliação de performance utilizou o Coeficiente de Ajuste e o Erro Absoluto Médio como métricas principais (Fávero e Belfiore, 2024). O Erro Absoluto Médio foi priorizado por sua robustez em cenários com valores próximos a zero e por sua interpretabilidade direta na mesma unidade da variável-alvo. Para estabelecer um referencial, implementou-se um modelo de regressão linear simples como baseline, modelando uma tendência puramente linear baseada na passagem do tempo (Hyndman e Athanasopoulos, 2021). O contraste entre o modelo híbrido e o baseline permitiu quantificar o ganho de performance obtido com a abordagem proposta.

Os resultados revelaram que a mediana do erro para as previsões de LTE foi de 0,716 x 10⁻⁴, enquanto para a tecnologia New Radio o valor foi de 1,050 x 10⁻⁴. Embora as medianas fossem próximas, a distribuição dos erros no LTE mostrou-se mais consistente, com 50% dos erros concentrados entre 0,313 x 10⁻⁴ e 2,00 x 10⁻⁴. O modelo para a rede New Radio apresentou maior dispersão. A análise do Coeficiente de Ajuste indicou que o modelo explicou 56% da variância para o New Radio, mas apresentou um valor mediano de -2,01 para o LTE. Um valor negativo de R² sugere que o modelo performou pior que uma linha de base baseada na média histórica, resultado influenciado pela presença de outliers e pela alta variabilidade em tecnologias maduras.

A análise visual do desempenho em municípios específicos demonstrou que, no cenário LTE, a projeção capturou uma tendência de queda de 2,7%, mas enfrentou dificuldades para modelar a alta variância sem um padrão sazonal claro. Em contrapartida, para o New Radio, o modelo exibiu alta aderência à forte tendência de crescimento, resultando em um Erro Absoluto Médio de 3,21 x 10⁻⁴ e validando uma projeção de crescimento de 60,1%. Em municípios sazonais, a ativação da componente anual do Prophet permitiu capturar picos de tráfego nos meses de verão, embora a precisão tenha sido limitada pelo curto histórico de dados disponível, que abrangia apenas dois ciclos anuais completos.

A decomposição dos componentes do Prophet confirmou que o impacto combinado das variáveis exógenas contribuiu para a redução na previsão de volume ao longo do tempo, o que é consistente com a dinâmica de offload. O modelo LSTM, treinado para prever a curva de adoção, alcançou um Coeficiente de Ajuste de 81,71% no conjunto de teste e um Erro Absoluto Médio de 0,017. Isso indica que a rede neural foi capaz de generalizar a trajetória de crescimento a partir da experiência de múltiplos municípios, superando a limitação de modelos univariados que seriam incapazes de prever o surgimento do tráfego 5G em locais sem histórico prévio.

A interpretabilidade do modelo LSTM foi explorada através do método SHAP, que revelou a variável de maturidade temporal como a mais influente na predição (Lundberg e Lee, 2017). O número de sites 5G apresentou correlação positiva direta com o percentual de tráfego previsto, refletindo o efeito da expansão da cobertura. Inversamente, um número elevado de sites 4G demonstrou impacto negativo, sugerindo que uma infraestrutura legada robusta pode desacelerar a migração para a nova tecnologia. A análise da camada de atenção mostrou pesos uniformes de aproximadamente 0,17 para todos os passos de tempo, indicando que a arquitetura LSTM foi robusta para sintetizar a informação de toda a sequência de forma agregada.

No comparativo com o modelo de referência, a superioridade da abordagem híbrida foi evidente. Para a tecnologia New Radio, o Erro Absoluto Médio foi aproximadamente seis vezes menor que o do baseline de regressão linear, e o Coeficiente de Ajuste dobrou de 0,28 para 0,56. No caso do LTE, embora o modelo híbrido tenha reduzido o erro médio em comparação ao baseline, a sensibilidade a comportamentos atípicos resultou em um R² inferior. Essa discrepância reforça a necessidade de utilizar métricas adequadas e considerar a volatilidade de redes maduras no planejamento de capacidade.

A integração entre Prophet e LSTM permitiu lidar com a heterogeneidade dos dados municipais, onde o Prophet atuou de forma eficaz em séries consolidadas e a rede LSTM proveu a inteligência necessária para novos cenários de ativação. A capacidade de antecipar a curva de offload é um diferencial crítico para operadoras que buscam otimizar investimentos em infraestrutura durante a transição tecnológica. O estudo demonstrou que a inclusão de variáveis de infraestrutura e maturidade temporal é essencial para modelar a dinâmica de substituição entre gerações de redes móveis.

Apesar dos resultados positivos, a pesquisa identificou limitações, como a sensibilidade a outliers no tráfego LTE e a dificuldade de modelar sazonalidades complexas com históricos curtos. A presença de comportamentos atípicos em determinados municípios distorce a performance geral, sugerindo que modelos específicos para detecção de anomalias poderiam ser integrados em etapas futuras. Além disso, a expansão do horizonte de dados permitiria uma modelagem sazonal mais robusta, reduzindo o risco de o modelo interpretar ruídos pontuais como padrões recorrentes.

Sugere-se, para trabalhos futuros, a inclusão de variáveis exógenas de natureza socioeconômica, como o poder aquisitivo da população local e a densidade de dispositivos compatíveis com a tecnologia 5G. Tais dados poderiam enriquecer a capacidade preditiva do modelo, fornecendo uma visão mais holística dos fatores que impulsionam a adoção tecnológica. O desenvolvimento de um módulo de detecção de anomalias também contribuiria para aumentar a robustez das previsões em séries com alta variabilidade, garantindo maior confiabilidade para o planejamento estratégico de longo prazo.

Conclui-se que o objetivo foi atingido por meio da implementação de uma abordagem híbrida que superou os métodos tradicionais de previsão de tráfego. A combinação da decomposição de séries temporais do Prophet com a capacidade de generalização das redes neurais LSTM permitiu modelar com precisão tanto tendências consolidadas quanto o surgimento de novas tecnologias. O modelo LSTM demonstrou alta eficácia ao prever a trajetória de crescimento do 5G em municípios sem dados históricos, alcançando um Coeficiente de Ajuste de 81,71%. A pesquisa validou a importância de considerar a dinâmica de offload e a infraestrutura de rede como preditores fundamentais, oferecendo uma ferramenta robusta para o planejamento estratégico e a tomada de decisões de investimento em telecomunicações.

Referências Bibliográficas:

Nenhuma referência bibliográfica identificada após múltiplas tentativas

Resumo executivo oriundo de Trabalho de Conclusão de Curso de Especialização em MBA em Data Science, Inteligência Artificial e Analytics

Saiba mais sobre o curso, clique aqui

Quem editou este artigo

Você também pode gostar

Quer ficar por dentro das nossas últimas publicações? Inscreva-se em nossa newsletter!

Receba conteúdos e fique sempre atualizado sobre as novidades em gestão, liderança e carreira com a Revista E&S.

Ao preencher o formulário você está ciente de que podemos enviar comunicações e conteúdos da Revista E&S. Confira nossa Política de Privacidade