Resumo Executivo

Imagem Modelagem preditiva para otimização de campanhas publicitárias com machine learning

09 de fevereiro de 2026

Modelagem preditiva para otimização de campanhas publicitárias com machine learning

Nathalia Mori Rezende; Nicole Cerci Mostagi

Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.

O objetivo deste estudo foi investigar como modelos preditivos de machine learning podem refinar a tomada de decisões em uma organização educacional, com foco na geração de leads de alta qualidade e na sazonalidade do setor. A pesquisa treinou e avaliou modelos como Regressão Linear e XGBoost para modelar métricas de publicidade, incluindo volume de leads, custo por lead (CPL) e custo por clique (CPC), fornecendo insumos para a previsão de desempenho. O trabalho também explorou o uso de machine learning para aprimorar a aplicação do Marketing Mix Modeling (MMM), permitindo ajustes dinâmicos às mudanças de mercado. Por fim, o estudo implementou e avaliou a otimização contínua de campanhas, integrando os modelos preditivos a estratégias de alocação de orçamento para maximizar o retorno sobre o investimento.

Na era digital, os dados orientam as organizações para decisões mais estratégicas (Marriott & Willms, 2018). A implementação de ações efetivas depende da utilização de informações de alta qualidade. Com o aumento da disponibilidade de dados e os avanços na ciência da computação, empresas têm adotado modelos de previsão para aprimorar suas estratégias de marketing (Sharma et al., 2020). A análise preditiva oferece uma compreensão do comportamento do consumidor, permitindo antecipar os efeitos de fatores complexos como as variações sazonais no cenário do marketing (Farris et al., 2016).

Apesar das oportunidades da modelagem preditiva, persistem desafios relacionados às oscilações no comportamento do consumidor e nos sinais de mercado (Han et al., 2011). Nesse cenário, o Marketing Mix Modeling (MMM) emerge como uma ferramenta para analisar como diferentes variáveis de marketing influenciam os resultados, considerando o impacto de fatores externos como a sazonalidade (Lukas & Ferrell, 2000). As empresas que aplicam essa metodologia utilizam análises estatísticas para quantificar o impacto de cada elemento do mix de marketing, como preço e promoção, resultando em melhorias no retorno sobre o investimento (Katz, 2021). Contudo, a eficácia do MMM é diretamente dependente da qualidade e granularidade dos dados históricos disponíveis (Wansink & Lee, 2018).

A implementação prática do MMM enfrenta barreiras operacionais, como a coleta e integração de dados de fontes heterogêneas, que incluem plataformas online, campanhas offline e fatores macroeconômicos (Hansen & Sorensen, 2019). A criação de um modelo unificado a partir dessa multiplicidade de informações é um desafio técnico. Além disso, a interpretação dos resultados exige profissionais qualificados, capazes de compreender os dados e as dinâmicas do mercado. No setor educacional, as campanhas de captação de alunos são fortemente influenciadas por fatores sazonais, como períodos de inscrição e a divulgação de resultados de exames nacionais, tornando a análise preditiva ainda mais crítica.

Organizações educacionais que empregam modelos de previsão conseguem identificar quais canais e mensagens geram melhor desempenho em diferentes épocas do ano, otimizando a alocação de recursos e aumentando a conversão (Kotler et al., 2021). A qualidade dos dados é um pilar fundamental. Chen et al. (2022) enfatizam a importância do monitoramento e da preparação das informações sobre potenciais alunos, desde a origem até a matrícula. A combinação do Marketing Mix Modeling com algoritmos de machine learning capacita as instituições a prever com maior confiabilidade a quantidade e a qualidade dos leads, transformando dados históricos em ações estratégicas que melhoram a eficácia das campanhas.

Este estudo foi conduzido com natureza aplicada, focando na modelagem preditiva para otimização de campanhas publicitárias no setor educacional. A abordagem foi o estudo de caso, permitindo uma análise de dados históricos reais de uma empresa de educação. A coleta de dados foi realizada a partir de fontes secundárias, especificamente do Google Ads, de onde foram extraídas informações de campanhas. O conjunto de dados abrangeu o período de agosto a outubro de 2024 e incluiu métricas como investimento, impressões, cliques, leads, custo por clique (CPC) e custo por aquisição (CPA). Os dados foram exportados em formato CSV diretamente da plataforma.

O desenvolvimento do sistema e a implementação dos modelos foram realizados em Python. As bibliotecas Pandas e NumPy foram utilizadas para a manipulação e pré-processamento dos dados, enquanto Matplotlib e Seaborn foram usadas para visualizações. A biblioteca Scikit-learn foi a ferramenta principal para a implementação dos algoritmos de machine learning, incluindo treinamento, processamento e avaliação. O pré-processamento dos dados envolveu a conversão de colunas de texto, como ‘Investimento’, para formatos numéricos, garantindo a consistência para a modelagem.

Dois algoritmos preditivos foram aplicados: Regressão Linear e XGBoost (Extreme Gradient Boosting). A Regressão Linear foi utilizada para modelar a relação linear entre a variável independente (‘Investimento’) e a dependente (‘Leads’). Conforme James et al. (2013), este modelo é valorizado por sua simplicidade, embora seja sensível a outliers. O segundo algoritmo, XGBoost, é uma técnica baseada em gradient boosting desenvolvida por Chen e Guestrin (2016). Este método constrói um conjunto de árvores de decisão de forma iterativa; cada nova árvore corrige os erros da anterior, sendo conhecido por sua alta precisão em cenários com relações não lineares (Geron, 2019).

Para garantir a robustez dos modelos, o conjunto de dados foi dividido em subconjuntos de treinamento (80%) e teste (20%). O conjunto de treinamento foi usado para que os modelos aprendessem os padrões, enquanto o de teste, com dados não vistos, serviu para avaliar o desempenho em um cenário de aplicação real. A principal métrica de avaliação foi o Coeficiente de Determinação (R²), que mede a proporção da variância na variável dependente que é previsível a partir da independente. Um valor de R² próximo de 1 indica um bom ajuste do modelo (James et al., 2013). A combinação desses métodos permitiu uma análise comparativa, equilibrando a simplicidade da Regressão Linear com a robustez do XGBoost (Hastie et al., 2009).

A análise inicial dos dados históricos revelou uma forte correlação positiva entre investimento em publicidade e o número de leads gerados. A visualização gráfica demonstrou que, com o aumento do investimento, o volume de leads também cresce. A relação observada não foi estritamente linear, sugerindo uma tendência de retornos acelerados; investimentos mais altos parecem gerar um crescimento exponencial no número de leads. Isso indica a possível existência de economias de escala ou pontos de inflexão onde as campanhas atingem maior eficiência. Investimentos iniciais de baixo valor mostraram retorno modesto, mas a partir de certo patamar, a eficiência na geração de leads aumentou.

Em contrapartida, a análise da relação entre a Taxa de Cliques (CTR) e o volume de leads apresentou um cenário sem correlação linear clara. O gráfico de dispersão mostrou que campanhas com CTRs baixos poderiam gerar um volume significativo de leads, enquanto CTRs altos não garantiam um desempenho superior em conversão. Essa fraca correlação sugere que o CTR, isoladamente, não é o principal impulsionador da geração de leads. Outros fatores, como a qualidade do tráfego, a relevância da oferta, a experiência na página de destino e a eficácia das chamadas para ação, desempenham um papel crucial na conversão.

A aplicação do modelo de Regressão Linear buscou quantificar a relação entre investimento e leads. Para um investimento hipotético de R$ 10.000,00, o modelo previu a geração de aproximadamente 1.072 leads. A avaliação da qualidade do ajuste resultou em um Coeficiente de Determinação (R²) de 0,66. Este valor indica que 66% da variação no número de leads pode ser explicada pela variação no investimento, segundo o modelo. Este é um resultado robusto para um problema prático, considerando a influência de variáveis não incluídas, como sazonalidade e ações da concorrência.

O modelo XGBoost foi então aplicado ao mesmo conjunto de dados. Em sua primeira iteração, utilizando apenas o investimento como variável preditora, o modelo apresentou um desempenho inferior ao da Regressão Linear, com um R² de 0,23. Para o mesmo investimento de R$ 10.000,00, o modelo previu a geração de 186 leads. A discrepância no desempenho sugeriu que, para este conjunto de dados com uma única variável, a relação subjacente era predominantemente linear, favorecendo o modelo mais simples. O desempenho inferior do XGBoost poderia ser atribuído à necessidade de um ajuste mais fino de hiperparâmetros ou a um potencial overfitting.

Diante do resultado, uma segunda análise foi conduzida com o XGBoost, enriquecendo o conjunto de dados com variáveis demográficas como idade e sexo. A análise dos dados históricos segmentados confirmou que o público jovem, na faixa etária de 18 a 24 anos, concentrou os retornos mais expressivos. Em contraste, as faixas etárias acima de 55 anos apresentaram desempenho consistentemente inferior. A variável sexo não demonstrou diferenças marcantes, embora o público feminino tenha se destacado pontualmente em níveis de investimento intermediários.

O modelo XGBoost, treinado com essas variáveis demográficas adicionais, demonstrou uma capacidade preditiva notavelmente superior. O modelo não apenas reproduziu a tendência de crescimento observada nos dados, mas também conseguiu um ajuste perfeito aos dados de teste, alcançando um R² igual a 1. Este resultado indica que, com a inclusão das variáveis demográficas, o modelo foi capaz de explicar integralmente a variabilidade na geração de leads. As curvas de previsão geradas pelo modelo mostraram pontos de inflexão característicos das árvores de decisão, confirmando a vantagem dos segmentos de 18 a 24 e 25 a 34 anos.

A convergência entre a análise empírica dos dados históricos e as estimativas do modelo XGBoost refinado confere segurança para a formulação de estratégias de mídia. Os resultados confirmam a relação direta entre o aumento do investimento e a geração de leads, destacando o público jovem como o principal catalisador de retorno. A capacidade do modelo de prever com alta precisão o volume de leads para diferentes níveis de investimento e segmentos demográficos oferece uma ferramenta para o planejamento estratégico, permitindo a otimização da alocação de orçamento e a maximização da eficiência.

A comparação entre os modelos de Regressão Linear e XGBoost ilustra que a complexidade de um algoritmo não garante desempenho superior. Enquanto a Regressão Linear forneceu um baseline sólido com um R² de 66%, o XGBoost, em sua aplicação inicial, performou de maneira subótima (R² de 23%). No entanto, ao ser alimentado com características mais relevantes (dados demográficos), o XGBoost demonstrou seu potencial, alcançando um ajuste perfeito (R² de 1,0) e revelando insights sobre os segmentos de público mais responsivos. Isso reforça a importância da engenharia de características e da compreensão do domínio do problema para o sucesso da modelagem preditiva.

Em síntese, a pesquisa demonstrou a aplicação de modelos preditivos para otimizar campanhas publicitárias no setor educacional. A análise identificou uma relação de retornos crescentes entre investimento e geração de leads, com o público na faixa de 18 a 24 anos emergindo como o segmento de maior potencial. A implementação de um modelo XGBoost, enriquecido com dados demográficos, forneceu uma ferramenta de alta precisão para prever o desempenho de campanhas e orientar a alocação de orçamento. A convergência entre a análise de dados e a modelagem preditiva oferece uma base robusta para a tomada de decisões, permitindo que as instituições planejem seus investimentos com maior previsibilidade.

A principal contribuição prática deste trabalho reside na validação de uma metodologia data-driven que permite às equipes de marketing adotar uma postura proativa e preditiva. Ao quantificar o impacto do investimento e identificar os segmentos de público mais valiosos, as organizações podem direcionar seus recursos de forma mais eficiente, aumentando o retorno sobre o investimento. Conclui-se que o objetivo foi atingido: demonstrou-se como modelos preditivos de machine learning podem refinar a tomada de decisões em campanhas publicitárias no setor educacional, otimizando a geração de leads e a alocação de investimentos.

Referências:
CHEN, H.; PAPAZAFEIROPOULOU, A.; FENG, Y. Análise preditiva em marketing de ensino superior. Gestão de Sistemas de Informação, 2022.
CHEN, T.; GUESTRIN, C. XGBoost: A Scalable Tree Boosting System. Proceedings of the 22nd ACM SIGKDD, 2016.
DAS, A. K. Advancements in AI-driven Marketing Strategies. TechRxiv, 2024.
DAVENPORT, T. H.; HARRIS, J. G. Competindo em Análise: A Nova Ciência da Vitória. Harvard Business Review Press, 2017.
FARRIS, P. W. et al. Métricas de marketing: o guia definitivo para medir o desempenho de marketing. Pearson, 2016.
GERON, A. Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow. O’Reilly Media, 2019.
GROVER, V.; KETTINGER, W. J. Mudança de Processos de Negócios e Desempenho Empresarial: Compreendendo o Efeito Moderador dos Sistemas de Informação. MIS Trimestral, 2015.
HAN, J.; KAMBER, M.; PEI, J. Mineração de Dados: Conceitos e Técnicas. Elsevier, 2011.
HANSEN, F.; SØRENSEN, H. E. O Impacto do Big Data em Modelos de Marketing Mix. Journal of Business Research, 2019.
HASTIE, T.; TIBSHIRANI, R.; FRIEDMAN, J. The Elements of Statistical Learning. Springer, 2009.
JAMES, G. et al. An Introduction to Statistical Learning. Springer, 2013.
JAMES, G., Witten, D., Hastie, T., & Tibshirani, R. (2013). An Introduction to Statistical Learning: with Applications in R. Springer.
KATZ, J. Modelagem de mix de marketing: entendendo o ROI do marketing. Wiley, 2021.
KOTLER, P. et al. Marketing 5.0: Tecnologia para a Humanidade. 1. ed. Rio de Janeiro: Sextante, 2021.
KOTLER, P.; KELLER, K. L.; CHERNEV, A. Gestão de Marketing. Pearson, 2021.
KUMAR, A.; SHARMA, P. AI-Powered Marketing Optimization: A Data-Driven Approach. Proceedings of the ACM International Conference on AI and Business Strategy, 2024.
LUKAS, B. A.; FERRELL, O. C. O efeito da orientação de mercado na inovação de produtos. Journal of the Academy of Marketing Science, 2000.
LUKIC, R. Analysis of Emission of Greenhouse Gases by Economic Activities and by Pollutants of the European Union Based on the RAM Method. ResearchGate, 2024.
MARRIOTT, N.; WILLIAMS, D. Introdução à Análise de Dados. Routledge, 2018.
PYTHON SOFTWARE FOUNDATION. Python Language Reference, version 5. x. Python Software Foundation, [20XX].
SCIKIT-LEARN. Scikit-learn: Machine Learning in Python. Scikit-learn.
SHARMA, R.; LILIENTHAL, A. Análise preditiva em marketing. Springer, 2020.
SIEGEL, E. Análise preditiva: o poder de prever quem clicará, comprará, mentirá ou morrerá. Wiley, 2016.
SMITH, J. Modeling Marketing Mix: Concept of the MA Approach. NextBrain AI, 2023.
WANG, H.; CHEN, X. Real-Time Marketing Attribution Using Machine Learning. IEEE Transactions on Computational Advertising, 2024.
WANSINK, B.; LEE, K. Dados históricos na tomada de decisões de marketing. Journal of Marketing Research, 2018.
ZHANG, Z.; LI, J.; WANG, Y.; et al. Marketing Mix Modeling in the Era of Digital Advertising. IEEE Transactions on Computational Social Systems, 2024.s

Resumo executivo oriundo de Trabalho de Conclusão de Curso de Especialização em Digital Business do MBA USP/Esalq

Saiba mais sobre o curso; clique aqui:

Quem editou este artigo

Você também pode gostar

Quer ficar por dentro das nossas últimas publicações? Inscreva-se em nossa newsletter!

Receba conteúdos e fique sempre atualizado sobre as novidades em gestão, liderança e carreira com a Revista E&S.

Ao preencher o formulário você está ciente de que podemos enviar comunicações e conteúdos da Revista E&S. Confira nossa Política de Privacidade