Imagem Segmentação de Vendedores em Marketplace C2C Utilizando Análise de Cluster

24 de fevereiro de 2026

Segmentação de Vendedores em Marketplace C2C Utilizando Análise de Cluster

Jhenyffer Oliveira dos Santos; Edilson José Rodrigues

Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.

Esta pesquisa segmentou vendedores de um marketplace C2C por meio do algoritmo de clusterização K-means, visando identificar grupos homogêneos que representem diferentes padrões de desempenho. A investigação buscou organizar a heterogeneidade da base de vendedores em perfis estatisticamente consistentes, utilizando variáveis como taxa de cancelamento, número de restrições e tempo de atividade. A partir da segmentação, o estudo objetivou fornecer subsídios para a formulação de estratégias de gestão, capacitação e incentivo, permitindo ações mais direcionadas para cada perfil de vendedor. Tal abordagem é necessária devido à complexidade das plataformas de e-commerce; a diversidade de comportamentos exige ferramentas analíticas para uma compreensão aprofundada dos usuários.

A segmentação de mercado é uma prática essencial para estratégias comerciais, permitindo que empresas aloquem recursos de forma eficiente (Kotler e Keller, 2016). Em marketplaces C2C, essa necessidade é amplificada pela vasta e diversificada população de vendedores. Análises descritivas tradicionais são frequentemente insuficientes para capturar os padrões de comportamento em conjuntos de dados complexos. Diante disso, técnicas de mineração de dados, como a análise de cluster, surgem como ferramentas capazes de revelar agrupamentos naturais nos dados sem hipóteses pré-definidas (Han, Kamber e Pei, 2012).

A análise de cluster, ou clusterização, é uma técnica de aprendizado não supervisionado que particiona observações em subconjuntos (clusters), de modo que as observações em um mesmo cluster sejam mais semelhantes entre si do que com as de outros clusters. A abordagem é adequada para descobrir a estrutura intrínseca dos dados. Sua aplicação na segmentação de vendedores permite identificar perfis comportamentais que emergem da combinação de múltiplos indicadores. Estudos recentes reforçam a validade da clusterização em contextos de comércio eletrônico, especialmente após a aceleração da digitalização impulsionada pela pandemia de COVID-19 (Santos et al., 2021; Oliveira & Silva, 2022).

O problema de pesquisa partiu da ineficácia de uma abordagem única para gerenciar uma base heterogênea de vendedores. A ausência de uma segmentação clara dificulta a implementação de políticas de incentivo para bons vendedores, programas de capacitação para aqueles com potencial e medidas corretivas para os que apresentam comportamento prejudicial. O algoritmo K-means, um dos métodos de clusterização mais difundidos (Jain, 2010), foi escolhido como ferramenta para transformar dados brutos de desempenho em insights acionáveis para a gestão do marketplace.

A relevância desta investigação reside na sua capacidade de oferecer uma metodologia estruturada para a compreensão do ecossistema de vendedores. Ao identificar perfis como “Vendedores Estáveis”, “Vendedores Experientes”, “Vendedores Problemáticos” e “Vendedores Críticos”, o estudo fornece um diagnóstico que pode orientar decisões estratégicas. A validação estatística dos clusters, por meio de testes de variância, assegura que as diferenças encontradas refletem padrões de comportamento consistentes, conferindo robustez e confiabilidade aos resultados e às recomendações práticas.

A pesquisa classifica-se como aplicada, pois gerou conhecimento com aplicabilidade prática para um problema de gestão comercial (Gil, 2019). Quanto aos objetivos, o estudo foi descritivo, ao detalhar as características dos vendedores, e exploratório, ao usar a clusterização para descobrir padrões latentes. Sob a ótica de Vergara (2016), a pesquisa é também metodológica, por empregar procedimentos estatísticos para análise de dados multivariados, e aplicada, por gerar subsídios para a tomada de decisão. O procedimento técnico foi o documental, com análise baseada em dados secundários da plataforma.

A base de dados continha 20.105 registros anonimizados de vendas. O critério de inclusão foi a realização de, no mínimo, três vendas por vendedor. As variáveis selecionadas para a clusterização foram a taxa de cancelamento de GMV (Gross Merchandise Value), o número de restrições e o tempo de atividade do vendedor. O tratamento dos dados incluiu a limpeza de registros e a padronização Z-score para garantir a comparabilidade entre as variáveis, que possuíam escalas distintas. Este procedimento transforma cada variável para ter média zero e desvio-padrão unitário, evitando que variáveis com maior amplitude dominem o cálculo das distâncias, uma prática essencial em análises multivariadas (Hair et al., 2010).

A clusterização foi realizada com o algoritmo K-means, um método particional que minimiza a soma das distâncias quadráticas entre os pontos e o centroide do cluster (Hastie, Tibshirani e Friedman, 2009). A determinação do número ótimo de clusters (k) foi feita por uma abordagem combinada: o método do cotovelo (Elbow Method), que analisa a soma dos quadrados dos erros (SSE), e o coeficiente de silhueta, que avalia a coesão e separação dos clusters. A combinação desses critérios aumenta a confiança na escolha do número de agrupamentos (Kodinariya e Makwana, 2013). Para a visualização dos resultados, a Análise de Componentes Principais (PCA) foi empregada para reduzir a dimensionalidade e projetar os clusters em um espaço bidimensional e tridimensional (Jolliffe e Cadima, 2016).

A análise exploratória inicial, via matriz de correlação, revelou uma correlação negativa moderada (-0,24) entre o tempo de atividade e a taxa de cancelamento, sugerindo que vendedores mais experientes tendem a ter operações mais estáveis. A variável “número de restrições” apresentou correlações próximas de zero com as outras duas, indicando que punições não estão diretamente ligadas à experiência ou à taxa de cancelamento. A baixa correlação entre as variáveis foi um indicativo positivo para a clusterização, confirmando que cada métrica trazia uma dimensão de informação relativamente independente.

A definição do número de clusters foi guiada pelo método do cotovelo, que analisou a redução da SSE para k variando de 1 a 10. O gráfico mostrou uma queda acentuada até k=4, ponto a partir do qual a curva se suavizou. Essa análise, complementada pelo coeficiente de silhueta, apontou quatro clusters como a solução mais equilibrada. A visualização dos quatro clusters por meio da PCA corroborou essa escolha. A projeção dos dados em gráficos bidimensional e tridimensional mostrou agrupamentos visualmente distintos, com a representação 3D evidenciando uma separação mais clara entre os grupos, validando a consistência da segmentação.

A caracterização dos quatro clusters revelou perfis de vendedores com comportamentos distintos. O Cluster 0, “Vendedores Estáveis”, foi o maior grupo, com 53,58% da amostra. Este perfil apresenta taxa de cancelamento baixa (média de 10%), tempo de atividade relativamente curto (média de 459 dias) e número médio de restrições (8,43). Representam vendedores em consolidação, com desempenho regular, que formam a espinha dorsal da plataforma.

O Cluster 1, com 30,77% dos vendedores, foi identificado como “Vendedores Experientes”. Este grupo destacou-se pelo longo tempo de atividade (média de 2.877 dias), combinado com uma taxa de cancelamento muito baixa (média de 9%) e o menor número médio de restrições (7,60). São os ativos mais valiosos da plataforma, demonstrando estabilidade, confiabilidade e conformidade. Sua longevidade e desempenho indicam alto profissionalismo, alinhando-se à ideia de que experiência e estabilidade são indicadores de baixo risco (Damodaran, 2012).

O Cluster 3, com 11,52% dos vendedores, foi classificado como “Vendedores Críticos”. Este perfil apresentou a pior combinação de indicadores: taxa de cancelamento extremamente elevada (média de 96%), tempo de atividade curto (média de 384 dias) e número de restrições também elevado (8,99). Esses vendedores representam o maior risco operacional, com comportamento que sugere incapacidade de gestão, problemas de estoque ou práticas predatórias. Este grupo demanda ações de intervenção imediatas e rigorosas para proteger o ecossistema comercial.

A discussão dos resultados alinha-se à literatura que demonstra a eficácia da clusterização para identificar grupos com diferentes níveis de risco e desempenho (Chen et al., 2017). A distinção entre os clusters revelou padrões de comportamento complexos, como o perfil “problemático” do Cluster 2, fornecendo insights granulares para a gestão de plataformas digitais. As implicações gerenciais são diretas: para o Cluster 1 (Experientes), benefícios exclusivos; para o Cluster 0 (Estáveis), programas de capacitação; para o Cluster 2 (Problemáticos), monitoramento focado em qualidade; e para o Cluster 3 (Críticos), uma política de tolerância zero.

A validação estatística confirmou a robustez da segmentação. Os resultados da ANOVA mostraram diferenças estatisticamente significativas (p < 0,05) entre as médias de todas as variáveis nos quatro clusters. Os valores elevados de eta quadrado (η²) demonstraram que a pertença ao cluster explicava uma proporção substancial da variabilidade nos indicadores. Essa validação quantitativa confere alta confiança aos perfis identificados, permitindo que as decisões estratégicas se baseiem em evidências empíricas, em conformidade com as melhores práticas da análise de dados (Hair et al., 2010; Marôco, 2018).

Em síntese, a pesquisa demonstrou que a análise de cluster é uma ferramenta poderosa para decodificar a complexidade de uma base de vendedores. A organização da heterogeneidade em quatro perfis distintos e interpretáveis permite a transição de uma visão monolítica para uma perspectiva segmentada, possibilitando a criação de políticas diferenciadas que podem recompensar o bom desempenho, corrigir desvios e proteger a comunidade de usuários. A metodologia e os achados contribuem para a prática da gestão de e-commerce, mostrando como a ciência de dados pode otimizar operações em ambientes digitais.

O estudo atingiu seu objetivo ao segmentar os vendedores de um marketplace C2C em quatro perfis distintos e estatisticamente válidos: “Vendedores Estáveis”, “Vendedores Experientes”, “Vendedores Problemáticos” e “Vendedores Críticos”. Cada perfil demonstrou uma combinação única de taxa de cancelamento, tempo de atividade e número de restrições, confirmando a adequação da abordagem multivariada. As contribuições do trabalho são acadêmicas, ao reforçar a aplicação de técnicas de clusterização, e práticas, ao fornecer um framework acionável para a tomada de decisão gerencial.

O estudo possui limitações, como a análise de um único marketplace, o que restringe a generalização dos perfis. Foram utilizadas apenas variáveis quantitativas, deixando de fora dimensões qualitativas que poderiam enriquecer a análise. A escolha exclusiva do algoritmo K-means pode não ser ideal para todos os tipos de clusters. Para pesquisas futuras, sugere-se a replicação do estudo em diferentes marketplaces, a inclusão de variáveis qualitativas e a comparação com outros algoritmos de clusterização (DBSCAN). Análises longitudinais que acompanhem a migração de vendedores entre clusters também representariam um avanço. Conclui-se que o objetivo da pesquisa foi plenamente atingido, ao demonstrar que a aplicação de técnicas de clusterização permite segmentar vendedores de marketplace C2C em perfis estatisticamente distintos e operacionalmente relevantes.

Referências:
Altman, E. I. (1968). Financial ratios, discriminant analysis and the prediction of corporate bankruptcy. The Journal of Finance, 23(4), 589–609. https://doi. org/10.1111/j.1540-6261.1968. tb00843. x
Chen, S., Li, H., Li, C., & Zhang, J. (2017). Comparing clustering methods for market segmentation. Expert Systems with Applications, 84, 250–260. https://doi. org/10.1016/j. eswa.2017.05.003
Damodaran, A. (2012). Investment valuation: Tools and techniques for determining the value of any asset (3rd ed.). John Wiley & Sons.
Fávero, L. P., & Belfiore, P. (2017). Manual de análise de dados: Estatística e modelagem multivariada com Excel®, SPSS® e Stata®. Elsevier.
Gil, A. C. (2019). Métodos e técnicas de pesquisa social (7. ed.). Atlas.
Hair, J. F., Black, W. C., Babin, B. J., & Anderson, R. E. (2010). Multivariate data analysis (7th ed.). Pearson Prentice Hall.
Han, J., Kamber, M., Pei, J. (2012). Data Mining: Concepts and Techniques (3rd ed.). Morgan Kaufmann.
Hastie, T., Tibshirani, R., & Friedman, J. (2009). The elements of statistical learning: Data mining, inference, and prediction (2nd ed.). Springer. https://doi. org/10.1007/978-0-387-84858-7
Jain, A. K. (2010). Data clustering: 50 years beyond K-means. Pattern Recognition Letters, 31(8), 651–666. https://doi. org/10.1016/j. patrec.2009.09.011
Jolliffe, I. T., & Cadima, J. (2016). Principal component analysis: a review and recent developments. Philosophical Transactions of the Royal Society A: Mathematical, Physical and Engineering Sciences, 374(2065), 20150202.
Kodinariya, T. M., & Makwana, P. R. (2013). Review on determining number of cluster in K-means clustering. International Journal of Advance Research in Computer Science and Management Studies, 1(6), 90–95.
Kotler, P., & Keller, K. L. (2016). Marketing management (15th ed.). Pearson.
Marôco, J. (2018). Análise Estatística com o SPSS Statistics (7th ed.). ReportNumber.
Oliveira, M. F., & Silva, R. P. (2022). Transformações digitais e o crescimento do marketplace durante a pandemia. Journal of Digital Commerce, 5(1), 12-25.
Santos, A. L., et al. (2021). Impactos da pandemia no comércio eletrônico brasileiro: uma análise dos perfis de vendedores. Revista Brasileira de Marketing, 20(3), 45-60.
Tukey, J. W. (1977). Exploratory data analysis. Addison-Wesley.
Vergara, S. C. (2016). Projetos e relatórios de pesquisa em administração (16. ed.). Atlas.
Xu, R., & Tian, Y. (2015). A comprehensive survey of clustering algorithms. Annals of Data Science, 2(2), 165–193.

Resumo executivo oriundo de Trabalho de Conclusão de Curso de Especialização em Data Science e Analytics do MBA USP/Esalq

Saiba mais sobre o curso; clique aqui:

Quem editou este artigo

Você também pode gostar

Quer ficar por dentro das nossas últimas publicações? Inscreva-se em nossa newsletter!

Receba conteúdos e fique sempre atualizado sobre as novidades em gestão, liderança e carreira com a Revista E&S.

Ao preencher o formulário você está ciente de que podemos enviar comunicações e conteúdos da Revista E&S. Confira nossa Política de Privacidade