22 de abril de 2026
Design orientado a dados para personalização no e-commerce
Erika Luzie Vanoni Peixoto; Paula Bruzadelle Vieira
Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.
Projetar uma experiência de usuário no ambiente digital contemporâneo exige uma integração profunda entre as necessidades do negócio, as capacidades tecnológicas e, primordialmente, o comportamento humano. Jesse James Garrett (2011) estabelece que uma experiência bem projetada deve transcender a estética, focando na eficiência e na satisfação das necessidades dos usuários enquanto atende aos objetivos organizacionais. A experiência do usuário não se limita ao produto físico ou digital isolado, mas abrange todas as variáveis de uso possíveis, onde a falha em qualquer etapa do processo compromete a percepção de valor. Com a evolução tecnológica, as interações tornaram-se mais complexas, exigindo que o design se reinventasse para a era dos produtos digitais. O conceito clássico de que a forma segue a função, embora central por décadas, encontra limitações em interfaces compostas por pixels, onde elementos visuais não possuem formas físicas fixas, mas representações simbólicas. Conforme define Bonsiepe (2015), a interface atua como um espaço de abertura para uma realidade virtual, exigindo que o usuário interprete e decodifique símbolos, gestos e elementos em um novo espaço de interação. Para que um projeto seja eficaz nesse cenário, a compreensão do usuário por meio de dados torna-se indispensável. A utilização de métricas permite conhecer comportamentos, quantificar resultados e identificar pontos de melhoria de forma objetiva. Albert e Tullis (2008) destacam a importância de métricas de usabilidade, satisfação e testes comparativos para medir o desempenho de diferentes versões de uma interface e identificar a solução mais eficaz para objetivos específicos. Além disso, o uso de técnicas estatísticas para a criação de perfis, como demonstrado por Tempelman-Kluit e Pearce (2014), permite a síntese de características e comportamentos em personas que servem de referência para o desenvolvimento de soluções alinhadas às necessidades reais. A exploração de dados no estudo de interfaces oferece oportunidades para otimizar o desempenho tecnológico e trazer benefícios financeiros, fundamentando as decisões de design em evidências concretas de consumo e navegação.
A fundamentação teórica deste estudo baseia-se na premissa de que a segmentação de usuários, fundamentada em dados reais de transações, permite a criação de regras de personalização que aprimoram a jornada de compra no comércio eletrônico. A análise de padrões de comportamento de compra, especificamente o valor gasto e a quantidade de parcelas utilizadas, fornece a base para agrupar consumidores com características semelhantes. Ao identificar esses grupos, torna-se possível desenvolver propostas de interface que priorizem a visibilidade de métodos de pagamento específicos, como o desconto para pagamentos à vista via PIX em compras de maior valor, demonstrando como a abordagem orientada a dados pode refinar a experiência do usuário e potencializar os resultados comerciais. O design orientado a dados, portanto, não substitui a criatividade, mas a direciona para soluções que possuem maior probabilidade de aceitação e engajamento por parte do público-alvo, reduzindo a incerteza inerente ao processo de criação de novas funcionalidades em plataformas de e-commerce.
A metodologia aplicada compreendeu a utilização do banco de dados público de comércio eletrônico brasileiro disponibilizado pela plataforma Olist, que contém informações anonimizadas de clientes reais. O processamento e a análise desses dados foram realizados utilizando a linguagem de programação Python no ambiente de desenvolvimento Spyder. O conjunto de dados original era composto por nove arquivos distintos em formato de planilha, os quais foram integrados por meio de colunas comuns para viabilizar uma análise consolidada. As variáveis selecionadas para o estudo incluíram o identificador único do cliente, a data e hora da compra, a quantidade de parcelas do pagamento e o valor total da transação. A escolha dessas métricas específicas visou compreender os hábitos de pagamento dos usuários, permitindo a proposição de condições especiais de parcelamento ou descontos. O procedimento estatístico de clusterização seguiu as diretrizes estabelecidas por Fávero e Belfiore (2017), recorrendo-se também aos fundamentos de estatística elementar de Bluman (2014) para a análise de significância e tratamento de variáveis. A técnica de agrupamento escolhida foi o K-Means, um método de aprendizado não supervisionado ideal para tratar variáveis quantitativas e identificar estruturas latentes nos dados sem a necessidade de rótulos prévios.
A preparação dos dados envolveu etapas rigorosas de limpeza e organização. Inicialmente, as planilhas foram carregadas e interpretadas para identificar quais variáveis seriam pertinentes à clusterização. Informações relacionadas à geolocalização, como CEP, cidade e estado, bem como detalhes logísticos e avaliações de produtos, foram descartadas por não contribuírem diretamente para o objetivo de segmentação por comportamento financeiro. O banco de dados consolidado apresentava originalmente 103.886 observações registradas entre os anos de 2017 e 2018. Para garantir que a análise refletisse um comportamento de consumo mais atual e condizente com uma implementação real, optou-se por filtrar apenas as transações ocorridas em 2018, totalizando 56.361 registros. Durante a fase de exploração, verificou-se que a vasta maioria dos clientes realizou apenas uma única compra no período analisado. De um total de 56.361 registros, 56.068 correspondiam a compras únicas, enquanto apenas 293 clientes apresentavam recorrência. Para manter a uniformidade dos dados e evitar distorções causadas por comportamentos atípicos de usuários recorrentes, decidiu-se considerar apenas a última compra realizada por cada cliente, excluindo registros anteriores.
Após a seleção das observações, as variáveis de valor de pagamento e número de parcelas foram submetidas ao procedimento de padronização via Z-score. Essa etapa foi necessária devido à diferença de escalas e amplitudes entre as variáveis, garantindo que ambas tivessem o mesmo peso durante o processo de agrupamento. A função utilizada para este fim foi proveniente do pacote estatístico Scipy. Antes da aplicação do algoritmo K-Means, realizou-se uma análise de dispersão para identificar a presença de valores discrepantes, conhecidos como outliers. A detecção de outliers é crítica em algoritmos de clusterização baseados em centroides, pois observações extremas podem deslocar significativamente a posição dos agrupamentos, prejudicando a interpretação dos resultados. Foram removidas todas as observações que apresentavam um valor de Z-score superior a três em qualquer uma das variáveis analisadas. Após essa limpeza, o conjunto de dados final para a clusterização contou com 51.964 observações. A definição do número ideal de clusters foi realizada por meio da aplicação conjunta do método de Elbow e do método da Silhueta. O método de Elbow indicou uma mudança acentuada na inclinação da curva no ponto correspondente a dois grupos, enquanto o método da Silhueta confirmou essa escolha ao apresentar o valor médio mais próximo de um para essa configuração, indicando que as observações estavam bem alocadas em seus respectivos clusters e distantes dos demais.
O processo operacional de análise de dados foi complementado por métodos qualitativos de design de experiência. Utilizou-se a técnica de brainstorming para a geração de ideias de interface e o mapeamento da jornada do usuário, conforme descrito por Teixeira (2022). O brainstorming permitiu explorar uma vasta gama de possibilidades de intervenção na interface sem o julgamento imediato da viabilidade, focando no volume de soluções para posterior refinamento. A jornada do usuário foi desenhada para descrever os passos sequenciais da experiência de compra, desde a entrada no site até a confirmação do pedido, permitindo identificar os momentos mais oportunos para a inserção de ofertas personalizadas. Essa integração entre a análise quantitativa de clusters e a visão qualitativa da jornada de compra assegurou que as propostas de design fossem não apenas estatisticamente fundamentadas, mas também contextualmente relevantes para o fluxo de navegação do consumidor.
Os resultados obtidos por meio da aplicação do algoritmo K-Means revelaram a existência de dois perfis distintos de comportamento de compra no e-commerce analisado. O primeiro grupo, denominado Cluster 0, representou a maioria expressiva da amostra, abrangendo 41.902 observações, o que equivale a 80,6% do total. Este perfil caracterizou-se por transações de menor valor financeiro e baixo índice de parcelamento, apresentando uma média de 1,64 parcelas e um ticket médio de R$ 114,86. Em contrapartida, o Cluster 1 concentrou 10.062 observações, representando 19,4% da base de dados. Este segundo grupo apresentou um comportamento de consumo significativamente diferente, com uma média de 6,98 parcelas e um valor médio de compra de R$ 229,90. A validação estatística desses agrupamentos foi realizada por meio do teste ANOVA, que confirmou a significância das variáveis na formação dos clusters, apresentando um p-valor inferior a 0,05 para ambas as métricas. Essa distinção clara entre os grupos evidencia que o valor da compra exerce uma influência direta na decisão do usuário quanto à forma de pagamento, onde compras mais onerosas tendem a ser diluídas em um número maior de prestações.
A análise detalhada das faixas de valor revelou que o Cluster 0 concentra a quase totalidade das compras de até R$ 200,00, com uma presença massiva em transações que não ultrapassam três parcelas. Já o Cluster 1, embora menor em volume de usuários, engloba a maioria das compras acima de R$ 400,00 e a totalidade das transações parceladas em quatro vezes ou mais. Esses dados sugerem que existe uma oportunidade latente para incentivar mudanças de comportamento por meio de estímulos visuais e financeiros na interface. Ao interpretar essas descobertas sob a ótica do design de experiência, identificaram-se dois caminhos estratégicos: reforçar os comportamentos já existentes ou propor novos hábitos de consumo. Conforme discutido por Eyal e Hoover (2020), a criação de novos hábitos é um dos maiores desafios do design, pois os usuários tendem a seguir caminhos familiares. No entanto, a oferta de benefícios claros, como descontos progressivos, pode atuar como o gatilho necessário para a adoção de novas formas de pagamento.
No contexto das propostas de personalização, o brainstorming gerou soluções focadas na redução de fricção e na aceleração da jornada de compra. Para o perfil identificado no Cluster 0, a interface deve destacar a facilidade do pagamento à vista, uma vez que o comportamento natural desse grupo já é de baixo parcelamento. Para o Cluster 1, a estratégia proposta visa converter o comportamento de alto parcelamento em pagamentos à vista por meio de incentivos financeiros. Uma das soluções desenhadas consiste na oferta de um desconto de 5% para pagamentos via PIX em compras que excedam o valor de R$ 200,00. Essa intervenção seria apresentada em momentos estratégicos da jornada, como na página do produto ou no carrinho, incentivando o usuário a elevar o valor da sua compra para atingir o benefício ou a optar pela liquidação imediata em vez do parcelamento longo. Essa abordagem não apenas beneficia o usuário com uma economia direta, mas também favorece a saúde financeira do e-commerce ao reduzir as taxas pagas às operadoras de cartão de crédito e antecipar o recebimento de valores.
A discussão dos resultados aponta que a segmentação baseada em dados permite que o design deixe de ser puramente especulativo para se tornar assertivo. Ao compreender que quase 20% da base de clientes tende a parcelar compras em sete vezes, a empresa pode desenvolver parcerias para oferecer cartões de crédito próprios ou sistemas de carnê digital, aumentando a fidelização. Por outro lado, a identificação de que 80% dos usuários preferem transações rápidas e de baixo valor reforça a necessidade de uma interface de checkout extremamente ágil, com o mínimo de etapas possível. A jornada fictícia desenhada para este estudo demonstrou que as interferências de design devem ser sutis, mas persistentes. Um banner informativo sobre o desconto no PIX pode aparecer logo após o usuário adicionar um item ao carrinho, e um destaque visual no momento da finalização do pagamento deve reforçar a economia gerada pela escolha do método à vista.
Apesar da robustez dos dados utilizados, é importante reconhecer as limitações deste estudo. A base de dados, embora volumosa, reflete um período específico e um cenário de compras majoritariamente únicas por cliente. A ausência de um histórico longitudinal de compras para cada usuário impede a análise da evolução do comportamento de consumo ao longo do tempo e a criação de personas mais complexas e dinâmicas. Pesquisas futuras poderiam integrar dados de navegação, como tempo de permanência em cada página e cliques em elementos específicos, para cruzar com os dados de fechamento de compra. Além disso, a realização de testes A/B seria o próximo passo lógico para validar se as propostas de interface aqui apresentadas resultam em um aumento real na taxa de conversão e na adoção do pagamento via PIX. A validação qualitativa por meio de entrevistas com usuários de cada cluster também poderia revelar motivações subjetivas que os dados quantitativos não captam, como a insegurança financeira ou a preferência por manter o limite do cartão de crédito livre.
A integração entre ciência de dados e design de experiência do usuário revela-se como um diferencial competitivo crucial no mercado digital. A capacidade de transformar registros brutos de transações em insights acionáveis para a interface permite que as empresas criem ambientes de compra mais acolhedores e eficientes. O uso de técnicas de agrupamento como o K-Means provou ser uma ferramenta eficaz para desvendar a heterogeneidade da base de clientes, permitindo que estratégias de marketing e design sejam direcionadas de forma cirúrgica. Ao priorizar a visibilidade de ofertas para os grupos com maior probabilidade de interesse, o e-commerce não apenas melhora a experiência do usuário, mas também otimiza seus próprios processos operacionais e financeiros. A personalização, portanto, não deve ser vista apenas como uma funcionalidade estética, mas como uma estratégia de negócio fundamentada na compreensão profunda do comportamento humano mediado pela tecnologia.
Conclui-se que o objetivo foi atingido, uma vez que a segmentação dos usuários de e-commerce permitiu a identificação de dois perfis de consumo distintos e a proposição de regras de personalização de interface fundamentadas em dados reais. A aplicação do método K-Means demonstrou que a maioria dos usuários realiza compras de baixo valor com pouco parcelamento, enquanto uma parcela significativa opta por tickets mais altos diluídos em várias prestações. As propostas de design desenvolvidas, como o incentivo ao pagamento via PIX com desconto para compras acima de determinados valores, mostraram-se estratégias viáveis para otimizar a jornada do usuário e os resultados financeiros da organização. O estudo reforça a importância de uma abordagem orientada a dados para substituir suposições por evidências no processo de criação de experiências digitais, garantindo maior assertividade e relevância nas interações entre a plataforma e o consumidor final.
Referências Bibliográficas:
Bluman, A. G. 2014. Elementary Statistics: A step by step approach. 9ed. McGraw-Hill Education, New York, NY, Estados Unidos.
Bonsiepe, G. 2015. Do material ao digital. 5ed. Blucher, São Paulo, SP, Brasil.
Eyal, N.; Hoover, R. 2020. Hooked (Engajado): Como construir produtos e serviços formadores de hábitos. 1ed. AlfaCon, Cascavel, PR, Brasil.
Fávero, P. L.; Belfiore, P. 2017. Manual de análise de dados. 1ed. Elsevier, Rio de Janeiro, RJ, Brasil.
Garret, J. J. 2011. The Elements of User Experience: User-Centered Design for the Web and Beyond. 2ed. New Riders, Berekley, CA, Estados Unidos.
Teixeira, F. 2022. Introdução e boas práticas em UX Design. Casa do Código, São Paulo, SP, Brasil.
Tempelman-Kluit, N.; Pearce, A. 2014. Invoking The User From Data To Design. College & Research Libraries (C&RL) 75(5): 616-640.
Tullis, T.; Albert, B. 2013. Measuring the User Experience: Collecting, Analyzing, and Presenting UX Metrics. 2ed. Morgan Kaufmann Publishers, Estados Unidos.
Resumo executivo oriundo de Trabalho de Conclusão de Curso da Especialização em Data Science e Analytics do MBA USP/Esalq
Para saber mais sobre o curso, clique aqui e acesse a plataforma MBX Academy




























