08 de abril de 2026
Data Thinking e Ferramentas Visuais na Decisão Orientada por Dados
Carolina Lima Gomes; Arthur Damasceno Vicente
Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.
A sociedade moderna é caracterizada por um ambiente de rápidas transformações impulsionadas pela conectividade e pelos avanços tecnológicos constantes. Esse cenário tem provocado mudanças profundas nas estruturas organizacionais, exigindo das empresas uma capacidade contínua de adaptação e resiliência. Conceitos como a sociedade líquida, proposta por Bauman (2001), e o acrônimo VUCA, que engloba volatilidade, incerteza, complexidade e ambiguidade, introduzido por Whiteman (1998), auxiliam na compreensão da instabilidade e da imprevisibilidade que afetam o ambiente dinâmico de negócios atual. Nesse contexto, a transformação digital tem se consolidado como uma das principais estratégias para garantir a competitividade organizacional (McKinsey & Company, 2022). No entanto, a adoção de tecnologias digitais, por si só, não assegura vantagem competitiva. O diferencial reside na capacidade de utilizar dados de forma inteligente, o que demanda não apenas infraestrutura tecnológica, mas também uma cultura organizacional orientada por evidências.
A tomada de decisão baseada em dados, conhecida como data-driven decision-making, emerge como um elemento central nesse processo, permitindo escolhas mais assertivas, ágeis e alinhadas aos objetivos estratégicos. Essa prática é realizada por meio da coleta, análise e interpretação sistemática de informações. Entre seus benefícios diretos, destacam-se o maior engajamento do público-alvo, o aumento na retenção de clientes, um planejamento operacional mais eficaz, a adoção de práticas proativas e o crescimento sustentável, além da mitigação de vieses cognitivos (IBM, 2024). Estima-se que 90% de todas as organizações estejam passando por algum tipo de transformação digital, mas, apesar dos avanços, muitas empresas ainda enfrentam desafios significativos para consolidar uma cultura orientada a dados. A lacuna entre a coleta massiva de informações e sua aplicação prática revela limitações tanto na capacitação dos profissionais quanto na estrutura de governança (McKinsey & Company, 2024; IBM, 2023; Côrte-Real, 2022).
Os dados estão sendo coletados em larga escala, todavia, é imperativo que os colaboradores saibam gerenciar e interpretar esses ativos de forma eficaz (Côrte-Real, 2022). Um levantamento da IBM (2023) revelou que gestores relatam dificuldade para extrair percepções relevantes, mesmo considerando os dados internos como a principal fonte para decisões estratégicas. Complementando esse cenário, o The Data Warehouse Institute observa que a maioria das organizações ainda opera com estruturas analíticas fragmentadas, sem uma integração efetiva entre dados, processos e pessoas. É evidente a defasagem entre a disponibilidade tecnológica e a aplicação prática, revelando desafios que comprometem o potencial competitivo. Nesse sentido, abordagens que combinam ferramentas visuais com a metodologia de data thinking têm se mostrado eficazes para promover a colaboração entre áreas com diferentes níveis de letramento em dados. Essa integração facilita a identificação ágil e coletiva de caminhos baseados em evidências, permitindo a prototipagem de soluções robustas (Dias et al., 2022).
Para compreender o conceito de data thinking, é fundamental conhecer o design thinking, uma abordagem sistêmica e centrada no usuário para resolver problemas complexos. Essa metodologia incentiva a calma deliberada, permitindo que tomadores de decisão reflitam antes de agir, e valoriza o dissenso contributivo, que reconhece a diversidade de perspectivas como parte essencial do processo criativo. Reconhecendo que o caminho entre o problema e a solução raramente é linear (McKinsey & Company, 2023), o design thinking segue um processo iterativo de seis etapas: entender, observar, sintetizar, idealizar, prototipar e testar. A partir dessa lógica, surge o data thinking, que mantém a centralidade no usuário, mas coloca os dados como princípio de funcionamento de um problema complexo. Esses dados precisam ser representados em todos os passos do projeto para garantir que a solução seja tecnicamente viável e analiticamente fundamentada (Kronsbein e Mueller, 2019). O objetivo principal desta investigação é analisar, por meio de simulação com dados sintéticos, como ferramentas visuais colaborativas e o data thinking podem facilitar o processo de decisão orientada por dados em ambientes corporativos, buscando responder como tais ferramentas auxiliam na consolidação da cultura analítica nas empresas.
A presente pesquisa foi conduzida via um estudo de caso utilizando um banco de dados sintético, intitulado Sales and Satisfaction, disponibilizado publicamente na plataforma Kaggle. Este banco de dados foi desenvolvido com o objetivo de simular a relação entre o desempenho de vendas e os níveis de satisfação dos consumidores em um contexto empresarial, após uma intervenção aplicada em uma parcela dos clientes (Mahmoudi, 2023). O banco de dados contém 10000 registros estruturados em formato tabular, compostos por variáveis categóricas e numéricas. As colunas incluem a identificação do grupo (controle ou tratamento), o segmento do cliente (alto, médio ou baixo valor), o valor da venda antes e depois da intervenção, o nível de satisfação antes e depois da intervenção, e a indicação se houve a compra de um novo produto. A base aplicada passou por um rigoroso pré-tratamento, com a remoção de valores ausentes e a padronização de formatos, garantindo consistência para as análises estatísticas e modelagens subsequentes. A escolha deste conjunto de dados justifica-se por sua representatividade para simular cenários corporativos atuais, permitindo a condução de experimentos controlados sem restrições éticas ou legais, assegurando a reprodutibilidade dos resultados.
Para apoiar a análise e interpretação dos dados, foram selecionadas duas ferramentas visuais fundamentadas em abordagens de data thinking: o Esquema de Classificação de Dados e o Modelo de Data Thinking. A primeira ferramenta, proposta por Kayser et al. (2019), visa criar uma melhor compreensão das informações disponíveis, permitindo que as pessoas envolvidas no processo foquem no entendimento do conteúdo ao invés dos sistemas técnicos. O esquema classifica os dados de acordo com sua fonte, tipo, disponibilidade, formatação, sensibilidade e consumidores. A segunda ferramenta adotada foi o Modelo de Data Thinking, uma adaptação do método do Duplo Diamante, originalmente desenvolvido pelo Design Council do Reino Unido. O modelo original propõe duas fases principais: descoberta e definição (primeiro diamante) e desenvolvimento e entrega (segundo diamante), representando a alternância entre momentos de divergência e convergência. Com base nesse modelo, pesquisadores do Centro de Referência em Inteligência Empresarial desenvolveram uma versão voltada especificamente para a análise de dados, estruturando o processo em cinco etapas: perguntar, pesquisar, analisar e combinar, visualizar e comunicar, e decidir e implementar.
O processo analítico foi guiado por essas etapas para garantir o alinhamento entre a pergunta central, os dados disponíveis e as decisões a serem tomadas. A pergunta de partida foi se a intervenção teve resultados positivos para a empresa. Para respondê-la, aplicaram-se duas frentes complementares: análise estatística e análise de aprendizado de máquina. Todas as análises foram conduzidas na plataforma Google Colab, utilizando a linguagem Python. Inicialmente, realizou-se uma análise exploratória de dados para compreender a distribuição das variáveis e avaliar a consistência das informações. Foram calculadas estatísticas descritivas, como médias, desvios-padrão e intervalos de confiança para as variáveis contínuas, além de frequências para as categóricas. Com base nisso, estabeleceram-se hipóteses relacionadas ao impacto da intervenção sobre a taxa de conversão, a variação em vendas e a variação na satisfação do cliente. Esses indicadores foram analisados globalmente e por segmento de cliente, permitindo a avaliação da heterogeneidade de efeitos.
A análise de aprendizado de máquina foi conduzida com o apoio da modelagem de uplift, uma técnica voltada para estimar o incremento individual de uma intervenção. Diferentemente de um classificador tradicional, que apenas prevê quem compraria, a modelagem de uplift busca responder se o cliente comprou especificamente porque recebeu a intervenção (Sun et al., 2025). O objetivo foi identificar três grupos: persuadíveis (probabilidade de compra aumenta com a intervenção), sensíveis (intervenção reduz a chance de compra) e indiferentes (comprariam de qualquer forma). Utilizou-se a abordagem T-Learner, que consiste em treinar duas árvores de decisão separadas: uma para o grupo de tratamento e outra para o grupo de controle. O uplift é calculado como a diferença entre as probabilidades estimadas por esses dois modelos. A escolha do T-Learner justifica-se pela facilidade de interpretação, pois possui uma representação visual objetiva que imita o raciocínio humano através de condições e consequências (Rößler e Schoder, 2022). O processo envolveu a preparação de variáveis derivadas, a divisão do conjunto de dados em 70% para treino e 30% para teste, e o ajuste das árvores com profundidade controlada para evitar o sobreajuste.
Para garantir que os achados analíticos se traduzissem em decisões sustentáveis, aplicou-se um quadro de elementos de decisão, articulando componentes modernos de dados e analytics com elementos clássicos do processo decisório, sustentados por fatores transversais de colaboração, governança, transparência e gestão de risco (Bhushan et al., 2024). Este quadro funcionou como um checklist conceitual na etapa final do modelo de data thinking. A avaliação da abordagem ocorreu no plano qualitativo, centrada na experiência de uso das ferramentas visuais, e no plano quantitativo, por meio da Curva Qini e da área sob a curva de uplift (AUUC). Adicionalmente, considerou-se uma métrica de negócio baseada no retorno sobre o investimento (ROI) ex-ante, com margem bruta de 30% e custo de 15 reais por cliente tratado, para estimar se os ganhos previstos superariam os custos operacionais, conectando os resultados analíticos à viabilidade econômica.
Os resultados do Esquema de Classificação de Dados reforçaram a importância da governança e da clareza sobre as características dos ativos informacionais. O banco de dados foi classificado como sendo de fonte gerada por máquina, do tipo transacional, com disponibilidade via plataforma Kaggle e formato estruturado. Por se tratar de um dado público, não houve necessidade de cuidados adicionais extremos com sensibilidade, o que sugeriu que a base estava pronta para análises avançadas. A aplicação do modelo de data thinking permitiu estruturar a análise de forma lógica. Na fase de análise estatística, confirmou-se que a base continha 10000 observações equilibradas entre controle (5013) e tratamento (4987). A segmentação de clientes também se mostrou balanceada, com 3354 clientes de baixo valor, 3355 de médio valor e 3291 de alto valor. Essa distribuição uniforme é crucial para garantir que as comparações entre grupos não sejam enviesadas por disparidades volumétricas.
No que tange à conversão de novos produtos, observou-se um total de 5076 novas compras. De forma segmentada, a taxa de conversão para o grupo de controle no segmento de alto valor foi de 50,99%, enquanto no grupo de tratamento para o mesmo segmento foi de 51,73%. No segmento de médio valor, a taxa subiu de 49,01% no controle para 50,77% no tratamento. Já no segmento de baixo valor, houve uma leve redução, de 51,70% no controle para 50,39% no tratamento. Esses dados iniciais sugerem que a intervenção teve efeitos distintos dependendo do perfil do cliente, evidenciando a necessidade de uma abordagem personalizada. A análise das variáveis numéricas revelou que a média de vendas global antes da intervenção era de 203,85 reais, subindo para 280,38 reais após a ação. O delta de vendas global foi de 76,53 reais. Ao separar por grupos, o grupo de controle apresentou um delta de vendas de 39,80 reais, enquanto o grupo de tratamento alcançou um delta expressivo de 113,45 reais. Isso indica um impacto positivo direto da intervenção no volume financeiro transacionado.
Quanto à satisfação do cliente, a média global subiu de 70,25 para 73,92 pontos. O delta de satisfação para o grupo de controle foi de 3,67 pontos, exatamente o mesmo valor observado para o grupo de tratamento em termos de média global. No entanto, ao analisar por segmento, o grupo de tratamento no segmento de médio valor apresentou um delta de satisfação de 4,67 pontos, superior aos 2,74 pontos do segmento de alto valor no mesmo grupo. Esses resultados demonstram que, embora a intervenção tenha impulsionado as vendas de forma significativa, o efeito na satisfação foi mais sutil e heterogêneo. A análise de aprendizado de máquina, utilizando o algoritmo DecisionTreeClassifier, permitiu aprofundar essa compreensão. No conjunto de testes, os clientes foram classificados com base no uplift previsto. Observou-se que 30,9% dos clientes foram identificados como persuadíveis, 34,7% como indiferentes e 34,4% como sensíveis. No segmento de alto valor, quase metade dos clientes (49,9%) foi classificada como sensível, sugerindo que a intervenção pode ter um efeito adverso ou saturado para esse público específico. Em contrapartida, o segmento de baixo valor apresentou 32,6% de persuadíveis, indicando um potencial de crescimento.
As árvores de decisão treinadas evidenciaram que a variável de vendas antes da intervenção é o principal preditor da probabilidade de compra futura. No modelo de tratamento, condições relacionadas à satisfação prévia também ganharam relevância na estrutura de decisão. A avaliação do modelo por meio da Curva Qini resultou em um valor de -0,0117 e uma AUUC de -0,0150. Embora esses valores negativos indiquem que o modelo não conseguiu ordenar perfeitamente os clientes no conjunto de teste sintético, tal resultado é esperado em datasets com efeitos muito difusos e pequena variância entre grupos. Em um contexto real, esse diagnóstico serviria como um alerta crítico para a necessidade de coletar variáveis comportamentais mais ricas antes de escalar a estratégia. A simulação de ROI ex-ante trouxe uma perspectiva econômica vital. O ROI iniciou em 0,673 para os primeiros 300 clientes (top 10%) e estabilizou-se em torno de 0,47 a 0,50 conforme a base de clientes tratados aumentava. Isso demonstra que a estratégia de focar nos clientes com maior potencial de resposta (uplift) é financeiramente superior a uma abordagem indiscriminada. Mesmo com o aumento dos custos proporcionais, o retorno incremental justifica o investimento nos primeiros decis da amostra.
A discussão dos resultados aponta que a intervenção foi positiva para a organização sob a ótica de receita, visto que elevou as vendas sem prejudicar a satisfação média. Contudo, a alta proporção de clientes sensíveis no segmento de alto valor acende um sinal amarelo para a gestão de relacionamento. Estratégias de marketing agressivas podem gerar um efeito de backfire em clientes que já possuem um relacionamento consolidado e de alto valor com a marca. Para esses casos, o data thinking sugere a adaptação da intervenção para formatos menos intrusivos ou mais personalizados. A utilização das ferramentas visuais facilitou a comunicação desses achados complexos para áreas não técnicas. O modelo de data thinking funcionou como um trilho que levou do dado bruto à ação estratégica, garantindo que a inteligência analítica se convertesse em valor de negócio. O alinhamento entre a pergunta central e as métricas de avaliação reduziu ambiguidades e acelerou a convergência para hipóteses relevantes.
A integração do Esquema de Classificação de Dados fortaleceu a governança ao evidenciar quem consome cada informação e quais são as limitações dos dados utilizados. Essa prática é especialmente útil em empresas que enfrentam desafios de integração entre departamentos, pois antecipa restrições de qualidade e evita retrabalho. Ao organizar o fluxo analítico com representações visuais, o framework não apenas orientou a escolha das técnicas estatísticas, mas também tornou os resultados compreensíveis, ampliando a capacidade de tomada de decisão em todos os níveis hierárquicos. A simulação de ROI reforçou a lógica de cortes seletivos, mostrando que tratar apenas os 20% dos clientes com maior potencial pode ser mais eficiente do que campanhas massivas. É recomendável que, em aplicações futuras, o modelo seja validado com testes controlados reais para ajustar os parâmetros de sensibilidade e robustez.
Conclui-se que o objetivo foi atingido, demonstrando que o uso de ferramentas visuais e da metodologia de data thinking reduz a distância entre a análise técnica e a decisão estratégica nas organizações. A investigação evidenciou que a intervenção simulada elevou substancialmente as vendas sem comprometer a satisfação dos clientes, embora a eficácia varie significativamente conforme o perfil de valor do consumidor. O processo proposto mostrou-se eficaz para identificar perguntas de negócio claras, qualificar dados, realizar análises transparentes e traduzir resultados complexos em políticas operacionais acionáveis. Para implementações em contextos reais, recomenda-se o aprimoramento da modelagem com dados históricos e a validação contínua por meio de experimentos controlados, garantindo que as decisões sejam sustentadas por evidências de eficiência adequadas.
Referências Bibliográficas:
Bauman, Z. 2001. Modernidade líquida. v.1. Zahar, Rio de Janeiro, RJ, Brasil.
Côrte-Real, N. 2022. Big Data & Analytics: O poder de transformar dados em inteligência artificial e o impacto na competitividade empresarial. v.1. Influência, Lisboa, Portugal.
Dias, E.; Thurler, L.; Macedo, V.; Bello, A.; Cavalcanti, M. 2022. Data Thinking: uma proposta metodológica para se pensar a partir de dados. Revista Inteligência Empresarial 46.
International Business Machines (IBM). 2023. CEO decision making in the age of AI, Act with intention. Disponível em: <https://www.ibm.com/thought-leadership/institute-business-value/en-us/c-suite-study/ceo >. Acesso em: 9 mar. 2025.
International Business Machines (IBM). 2024. What Is Data-Driven Decision-Making? Disponível em: <https://www.ibm.com/think/topics/data-driven-decision-making>. Acesso em: 9 mar. 2025.
Kronsbein, T; Mueller, R. 2019. Data thinking: a canvas for data-driven ideation workshops. Hawaii International Conference on System Sciences 52.
Mahmoudi, M. 2023. Sales and Satisfaction (Kaggle dataset). Disponível em: <https://www.kaggle.com/datasets/matinmahmoudi/sales-and-satisfaction>. Acesso em: 9 mar. 2025
McKinsey & Company. 2022. It is time to become a digital investing organization. Disponível em: <https://www.mckinsey.com/capabilities/mckinsey-digital/our-insights/its-time-to-become-a-digital-investing-organization>. Acesso em: 9 mar. 2025.
McKinsey & Company. 2023. How to solve problems with design thinking. Disponível em: <https://www.mckinsey.com/featured-insights/mckinsey-guide-to-problem-solving/how-to-solve-problems-with-design-thinking>. Acesso em: 30 ago. 2025.
McKinsey & Company. 2024. What is digital transformation? Disponível em: <https://www.mckinsey.com/featured-insights/mckinsey-explainers/what-is-digital-transformation>. Acesso em: 9 mar. 2025.
Whiteman, L. 1998. USAWC Strategy Research Project. Training and Educating Army Officers for the 21st Century: Implications for the United States Military Academy. v.1. Pennsylvania, Estados Unidos.
Resumo executivo oriundo de Trabalho de Conclusão de Curso da Especialização em Data Science e Analytics do MBA USP/Esalq
Saiba mais sobre o curso, clique aqui




























