Imagem Business Intelligence e CRISP-DM na otimização da análise de dados fiscais

14 de janeiro de 2026

Business Intelligence e CRISP-DM na otimização da análise de dados fiscais

Autor(a): Bruno Nobre Galdino — Orientador(a): Alex Nunes De Almeida

Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.

Esta pesquisa investiga a aplicação da metodologia CRISP-DM (Cross Industry Standard Process for Data Mining) e Business Intelligence (BI) em um projeto de dados fiscais, em formato XML, de um conglomerado empresarial brasileiro. O estudo detalha os impactos positivos do projeto, focando na transformação de dados brutos em informações estratégicas para a gestão tributária. Analisa-se como a sinergia entre a metodologia e ferramentas de visualização resolve desafios de conformidade no complexo sistema tributário brasileiro, buscando evidenciar um modelo replicável para otimizar rotinas, reduzir penalidades e fortalecer a governança fiscal.

O cenário corporativo contemporâneo é marcado por um volume crescente de informações, tornando a capacidade de explorar dados um diferencial competitivo (Han & Kamber, 2006; Provost & Fawcett, 2016). A distinção entre dados (fatos brutos), informação (dados contextualizados) e conhecimento (informação aplicada à tomada de decisão) é fundamental (Amaral, 2016). Este estudo de caso foi desenvolvido em um conglomerado com sede em Fortaleza/CE, cuja estrutura diversificada — indústria, gás, bebidas e comunicação — intensifica a complexidade da gestão de dados fiscais.

A complexidade do sistema tributário brasileiro representa um desafio constante para os contribuintes (Guerra, 2024). No grupo empresarial analisado, o elevado número de multas aplicadas por órgãos fiscalizadores motivou a solicitação de um projeto de dados pela área fiscal à equipe de Tecnologia da Informação. A necessidade era organizar e visualizar as informações fiscais de todas as empresas para mitigar riscos. A abordagem de Business Intelligence (BI) surge como solução, pois envolve a coleta, transformação e análise de informações para apoiar decisões que impactam a estratégia e as operações (Stair & Reynolds, 2010).

A proposta do Business Intelligence é converter dados em conhecimento acionável para gestores (Argotte; Mejia-Lavalle; Sosa, 2009), consolidando-se como prioridade para executivos (Isik; Jones; Sidorova, 2013). De forma abrangente, o BI agrega arquiteturas, repositórios de dados e soluções analíticas para viabilizar o acesso interativo às informações e a formulação de decisões mais assertivas (Sharda; Delen; Turban, 2019). O ciclo do BI, que transforma dados em informações, decisões e ações, abrange funcionalidades como relatórios dinâmicos, análise de padrões e monitoramento de indicadores.

A arquitetura de BI estrutura a transformação de dados em inteligência de negócio, segmentando-se em coleta, armazenamento e acesso/análise (Khan & Quadri, 2012). Dados de diversas fontes passam por processos de Extração, Transformação e Carregamento (ETL) e são consolidados em um Data Warehouse (DW). Sharda, Delen e Turban (2019) complementam essa visão ao definir quatro elementos fundamentais da arquitetura de BI: o Data Warehouse, ferramentas de Análise de Negócios, a Gestão de Desempenho de Negócios (BPM) e a Interface com o Usuário, como dashboards e relatórios. A integração desses componentes permite que as organizações convertam dados brutos em decisões mais rápidas e embasadas.

A pesquisa caracteriza-se como de natureza aplicada, focada na resolução de um problema concreto da organização (Silva & Menezes, 2005; Marconi & Lakatos, 2013). Para a execução do projeto, foram identificados os dados requeridos, suas fontes e tipologia para selecionar a metodologia mais adequada. As soluções de BI integram dados históricos e operacionais com recursos analíticos para prover informações estratégicas aos gestores (Khan & Quadri, 2012). A integração do BI com ferramentas de Data Science permite a análise de grandes volumes de dados, gerando outputs visuais e interativos que a alta gestão pode compreender sem conhecimento técnico aprofundado (Newman et al., 2016). As atividades foram estruturadas como um projeto formal, com escopo definido pelo time fiscal e executado pela equipe de Tecnologia da Informação.

A metodologia CRISP-DM foi aplicada como o framework central da pesquisa, sendo o padrão de mercado para projetos de ciência de dados. Sua escolha se justifica pela natureza iterativa e pela estrutura em seis fases bem definidas: entendimento do negócio, entendimento dos dados, preparação dos dados, modelagem, avaliação e implantação. Essa estrutura promove coerência e objetividade, aumentando as chances de êxito (Moro et al., 2011). Publicada em 1999, a CRISP-DM é reconhecida por sua forte orientação às demandas empresariais (Kharlamov; Ferreira; Godsell, 2020) e por refletir a forma como os profissionais conduzem projetos práticos (Chapman et al., 2000). O processo é exploratório e iterativo, onde cada ciclo proporciona maior compreensão e uma base mais sólida para decisões futuras.

Para a gestão do projeto, adotou-se a metodologia ágil Scrum, que valoriza a flexibilidade e a entrega contínua de valor em ciclos curtos chamados sprints (Schwaber; Beedle, 2002). O Scrum se fundamenta nos pilares de transparência, inspeção e adaptação. A estrutura do projeto contou com squads multidisciplinares, compostos por analistas de negócios de TI, especialistas em bancos de dados, desenvolvedores de BI e analistas fiscais. As cerimônias do Scrum, como a Sprint Planning, Daily Scrum, Sprint Review e Sprint Retrospective, foram seguidas (Sutherland, 2014). Foram realizados 17 sprints de duas semanas ao longo de oito meses, garantindo entregas incrementais e um alinhamento constante entre a equipe técnica e os stakeholders da área fiscal, conforme a filosofia ágil (Highsmith, 2009).

O processo técnico de tratamento dos dados foi fundamentado nas etapas de ETL (Extração, Transformação e Carregamento), um componente essencial para a construção de sistemas de apoio à decisão. O processo de ETL é responsável por integrar e organizar dados de fontes distintas, e sua qualidade impacta diretamente a confiabilidade das informações geradas (Kimball, 1998). Estima-se que cerca de 80% do tempo de um projeto de dados seja consumido nesse processo (Inmon, 1997). No projeto, os dados foram extraídos de múltiplas fontes, incluindo o ERP Oracle-EBS e sistemas satélites como SIVA, NDD, Synchro, SIF, SCM e Ecomex. Os dados, classificados como qualitativos e quantitativos, passaram por um pré-processamento que incluiu limpeza, integração, redução e transformação (Larose, 2005). As ferramentas utilizadas foram Oracle SQL Developer, ODI 12c como ferramenta de ETL e a plataforma Power BI da Microsoft para visualização.

A aplicação da metodologia CRISP-DM, combinada com práticas ágeis, resultou em uma abordagem estruturada e colaborativa. A sinergia entre o conhecimento de negócio dos analistas fiscais e o conhecimento técnico da equipe de TI foi um fator crítico de sucesso. As fases de Entendimento do Negócio e Avaliação dependeram dos especialistas fiscais, que traduziram as necessidades operacionais em requisitos e validaram os insights gerados. As fases de Entendimento dos Dados, Preparação e Modelagem foram lideradas pela equipe técnica. A interdependência entre as frentes foi gerenciada por meio de squads multidisciplinares e comunicação constante, garantindo o alinhamento das soluções técnicas com os desafios do negócio fiscal.

Com a conclusão do projeto, foram entregues painéis interativos no Power BI que consolidaram dados de múltiplas fontes, como o ERP Oracle, arquivos XML e sistemas satélites. Esses dashboards se tornaram ferramentas centrais na rotina dos analistas fiscais, proporcionando uma visão unificada de documentos e parâmetros tributários. A implementação da solução de BI alcançou o objetivo de transformar dados brutos em informações úteis para o processo decisório (Stair & Reynolds, 2010). A automação e a visualização otimizaram o tempo dos analistas, que puderam se dedicar a atividades de maior valor agregado, como análises estratégicas e revisão de parametrizações fiscais.

Os dashboards desenvolvidos permitiram a identificação de diversas inconsistências críticas. Foi possível visualizar a quantidade de documentos fiscais ausentes em cada sistema (Oracle-EBS e Synchro), identificar gaps nos arquivos XML, como campos nulos e divergências de valores, e mapear as empresas do grupo mais impactadas. A ferramenta também possibilitou a classificação das notas fiscais por status (inutilizadas, canceladas ou não canceladas), fornecendo subsídios para decisões de conformidade. A capacidade de monitorar proativamente as inconsistências entre o ERP e seus sistemas satélites reduziu o risco de infrações fiscais não serem detectadas a tempo.

A redução do tempo gasto em tarefas manuais e retrabalho foi um dos ganhos mais imediatos do projeto. Com a automação, os analistas fiscais liberaram tempo para se concentrar em atividades estratégicas, como a identificação de oportunidades de recuperação tributária e a análise de parametrizações fiscais. Essa mudança de foco, da operação para a estratégia, está alinhada com a premissa de que a interpretação da informação é o que gera vantagem competitiva (Provost & Fawcett, 2016). O novo ecossistema analítico permitiu que a equipe fiscal adotasse uma postura mais proativa.

Durante as fases de modelagem e avaliação dos dados, a metodologia CRISP-DM foi fundamental para expor falhas de integração entre sistemas, lacunas de dados e incoerências em cadastros fiscais. A visualização centralizada desses problemas permitiu a implementação de ações corretivas e o estabelecimento de políticas de melhoria contínua nos processos de escrituração. A identificação precoce de erros na integração de dados, que anteriormente resultavam em apurações de tributos incorretas, fortaleceu os mecanismos de controle interno e governança.

Como resultado direto da implementação do projeto, observou-se uma redução significativa no volume de multas por erro de escrituração fiscal. A capacidade de detectar e corrigir erros de forma preventiva, antes do envio das obrigações acessórias, mitigou um dos principais riscos financeiros da área. Este resultado prático reforça a eficácia da abordagem do CRISP-DM, que favorece a geração de valor concreto para o negócio (Kharlamov; Ferreira; Godsell, 2020), gerando um retorno sobre o investimento mensurável em termos de economia com penalidades.

Os benefícios gerados pelo projeto transcenderam os ganhos operacionais. A implementação da solução de BI promoveu maior transparência e governança sobre os dados fiscais, aumentando a rastreabilidade e a confiabilidade das informações. Houve uma diminuição do risco tributário geral e um aumento da conformidade legal, fortalecendo a posição da empresa perante as autoridades fiscais. A redução de retrabalho e a maior agilidade na tomada de decisão, agora baseada em evidências, contribuíram para um ambiente de trabalho mais produtivo.

O projeto desempenhou um papel crucial no fortalecimento da cultura analítica dentro do setor fiscal e do grupo empresarial. A democratização do acesso aos dados, por meio de uma ferramenta intuitiva como o Power BI, capacitou os usuários de negócio a explorarem as informações de forma autônoma, reduzindo a dependência da equipe de TI. Essa transformação cultural fomenta um ecossistema corporativo mais inteligente, orientado a dados e proativo na identificação de riscos e oportunidades, alinhando a gestão fiscal aos objetivos estratégicos da organização.

A análise conduzida demonstrou que a aplicação combinada de Business Intelligence e da metodologia CRISP-DM é uma abordagem robusta e eficaz para transformar a gestão tributária. O uso de uma metodologia estruturada para mineração de dados garantiu a qualidade e a relevância das informações, enquanto as ferramentas de BI forneceram os meios para traduzir dados complexos em insights visuais e acionáveis. A sinergia entre tecnologia, conhecimento de domínio e processos bem definidos provou ser um caminho promissor para a evolução da governança fiscal.

Conclui-se que o objetivo foi atingido: demonstrou-se que a aplicação combinada de Business Intelligence e da metodologia CRISP-DM é uma abordagem eficaz para otimizar a análise de dados fiscais, resultando em maior conformidade, redução de riscos e ganhos de eficiência operacional em um ambiente de alta complexidade. Os resultados obtidos neste estudo de caso podem servir como um modelo para outras organizações que enfrentam desafios similares, incentivando a expansão do uso de BI para outras áreas do negócio e fomentando um ecossistema corporativo mais inteligente e orientado por dados.

Referências:
Amaral, F. 2016. Introdução à Ciência de Dados: Mineração de Dados e Big Data. Alta Books, Rio de Janeiro, RJ, Brasil.
Angeloni, M. T.; Reis, A. C. 2006. Gestão do conhecimento e inteligência competitiva. Ciência da Informação 35(3): 95-104.
Argotte, C.; Mejia-Lavalle, M.; Sosa, R. 2009. Knowledge discovery in databases: An overview. Expert Systems with Applications 36: 1-12.
Beck, K.; et al. 2001. Manifesto for Agile Software Development. Disponível em: https://agilemanifesto. org/. Acesso em: 27 ago. 2025.
Bonel, H. 2019. Power BI Black Belt: Técnicas Avançadas de Business Intelligence. DVS Editora, São Paulo, SP, Brasil.
Chapman, P.; et al. 2000. CRISP-DM 1.0: Step-by-step data mining guide. The CRISP-DM Consortium. Disponível em: https://www. the-modeling-agency. com/crisp-dm. pdf. Acesso em: 27 ago. 2025.
Cordero, A.; et al. 2018. Agile methods in practice: A multiple-case study of distributed teams. Journal of Systems and Software 143: 1-17. DOI: https://doi. org/10.1016/j. jss.2018.05.001.
Fayyad, U.; Piatetsky-Shapiro, G.; Smyth, P. 1996. From data mining to knowledge discovery in databases. AI Magazine 17(3): 37-54.
Fisher, D.; et al. 2020. Interactions with big data analytics. ACM Interactions 27(4): 52-57.
Giffen, A.; Herhausen, D.; Fahse, T. 2022. Two decades of CRISP-DM: Review and framework for future research in data-driven decision making. Journal of Business Research 139: 1289-1302. DOI: https://doi. org/10.1016/j. jbusres.2021.10.051.
Guerra, S. 2024. Reforma tributária: princípios, fundamentos e desafios. Revista Direito Tributário Atual, São Paulo, SP, Brasil, 48: 57-92.
Han, J.; Kamber, M. 2006. Data Mining: Concepts and Techniques. Morgan Kaufmann, San Francisco, CA, USA.
Han, J.; Kamber, M.; Pei, J. 2011. Data Mining: Concepts and Techniques. 3ed. Morgan Kaufmann, San Francisco, CA, USA.
Harison, E. 2012. Business Intelligence Strategy and Big Data Analytics: A General Management Perspective. Morgan Kaufmann, Burlington, MA, USA.
Highsmith, J. 2009. Agile Project Management: Creating Innovative Products. Addison-Wesley, Boston, MA, USA.
Inmon, W. H. 1997. Building the Data Warehouse. 2ed. Wiley, New York, NY, USA.
Isik, O.; Jones, M. C.; Sidorova, A. 2013. Business intelligence success: The roles of BI capabilities and decision environments. Information & Management 50(1): 13-23.
Khan, N.; Quadri, S. M. K. 2012. Business intelligence: An integrated approach. International Journal of Management Research and Business Strategy 1(2): 101-107.
Kharlamov, A.; Ferreira, A.; Godsell, S. 2020. Action research in data-driven decision making: Integrating CRISP-DM into organizational practice. Information Systems Frontiers 22(6): 1435-1449. DOI: https://doi. org/10.1007/s10796-019-09934-1.
Kimball, R. 1998. The Data Warehouse Toolkit: Practical Techniques for Building Dimensional Data Warehouses. Wiley, New York, NY, USA.
Larose, D. T. 2005. Discovering Knowledge in Data: An Introduction to Data Mining. Wiley, Hoboken, NJ, USA.
Leffingwell, D. 2011. Agile Software Requirements: Lean Requirements Practices for Teams, Programs, and the Enterprise. Addison-Wesley, Boston, MA, USA.
Lönnqvist, A.; Pirttimäki, V. 2006. The measurement of business intelligence. Information Systems Management 23(1): 32-40.
Marconi, M. A.; Lakatos, E. M. 2013. Fundamentos de Metodologia Científica. 7ed. Atlas, São Paulo, SP, Brasil.
Moro, S.; Cortez, P.; Rita, P. 2015. Business intelligence in banking: A literature analysis from 2002 to 2013 using text mining and latent Dirichlet allocation. Expert Systems with Applications 42(3): 1314-1324.
Newman, D.; et al. 2016. Building smarter organizations through analytics. MIT Sloan Management Review 57(3): 42-49.
North, M.; et al. 2018. Data mining in business process management: Challenges and opportunities. Business & Information Systems Engineering 60(1): 1-13. DOI: https://doi. org/10.1007/s12599-017-0505-0.
Plumed, R.; et al. 2021. CRISP-DM twenty years later: From data mining processes to data science trajectories. IEEE Access 9: 176698-176717. DOI: https://doi. org/10.1109/ACCESS.2021.3058722.
Pogiatzis, A.; Samakovitis, G. 2021. An event-driven serverless ETL pipeline on AWS. Applied Sciences 11(1): 191. DOI: https://doi. org/10.3390/app11010191.
Provost, F.; Fawcett, T. 2013. Data Science for Business. O’Reilly Media, Sebastopol, CA, USA.
Provost, F.; Fawcett, T. 2016. Data Science para Negócios: O que Você Precisa Saber sobre Mineração de Dados e Pensamento Analítico de Dados. Alta Books, Rio de Janeiro, RJ, Brasil.
Schmidt, G.; et al. 2017. Big data and the digital transformation of decision making. Journal of Business Economics 87(9): 1123-1139.
Schwaber, K.; Beedle, M. 2002. Agile Software Development with Scrum. Prentice Hall, Upper Saddle River, NJ, USA.
Sharda, R.; Delen, D.; Turban, E. 2019. Business Intelligence and Analytics: Systems for Decision Support. 10ed. Pearson, Boston, MA, USA.
Silva, E. L.; Menezes, E. M. 2005. Metodologia da Pesquisa e Elaboração de Dissertação. 4ed. UFSC, Florianópolis, SC, Brasil.
Stair, R. M.; Reynolds, G. W. 2010. Principles of Information Systems. 9ed. Cengage Learning, Boston, MA, USA.
Sutherland, J. 2014. Scrum: The Art of Doing Twice the Work in Half the Time. Crown Business, New York, NY, USA.


Resumo executivo oriundo de Trabalho de Conclusão de Curso de Especialização em Data Science e Analytics do MBA USP/Esalq

Saiba mais sobre o curso; clique aqui:

Quem editou este artigo

Você também pode gostar

Quer ficar por dentro das nossas últimas publicações? Inscreva-se em nossa newsletter!

Receba conteúdos e fique sempre atualizado sobre as novidades em gestão, liderança e carreira com a Revista E&S.

Ao preencher o formulário você está ciente de que podemos enviar comunicações e conteúdos da Revista E&S. Confira nossa Política de Privacidade