11 de maio de 2026
IA na Classificação e Conformidade de Documentos Fiscais
Milene Aparecida Fernandes Pereira; Eliza Remédio Alecrim
Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.
A complexidade inerente ao sistema tributário brasileiro impõe desafios constantes às organizações, exigindo uma gestão fiscal que minimize riscos e otimize processos. O cenário nacional é marcado por uma das burocracias mais extensas do mundo, conforme aponta o índice Global de Complexidade de Negócios, que posicionou o Brasil como o sexto país mais burocrático para a realização de negócios em maio de 2025 (Exame, 2025). Essa realidade demanda que as empresas adotem práticas inovadoras para aprimorar o processamento e a rastreabilidade de documentos, especialmente no que tange à classificação de notas fiscais. A integração de tecnologias emergentes, como a inteligência artificial e o aprendizado de máquina, surge como uma solução estratégica para mitigar erros recorrentes na identificação da Nomenclatura Comum do Mercosul e do Código Fiscal de Operações e Prestações, os quais podem resultar em recolhimentos indevidos ou multas severas. A conformidade fiscal, portanto, depende da capacidade de interpretar volumes massivos de dados de forma ágil e precisa, utilizando ferramentas que potencializem a eficácia do compliance tributário (Evangelista, 2020).
A fundamentação teórica que sustenta o uso de sistemas inteligentes na área fiscal baseia-se na necessidade de automação de tarefas repetitivas que consomem tempo significativo das equipes contábeis. A inteligência artificial, definida como um conjunto de tecnologias que permitem a máquinas simular capacidades humanas de aprendizado e tomada de decisão, é essencial para lidar com a vasta gama de documentos eletrônicos (Russel; Norvig, 2022). No contexto brasileiro, a correta designação do código de oito dígitos da Nomenclatura Comum do Mercosul é crucial, pois determina as alíquotas de impostos como o Imposto sobre Produtos Industrializados e serve de base para o cálculo de contribuições como o Programa de Integração Social e a Contribuição para o Financiamento da Seguridade Social. Inconsistências nesses dados podem levar à retenção de mercadorias, bloqueio de inscrição estadual e dificuldades na obtenção de certidões negativas de débitos, afetando diretamente a saúde financeira institucional. Pesquisas indicam que cerca de 70% das empresas já emitiram notas fiscais com informações divergentes, evidenciando a fragilidade dos processos manuais (APET, 2025).
A transição para modelos automatizados exige uma compreensão profunda das técnicas de aprendizado de máquina, que podem ser divididas em supervisionadas e não supervisionadas. O aprendizado supervisionado utiliza bases de dados históricas e rotuladas para treinar modelos preditivos capazes de classificar novos itens com base em padrões anteriores, enquanto o aprendizado não supervisionado busca identificar anomalias e agrupamentos ocultos em dados não estruturados (Laruccia, 2022). Essa dualidade tecnológica permite não apenas a automação da classificação contábil, mas também a detecção de fraudes e desvios que fogem ao escopo padrão de operação. A aplicação dessas técnicas visa transformar a coleta e o agrupamento de dados em informações estratégicas que favoreçam o planejamento tributário preventivo. O objetivo central reside em avaliar como a implementação dessas ferramentas pode otimizar a conferência de documentos e reduzir a incidência de erros operacionais que geram retrabalho e perdas financeiras.
A metodologia adotada para investigar os impactos da tecnologia na gestão fiscal consistiu em uma pesquisa qualitativa de natureza exploratória, fundamentada em análise documental e estudo de caso. O foco principal foi identificar dilemas corriqueiros na classificação tributária para subsidiar tomadas de decisão mais assertivas. A coleta de dados foi realizada por meio de consulta ao Portal da Transparência, selecionando-se uma amostra de 847 notas fiscais emitidas em janeiro de 2025. A origem dos documentos foi o Comando da Aeronáutica, representando um órgão da administração pública federal com alto volume de transações. Para garantir a relevância estatística e a complexidade da análise, os critérios de refinamento incluíram apenas operações interestaduais com destino ao Rio de Janeiro, focando em vendas de mercadorias destinadas ao consumidor final. Essa escolha estratégica permitiu observar a densidade de códigos fiscais em cenários de saídas interestaduais, onde a correlação entre a natureza da operação e a tributação é mais sensível.
O processo operacional de seleção da amostra utilizou a função de aleatoriedade para assegurar que cada item tivesse a mesma probabilidade de compor o estudo. Entre os eventos mais frequentes observados na amostra, destacaram-se 432 notas emitidas em São Paulo com destino ao Rio de Janeiro, totalizando 885 registros específicos de destino para este estado dentro do universo analisado. A natureza das operações variou entre vendas, que somaram 2325 ocorrências, devoluções com 81 registros e remessas totalizando 38 eventos. Quanto aos itens comercializados, a diversidade incluiu desde sondas e cateteres, com 213 unidades, até medicamentos, lentes intraoculares e tintas de polímeros. A análise detalhada desses itens permitiu confrontar as descrições textuais presentes nas notas com os códigos de Nomenclatura Comum do Mercosul e Códigos Fiscais de Operações e Prestações correspondentes, servindo de base para os testes de acurácia dos modelos de inteligência artificial.
Para o processamento dos dados, utilizou-se a técnica de Processamento de Linguagem Natural para converter descrições não estruturadas em termos legíveis por algoritmos. O pré-processamento envolveu a tokenização, que consiste na quebra de frases em unidades menores, e a remoção de ruídos como pontuações e palavras irrelevantes. Por exemplo, a descrição de um item como colchão foi convertida em vetores numéricos para facilitar a identificação por modelos de árvores de decisão. O software empregado para as simulações de classificação foi o GPT-4 mini, acessado via conta institucional, além da aplicação da lógica de Random Forest para ilustrar a estrutura de decisão automatizada. Cada etapa do processo, desde a extração de dados via linguagem de marcação extensível até a validação humana final, foi minuciosamente descrita para evidenciar a redução de gargalos operacionais em comparação ao método manual de inserção de dados.
Os resultados obtidos demonstraram que a automação do fluxo classificatório reduz significativamente o tempo de resposta e a propensão a erros. No modelo manual, o recebimento da nota fiscal é seguido por uma pesquisa exaustiva em tabelas e sistemas, culminando em uma inserção sujeita a falhas de digitação. Em contraste, o uso de inteligência artificial permite a extração automática de dados do arquivo digital, sugerindo códigos com alta precisão baseada em cruzamentos de informações estratégicas armazenadas. Nas simulações realizadas com 12 amostras aleatórias para verificar a acurácia do GPT-4 mini na classificação da Nomenclatura Comum do Mercosul, o modelo atingiu um índice de acerto de 83%. Itens como lixeira inox, oxigênio medicinal e sapatos masculinos foram classificados corretamente de acordo com os códigos presentes nas notas fiscais eletrônicas. No entanto, o sistema apresentou falhas em itens como luvas descartáveis, classificadas erroneamente na categoria de cadernos, e guardanapos duplos, alocados na classe genérica de toalhas de mesa.
Essas divergências ressaltam a importância da supervisão humana e do refinamento constante dos modelos. A análise de conformidade fiscal realizada por meio do cruzamento de dados evidenciou que a inteligência artificial atua como um agente de validação eficaz, mas que casos complexos ainda exigem o olhar técnico do especialista. Em uma simulação de validação de códigos em vendas interestaduais, o modelo identificou corretamente que o código 6102 se alinhava à venda para não contribuinte e que o Código de Situação Tributária 000 estava coerente com a natureza da operação. Contudo, em notas envolvendo medicamentos com substituição tributária, o sistema sinalizou a necessidade de revisão profissional devido à complexidade das regras de redução de base de cálculo. Essa capacidade de auditar e apontar exceções demonstra que a tecnologia não substitui o profissional contábil, mas atua como uma ferramenta de apoio que agiliza a análise de múltiplos campos presentes em centenas de documentos (Santos, 2023).
A discussão dos resultados também abrangeu o uso do Reconhecimento Óptico de Caracteres para a conversão de imagens digitalizadas em informações editáveis. A evolução dessa tecnologia, impulsionada pelo aprendizado de máquina, permite que dados como o Cadastro Nacional da Pessoa Jurídica, valores e impostos deduzidos sejam extraídos e integrados diretamente a sistemas de planejamento de recursos empresariais. Estudos anteriores corroboram essa eficácia, demonstrando que modelos de aprendizado de máquina podem automatizar a leitura de categorias fiscais com alta escalabilidade, facilitando a identificação de créditos tributários de PIS e COFINS (Laruccia, 2022). Outras abordagens, como o sistema SCAN-NF, utilizam redes neurais para classificar transações a partir de textos curtos, padronizando ocorrências mesmo diante de descrições não estruturadas (Silva, 2022). A detecção automática de padrões de compra para insumo, consumo ou revenda também se mostra viável, partindo da análise do código de mercadoria e da descrição do item (Tesche, 2025).
A implementação dessas tecnologias, contudo, não está isenta de implicações éticas e desafios técnicos. A qualidade dos dados de entrada é um fator determinante para o sucesso do modelo; imagens ilegítimas ou falta de armazenamento de dados de qualidade podem gerar classificações incorretas em cascata. Além disso, existe o risco de enviesamento algorítmico, onde o modelo pode discriminar certas regiões ou tipos de mercadorias com base em treinamentos insuficientes. A transparência e a responsabilidade no desenvolvimento dessas ferramentas são fundamentais, conforme orientações de organismos internacionais que preconizam princípios de beneficência e justiça no uso da ciência e tecnologia (UNESCO, 2021; OECD, 2025). O impacto na atividade profissional também deve ser considerado, exigindo capacitação contínua para que os especialistas manejem as ferramentas de inteligência artificial como apoio estratégico e não apenas como substitutos operacionais.
As tendências futuras apontam para uma integração ainda maior da inteligência artificial nos sistemas de gestão e no Sistema Público de Escrituração Digital. Startups já desenvolvem soluções focadas em análises de riscos e compliance, visando automatizar a detecção de fraudes e simplificar processos fiscais complexos (Deloitte, 2024). A aceleração dessas soluções é impulsionada pela necessidade de segurança no controle fiscal e pelo armazenamento eficiente de arquivos digitais. O uso de modelagem de tópicos para explorar dados contábeis também surge como uma vertente promissora para a compreensão de grandes volumes de informações financeiras (Murphy, 2024). Nesse contexto, a inteligência artificial deixa de ser uma tendência para se tornar um requisito de sobrevivência e eficiência no ambiente corporativo moderno.
A Reforma Tributária em curso no Brasil adiciona uma camada extra de relevância a este estudo. A implementação gradual do Imposto sobre Bens e Serviços e da Contribuição Social sobre Bens e Serviços exigirá uma precisão ainda maior na classificação de bens e serviços, uma vez que se esperam alíquotas diferenciadas para diversos produtos. O sistema atual de códigos fiscais será suplantado pelo novo Código de Operação e Prestação, que visa unificar a tabela nacional e reduzir ambiguidades (Thompson Reuters, 2025). A inteligência artificial atuará como uma ponte estratégica nessa transição, facilitando a conversão entre os sistemas antigos e novos e garantindo que a coleta de informações seja contextualizada devidamente em cada operação. A sinergia entre a tecnologia e o olhar analítico do profissional será o diferencial para a conformidade em um cenário de mudanças legislativas profundas.
Limitações inerentes à pesquisa incluem a dependência da disponibilidade de dados públicos e a temporalidade das informações, visto que leis e decretos são dinâmicos e podem alterar a validade do processamento ao longo do tempo. No entanto, as evidências coletadas reforçam que a aplicação de ferramentas inteligentes produz um impacto positivo ao automatizar a leitura de grandes volumes de dados de forma ágil. A identificação de padrões e inconsistências em tempo real auxilia na manutenção da conformidade fiscal, proporcionando maior eficiência processual. Sugere-se que pesquisas futuras foquem na integração desses modelos com sistemas de auditoria governamental, explorando como a inteligência artificial pode contribuir para uma fiscalização mais justa e eficiente, reduzindo o hiato entre a emissão do documento e a validação tributária.
Conclui-se que o objetivo foi atingido, uma vez que a aplicação da inteligência artificial na classificação de documentos fiscais demonstrou ser uma ferramenta eficaz para aumentar a precisão e reduzir erros operacionais. A análise dos 847 documentos evidenciou que, embora modelos como o GPT-4 mini alcancem altos índices de acurácia, a supervisão humana permanece indispensável para tratar exceções e complexidades jurídicas. A automação do fluxo classificatório, desde a extração via OCR até a sugestão de códigos NCM e CFOP, proporciona agilidade e segurança ao compliance tributário, mitigando riscos de multas e retrabalhos. A tecnologia atua como um agente dinâmico que, aliado à expertise do profissional contábil, potencializa a eficiência da gestão fiscal em um ambiente de alta complexidade burocrática e transição legislativa.
Referências Bibliográficas:
APET. 2025. Estudo revela que 70% das empresas emitem nota fiscal com alguma informação tributária divergente. Disponível em: https://apet.org.br/noticia/estudo-revela-que-70-das-empresas-emitem-nota-fiscal-com-alguma-informacao-tributaria-divergente/. Acesso em: 22 ago. 2025.
Evangelista, Jailson et al. 2020. Estudo sobre a teoria da dominância tecnológica no uso da inteligência artificial aplicada à gestão tributária no Brasil. FECAP. Disponível em: http://tede.fecap.br:8080/bitstream/123456789/849/3/Jailson%20Evangelista.pdf. Acesso em: 11 mai. 2025.
Exame. 2025. Brasil sobe em ranking global de piores burocracias, veja lista. Disponível em: https://exame.com/mundo/brasil-sobe-em-ranking-global-de-piores-burocracias-veja-lista/. Acesso em: 22 ago. 2025.
Inteligência artificial entrando no mundo dos impostos. 2024. Delloite. Relatório. Disponível em: https://www.deloitte.com/content/dam/assets-zone4/br/pt/docs/services/tax/2024/Deloitte-tax-artificial-intelligence-in-tax.pdf. Acesso em: 01 jun.2025.
Laruccia, J. B. 2022. Classificação Automática de Notas Fiscais Eletrônicas para Utilização de Créditos Tributários de PIS/PASEP e COFINS. USP. Disponível em: https://bdta.abcd.usp.br/directbitstream/0a7c9c2b-57de-482a-84e3-. Acesso em: 22 ago. 2025.
Murphy, B. 2024. Exploring accounting and AI using topic modelling. International Journal of Accounting Information Systems. 55: 100709. Disponível em: https://www.sciencedirect.com/science/article/pii/S1467089524000423. Acesso em: 20 mai.2025.
OECD. 2025. Recommendation of the Council on Artificial Intelligence. Disponível em: https://legalinstruments.oecd.org/en/instruments/oecd-legal-0449. Acesso em: 31 jul. 2025.
Russel, S. J.; Norvig, P. 2022. Artificial intelligence: a modern approach. 4ed. Pearson, UK, London. Disponível em: https://aima.cs.berkeley.edu/. Acesso em: 20 mai. 2025.
Santos, M. T. M. 2023. Classificação de produtos em Notas Fiscais Eletrônicas usando descrições textuais não estruturadas. Trabalho de Conclusão de Curso (Graduação), UFAL, Maceió. Acesso em: 11 mai. 2025.
Silva, D. S. 2022. SCAN-NF: a machine learning system for invoice product transaction classification through short-text processing. Dissertação (Mestrado em Informática) – Universidade de Brasília, Brasília. Repositório UnB. Acesso em: 11 mai. 2025.
TESCHE, N. 2025. Desenvolvimento de modelo de aprendizado de máquina para classificar o motivo de compra de produtos a partir de notas fiscais eletrônicas. Trabalho de Conclusão de Curso (Graduação em Engenharia de Software), Universidade Federal do Rio Grande do Sul, Porto Alegre. Lume UFRGS. Acesso em: 11 mai. 2025.
Thompson Reuters. 2025. Perspectivas tributárias para 2025: reforma, digitalização e conformidade. Relatório. Disponível em: https://www.thomsonreuters.com.br/pt/tax-accounting/onesource-mastersaf/blog/perspectivas-tributarias-2025.html. Acesso em: 22 ago. 2025.
UNESCO. 2021. Recomendação sobre a Ética da Inteligência Artificial. Disponível em: https://unesdoc.unesco.org/ark:/48223/pf0000381137_por. Acesso em: 31 jul. 2025.
Resumo executivo oriundo de Trabalho de Conclusão de Curso da Especialização em Gestão Tributária do MBA USP/Esalq
Para saber mais sobre o curso, clique aqui e acesse a plataforma MBX Academy




























