
27 de fevereiro de 2026
Análise de infrações ambientais em Mato Grosso via machine learning
Gabriel Vitoreli de Oliveira; Éllen Rimkevicius Carbognin
Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.
O objetivo deste estudo é analisar os dados de infrações ambientais emitidas pelo estado de Mato Grosso, no período de outubro de 2022 a fevereiro de 2025, por meio de técnicas de Machine Learning, para identificar padrões e associações entre as variáveis que caracterizam os ilícitos. A investigação busca extrair informações estratégicas de dados governamentais, transformando registros administrativos em inteligência para a gestão e fiscalização ambiental. A premissa é que a aplicação de métodos computacionais pode revelar dinâmicas ocultas sobre a ocorrência de crimes ambientais, permitindo uma alocação mais eficiente de recursos e o desenvolvimento de políticas públicas mais assertivas.
A relevância da pesquisa se ancora no arcabouço legal e no contexto socioeconômico do Brasil. A Constituição Federal de 1988 consagra o meio ambiente ecologicamente equilibrado como um direito fundamental, “bem de uso comum do povo e essencial à sadia qualidade de vida”, impondo ao Poder Público e à coletividade o dever de sua defesa e preservação (Brasil, 1988). Nesse cenário, Mato Grosso se destaca na produção agropecuária mundial e tem a responsabilidade de preservar aproximadamente 60% de seu território. Este duplo papel gera uma tensão entre o desenvolvimento econômico, que impulsiona o estado a crescer a taxas superiores à média nacional (Kramer, 2023), e a necessidade de sustentabilidade ambiental.
Em resposta a essa pressão, o Estado tem intensificado o combate aos crimes ambientais, modernizando suas estratégias de fiscalização. A adoção de tecnologias de geoprocessamento e monitoramento por satélite para detecção de desmatamento exemplifica essa evolução, resultando em um aumento de 660% nas autuações remotas por desmate ilegal e outros ilícitos entre 2018 e 2021 (SEMA-MT, 2023). O poder de polícia do Estado se materializa na lavratura de autos de infração, instrumentos que aplicam sanções financeiras, impõem embargos e estabelecem a obrigação de reparação do dano, responsabilizando o infrator nas esferas administrativa, cível e penal (Vaz, 2018; Aragão et al., 2016).
A transição para processos digitais, formalizada pelo Decreto Estadual nº 1.436/2022, que instituiu o Sistema Integrado de Gestão Ambiental de Autuação e Responsabilização (SIGA AUTUAÇÃO), foi um marco na gestão de dados ambientais em Mato Grosso (Mato Grosso, 2022). A centralização e informatização dos processos geraram um volume crescente de dados estruturados, criando um ambiente propício para a aplicação de técnicas computacionais. O Machine Learning (ML) surge, neste contexto, como uma ferramenta capaz de processar e analisar grandes volumes de dados para identificar padrões e correlações difíceis de detectar por métodos tradicionais.
A técnica de ML consiste em algoritmos que aprendem interativamente a partir de um conjunto de dados, gerando resultados descritivos ou preditivos (Shalev-Shwartz & Ben-David, 2014). A presente pesquisa concentra-se em uma abordagem de aprendizado não supervisionado, que visa descobrir semelhanças e estruturas nos dados sem a necessidade de rótulos prévios (Usama et al., 2019). Ao aplicar essa metodologia aos dados de infrações ambientais, ricos em variáveis categóricas como município, tipo de dano e faixas de valor, o estudo se propõe a desvendar as associações que caracterizam o panorama dos ilícitos no estado, fornecendo subsídios para a tomada de decisão.
A metodologia adotada é um estudo exploratório, fundamentado em Machine Learning não supervisionado, com foco na Análise de Correspondência Múltipla (ACM). A ACM é uma técnica estatística multivariada projetada para analisar a estrutura de inter-relações entre três ou mais variáveis categóricas. Conforme Fávero e Belfiore (2024), a ACM é útil para investigar associações entre as categorias das variáveis, representando-as graficamente em um espaço de dimensão reduzida, o que facilita a interpretação de padrões complexos.
A base de dados foi obtida do Geoportal da Secretaria de Estado do Meio Ambiente de Mato Grosso (SEMA-MT), uma plataforma pública de informações (Geoportal, 2025). O conjunto de dados compreende 14.448 registros de autos de infração lavrados pela SEMA-MT, Polícia Militar Ambiental e Corpo de Bombeiros Militar, abrangendo o período de outubro de 2022 a fevereiro de 2025. Este recorte temporal foi selecionado para refletir a dinâmica mais recente da fiscalização, após a consolidação do sistema digital de autuação.
O processo de preparação dos dados (Data Wrangling) foi uma etapa fundamental. Os dados, baixados em formato “. csv”, passaram por limpeza e transformação, com remoção de registros com valores nulos ou inconsistentes. Em seguida, variáveis quantitativas contínuas, como valor da multa e área afetada, foram transformadas em variáveis categóricas ordinais. Os valores das multas, por exemplo, foram agrupados em faixas predefinidas (R$ 0-50.000, R$ 300.000-500.000, etc.). Esta etapa foi crucial, pois a ACM opera exclusivamente com dados categóricos.
Para a execução da análise, foi utilizada a linguagem de programação Python (versão 3.12) no ambiente Spyder. Foram empregadas bibliotecas especializadas em análise de dados e Machine Learning, incluindo: Pandas, para manipulação de dataframes; Numpy, para operações numéricas; Scipy. stats, para testes estatísticos como o Qui-quadrado, que validou a significância das associações; Statsmodels e Prince, para a execução da ACM; e Matplotlib, Seaborn e Plotly, para a geração de visualizações gráficas. O dataframe final foi construído com as variáveis de maior interesse: tipo do dano, município (agrupado por região de planejamento da SEPLAN-MT), valor da multa (categorizado) e frente de fiscalização (flora, fauna, empreendimentos).
A análise dos 14.448 autos de infração revelou que as infrações relacionadas à flora são as mais prevalentes. O desmatamento ilegal é a principal infração, com 7.287 registros, representando mais de 50% do total. A segunda infração mais comum, a implantação ou operação de empreendimentos sem licença ambiental, contabilizou 1.358 registros, seguida pelo descumprimento de embargos, com 1.045 autos. Os números indicam que a supressão de vegetação e a regularização de atividades econômicas são os principais focos de conflito ambiental.
A análise financeira reforça a proeminência dos crimes contra a flora. O montante total das multas aplicadas no período foi de R$ 7.287.706.830,96, distribuído entre 49 tipos de infração. O desmatamento, isoladamente, foi responsável por R$ 3.088.776.209,07, correspondendo a 42% do valor total. Agregando outras infrações ligadas à flora, como “impedir ou dificultar a regeneração natural da vegetação” (R$ 1,74 bilhão), “exploração seletiva” (R$ 474,9 milhões) e “queimada” (R$ 170,8 milhões), o valor consolidado ultrapassa 75% do montante. Isso evidencia que a pressão sobre as formações vegetais nativas não é apenas o crime mais frequente, mas também o que gera as maiores penalidades financeiras.
A distribuição geográfica das infrações revela padrões regionais. Em quantidade de autos, a região de planejamento Norte lidera com 2.149 registros, seguida pelas regiões Sul (2.060) e Sudeste (2.013). Esta concentração corrobora com os boletins de monitoramento da SEMA-MT (2025), que apontam os municípios das regiões Norte e Noroeste como principais focos de alertas de desmatamento, validando a eficácia da fiscalização em direcionar ações para áreas críticas.
Contudo, a análise da distribuição dos valores das multas apresenta uma dinâmica diferente. A região Sul, segunda em número de autos, lidera em valor total autuado, com R$ 3.286.244.381,98, superando as regiões Centro-Norte (R$ 1,05 bilhão) e Noroeste I (R$ 855,4 milhões). A explicação reside na ocorrência de um único caso de desmatamento químico de 80 mil hectares no Pantanal em 2024. Este evento, um outlier estatístico, inflacionou os valores da região Sul, demonstrando como infrações de altíssimo impacto, embora menos frequentes, podem ter um peso desproporcional na contabilidade dos danos.
A distribuição dos valores individuais das multas mostra que mais da metade dos autos (55%) se concentra na faixa de até R$ 50.000,00. Cerca de 85% de todas as infrações possuem valores de até R$ 300.000,00. A estatística descritiva confirma essa tendência, com o terceiro quartil (75%) dos dados se concentrando em valores de até R$ 135.462,50. Este padrão sugere que a rotina da fiscalização é marcada por um volume massivo de infrações de menor porte financeiro, indicando uma capilaridade na atuação do Estado que abrange desde pequenos infratores até grandes desmatadores.
A aplicação da Análise de Correspondência Múltipla (ACM) aprofundou a compreensão das inter-relações. A primeira análise, cruzando frente de fiscalização, região e categorias de valores de multas, apresentou uma inércia total explicada de 11,62%. Embora o valor seja relativamente baixo, o teste Qui-quadrado confirmou sua significância estatística. O mapa perceptual resultante revelou um agrupamento mostrando uma associação clara entre a frente de “Flora”, as regiões Norte e Noroeste, e as faixas de multa entre R$ 50 mil e R$ 1 milhão. Conforme a teoria de interpretação de mapas perceptuais (Greenacre, 2008), isso evidencia que a fiscalização de crimes contra a vegetação está concentrada nessas duas regiões e associada a multas de valor intermediário a alto.
A segunda análise de correspondência, focada na relação entre regiões e categorias de valores das multas, produziu um resultado mais conclusivo. A inércia total explicada pelas duas primeiras dimensões foi de 92,49% (78,05% + 14,44%), indicando uma associação muito forte e estatisticamente robusta. O mapa perceptual (biplot) gerado, que representa as associações em um espaço de dimensão reduzida (Fávero & Belfiore, 2024), mostrou padrões visuais claros. Observou-se uma forte proximidade entre as categorias das regiões Noroeste e Centro-Norte com as faixas de valores mais elevadas (de R$ 300 mil a R$ 5 milhões), indicando que infrações de alta severidade financeira são mais características dessas áreas. Em contrapartida, as regiões Sudeste e Centro-Oeste se agruparam com a faixa de valor mais baixa (até R$ 50 mil), sugerindo que nessas localidades predominam infrações de menor impacto financeiro. Os valores acima de R$ 10 milhões apareceram como pontos distantes, confirmando sua natureza de outliers.
Os resultados demonstram a capacidade do Machine Learning em extrair insights de dados administrativos. A análise revelou um padrão bimodal na fiscalização ambiental de Mato Grosso: um grande volume de infrações de baixo valor distribuídas pelo estado e uma concentração de crimes de alto impacto financeiro, ligados à flora, em regiões como Norte, Noroeste e Centro-Norte. A pesquisa validou a eficiência de métodos como a ACM para identificar associações, fornecendo um diagnóstico que pode subsidiar a gestão pública. As implicações práticas permitem que os órgãos de controle direcionem recursos de fiscalização de forma mais estratégica, adaptando abordagens conforme a predominância de tipos e severidade de infrações em cada região. Adicionalmente, a disponibilidade de coordenadas geográficas nos dados originais aponta para pesquisas futuras, utilizando estatística espacial para identificar hotspots de crimes ambientais com maior precisão.
A investigação cumpriu sua proposta de analisar e identificar padrões nos dados de infrações ambientais, oferecendo uma visão multifacetada sobre a dinâmica dos ilícitos. As associações descobertas entre regiões, tipos de dano e valores das multas constituem um subsídio relevante para o aprimoramento das estratégias de controle e fiscalização. Conclui-se que o objetivo foi atingido: demonstrou-se que a aplicação de Machine Learning, especificamente a Análise de Correspondência Múltipla, foi eficaz em identificar padrões e associações significativas nos dados de infrações ambientais de Mato Grosso, revelando a concentração de ilícitos de menor valor e a forte correlação entre regiões geográficas e a severidade das multas aplicadas.
Referências:
Aragão, T. B.; Marques, E. R.; Lima, P. V. 2016. Auto de infração ambiental como instrumento de gestão territorial: fatores intervenientes. Revista Equador 5(03): 23 – 42.
Brasil. 1988. Constituição da República Federativa do Brasil de 1988. Brasília, DF: Presidência da República, Disponível em: https://www. planalto. gov. br/ccivil_03/constituicao/constituicao. htm. Acesso em: 10 fev. 2025.
Fávero, L. P. L; Belfiore, P. P. 2024. Manual de análise de dados Estatística e Machine Learning Excel, SPSS, Stata, R e Python. 2ª Ed. GEN. Rio de Janeiro, RJ, Brasil.
Geoportal. Banco de dados Geográficos da SEMA-MT. Disponível em: https://geoportal. sema. mt. gov. br/. Acesso em 10/03/2025.
Greenacre, M. J. 2008. La práctica del análisis de correspondencias. Fundación BBVA. Barcelona – ESP.
Kramer, V. “Campeão do século”, Mato Grosso cresce o triplo da média nacional com impulso do agro. 2023 Disponível em: https://www. gazetadopovo. com. br/economia/mato-grosso-estado-mais-cresce-pais-triplo-media-nacional/. Acesso em 10/03/2025.
Mato Grosso. 2022. Decreto Estadual n. 1436/2022. Dispõe sobre o processo administrativo estadual de apuração das infrações administrativas por condutas e atividades lesivas ao meio ambiente. Diário Oficial do Estado, Cuiabá-MT, de 19 de julho de 2022, p 1-9.
Monard, M. C.; Baranauskas, J. A. 2003. Conceitos sobre aprendizado de máquina. p.39 –56. In: Rezende, Solange, O. (Org.). Sistemas Inteligentes Fundamentos e Aplicações. 1. ed. Manole Ltda, Barueri-SP, Brasil.
Sema-MT. Secretaria de Estado de Meio Ambiente – MT. Boletim n° 03 – /CGMA/SRMA/SAGA/SEMA-MT/2024 e Alertas de Desmate Planet Anual – Período de 31/07/2023a01/08/2024 Disponível em: http://www. sema. mt. gov. br/transparencia/index. php/gestao-ambiental/monitoramento-ambiental/desmatamento. Acesso em 04/02/2025.
Sema-MT. Secretaria de Estado de Meio Ambiente – MT. Mato Grosso tem aumento de 660% nas autuações ambientais com apoio de imagens de satélite de alta resolução. 2023. Disponível em: http://www. sema. mt. gov. br/site/index. php/sema/noticias/61
Resumo executivo oriundo de Trabalho de Conclusão de Curso de Especialização em Data Science e Analytics do MBA USP/Esalq
Saiba mais sobre o curso; clique aqui:






































