Resumo Executivo

Imagem Identificação de garimpo na Amazônia com aprendizagem de máquina e índices espectrais

03 de fevereiro de 2026

Identificação de garimpo na Amazônia com aprendizagem de máquina e índices espectrais

Carolina Imaculada Ribeiro Silva; Renan Henrique Luquini

Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.

Este estudo objetiva identificar e monitorar áreas de garimpo ilegal na reserva Yanomami por meio da aplicação de algoritmos de classificação supervisionada, Random Forest [RF] e K-Nearest Neighbors [K-NN]. A abordagem utiliza índices espectrais de vegetação, como o Índice de Vegetação por Diferença Normalizada (NDVI), o Índice de Vegetação Ajustado ao Solo (SAVI) e o Índice de Borda Vermelha por Diferença Normalizada (NDRE), e índices de água, como o Índice de Água por Diferença Normalizada Modificado (MNDWI) e o Índice de Turbidez por Diferença Normalizada (NDTI), como variáveis preditoras. A pesquisa visa desenvolver uma metodologia remota e prática de monitoramento para aprimorar políticas públicas de preservação e fiscalização ambiental, oferecendo uma ferramenta tecnológica para órgãos de combate a atividades ilícitas que ameaçam o ecossistema e os povos originários.

A Floresta Amazônica é crucial para a regulação climática global, abrigando mais da metade das espécies do planeta e 20% da água doce disponível (Ramos, 2001). É também o lar de povos originários, cujos conhecimentos tradicionais são essenciais para a conservação do bioma. Contudo, a expansão do desmatamento e do garimpo ilegal em territórios protegidos tem provocado severos impactos na biodiversidade e no modo de vida de comunidades como os Yanomamis (Basta, 2023). A exploração ilegal de ouro, em particular, está associada ao aumento da violência, da contaminação por mercúrio e da degradação ambiental, configurando uma crise humanitária e ecológica.

O arcabouço legal brasileiro, por meio do Art. 225 e Art. 231 da Constituição Federal de 1988, estabelece a responsabilidade compartilhada pela preservação ambiental e reconhece os direitos originários dos povos indígenas sobre suas terras, atribuindo à União a competência de protegê-las. Apesar dessa proteção, dados do MapBiomas Brasil revelam um crescimento de 625% na atividade garimpeira em terras indígenas entre 2010 e 2021, com 83% dessa área destinada à extração de ouro. Estima-se que 90% da produção ilícita de ouro no Brasil tenha origem na Amazônia (Manzolli et al., 2021), uma atividade que, além de inconstitucional, agrava o desequilíbrio ambiental e contribui para o genocídio dos povos indígenas.

Diante dos efeitos das mudanças climáticas, é imperativo que órgãos fiscalizadores como o Instituto Brasileiro do Meio Ambiente e dos Recursos Naturais Renováveis (IBAMA), a FUNAI e a Agência Nacional de Mineração (ANM) adotem tecnologias avançadas para monitorar e combater a mineração ilegal. O sensoriamento remoto, combinado com aprendizado de máquina, surge como uma solução estratégica, permitindo a análise de vastas áreas de difícil acesso de forma contínua e com baixo custo. Estudos anteriores demonstraram a eficácia de índices espectrais para caracterizar áreas de mineração. Peres et al. (2023) obtiveram sucesso utilizando NDVI e NDWI na Província Mineral do Tapajós, enquanto Dias et al. (2023) aplicaram o algoritmo Random Forest com os índices SAVI e MNDWI para analisar mudanças na cobertura do solo em Ipixuna do Pará, alcançando precisões entre 81% e 89%.

A presente pesquisa avança ao integrar o Índice de Turbidez por Diferença Normalizada (NDTI), que oferece um excelente contraste para diferenciar águas limpas de cursos d’água assoreados pela atividade garimpeira (Lacaux et al., 2007), cuja eficácia em modelos de classificação para esta área de estudo ainda não havia sido explorada. O estudo compara dois algoritmos de classificação supervisionada não paramétricos: Random Forest e K-Nearest Neighbors (Maxwell et al., 2018; Richards, 2022). O Random Forest é conhecido por sua robustez e capacidade de reduzir o sobreajuste (overfitting) ao agregar múltiplas árvores de decisão (Breiman, 2001; Géron, 2019), enquanto o K-NN oferece uma abordagem baseada na proximidade espacial das amostras, de fácil interpretação (Cover & Hart, 1967). A comparação entre um modelo robusto como o RF e um mais simples como o K-NN permite avaliar a performance de classificação e a importância relativa de cada índice espectral na identificação de garimpos.

O estudo adota uma metodologia de pesquisa observacional descritiva-quantitativa, focada na seleção de imagens de satélite, na descrição de áreas de garimpo por índices espectrais e na implementação e comparação dos modelos Random Forest e K-Nearest Neighbors. O fluxo de trabalho foi estruturado em seis etapas: (I) aquisição e pré-processamento dos dados de satélite e extração dos índices espectrais; (II) seleção das variáveis e análise descritiva; (III) treinamento e validação dos modelos; (IV) avaliação das métricas de desempenho; (V) comparação estatística entre os modelos; e (VI) comparação dos resultados com dados do sistema DETER-B do Instituto Nacional de Pesquisas Espaciais (INPE). O processamento e a modelagem foram executados em Python (versão 3.12.7) utilizando bibliotecas como Scikit-learn, Imbalanced-learn e Mlxtend, enquanto a aquisição de dados e a geração de mapas foram realizadas na plataforma Google Earth Engine (GEE).

A área de estudo, com 977 km², está localizada na Reserva Yanomami, em Roraima. As imagens de satélite utilizadas foram obtidas da coleção do satélite Sentinel-2, com resolução espacial de dez metros, cobrindo o período de janeiro a setembro de 2024. O pré-processamento no GEE incluiu correção atmosférica e aplicação de uma máscara de nuvens de 10% para garantir a qualidade das reflectâncias. A partir dessas imagens, foram calculados cinco índices espectrais: NDVI (Rouse et al., 1974), SAVI (Huete, 1988), NDRE (Barnes et al., 2000), MNDWI (Xu, 2006) e NDTI (Lacaux et al., 2007). Cada índice foi selecionado por sua capacidade de realçar características específicas: NDVI e SAVI para biomassa vegetal, NDRE para a saúde da vegetação, MNDWI para corpos d’água e NDTI para a turbidez da água, um indicador chave da atividade garimpeira aluvionar.

O ajuste de hiperparâmetros foi realizado de forma distinta para cada modelo. Para o K-NN, utilizou-se validação cruzada com 10 folds para testar valores de ‘k’ entre 1 e 20, selecionando o valor que maximizava a acurácia. Para o Random Forest, foi empregado o GridSearchCV com 5 folds para otimizar hiperparâmetros como a profundidade da árvore e o número de estimadores. A avaliação do desempenho dos modelos foi baseada em métricas como acurácia, precisão, recall, F1-score, matriz de confusão e a área sob a curva ROC (AUC). A importância das variáveis foi avaliada pelo método “Permutation Feature Importance” (Fisher et al., 2019), que permite uma comparação direta entre algoritmos. A significância estatística da diferença de desempenho foi verificada pelo teste t pareado 5x2cv (Dietterich, 1998), e os mapas de classificação gerados foram comparados com os alertas de mineração do sistema DETER-B (Diniz et al., 2015).

A classe “Garimpo” exibiu grande dispersão nos valores dos índices, refletindo a heterogeneidade ambiental dessas áreas, que incluem solo exposto, cavas de mineração e rios com alta turbidez. O valor médio positivo do NDTI para esta classe confirmou sua eficácia em detectar a turbidez associada à mineração. A análise das assinaturas espectrais de cada classe corroborou a representatividade das amostras, com a classe “Floresta” mostrando forte absorção no espectro visível e alta reflectância no infravermelho próximo, padrão de vegetação densa. A assinatura da classe “Garimpo” foi semelhante à de solos argilosos, com reflectância elevada no espectro visível e no infravermelho de ondas curtas (SWIR), em conformidade com a literatura (USGS, 2025).

O modelo Random Forest, após o ajuste de hiperparâmetros, alcançou uma acurácia de 99,1% no treino e 95,1% no teste, demonstrando boa capacidade de generalização. A matriz de confusão revelou que a maioria das amostras foi classificada corretamente, com pequenas confusões entre classes espectralmente semelhantes, como “Floresta” e “Vegetação rasa”, e “Garimpo” e “Água”. Para a classe de interesse “Garimpo”, o modelo obteve uma precisão de 98% e um recall de 96%, resultando em um F1-score de 97%. A análise da curva ROC multiclasse confirmou o desempenho robusto do modelo, com valores de AUC superiores a 0,99 para todas as classes, indicando uma capacidade de discriminação quase perfeita.

A análise de importância das variáveis para o Random Forest, utilizando o método de permutação, destacou o NDTI como o índice mais influente, seguido pelo NDRE e pelo SAVI. O NDTI foi crucial para a distinção das classes “Água” e “Garimpo”, enquanto o NDRE foi mais relevante para a classe “Floresta”. A remoção dos índices de menor importância (NDVI e MNDWI) resultou em uma queda de aproximadamente dois pontos percentuais na acurácia do teste, indicando que eles contribuíam para o desempenho do modelo. Este resultado contrasta com outros estudos na Amazônia (Dias et al., 2023; Peres et al., 2023) onde o NDVI foi o índice mais importante, uma diferença que pode ser atribuída à natureza aluvionar do garimpo na área de estudo; a turbidez da água (capturada pelo NDTI) é um indicador mais direto.

O modelo K-Nearest Neighbors, com o valor ótimo de k=3, atingiu uma acurácia de 96,6% no treino e 92,7% no teste, também indicando boa generalização. A análise da matriz de confusão mostrou um padrão de erros semelhante ao do Random Forest. Para a classe “Garimpo”, o K-NN alcançou uma precisão de 97% e um recall de 93%, com um F1-score de 95%. Os valores de AUC foram superiores a 0,96 para todas as classes, com um AUC de 0,98 para a classe “Garimpo”, confirmando o bom desempenho do modelo.

A análise de importância das variáveis para o K-NN também identificou o

Referências:
Barnes, E. M.; Clarke, T. R.; Richards, S. E.; Colaizzi, P. D.; Haberland, J.; Kostrzewski, M.; et al. 2000. Coincident detection of crop water stress, nitrogen status and canopy density using ground-based multispectral data. In: Proceedings of the 5th International Conference on Precision Agriculture.
Basta, P. C. 2023. Garimpo de ouro na Amazônia: a origem da crise sanitária Yanomami. Cad. Saúde Pública 2023 39(12).
Brasil. 1988. Artigo 225. Constituição da República Federativa do Brasil de 1988. Diário Oficial da União, Brasília, 5 out. 1988. Capítulo VI – Do Meio Ambiente, p. 86.
Brasil. 1988. Artigo 231. Constituição da República Federativa do Brasil de 1988. Diário Oficial da União, Brasília, 5 out. 1988. Capítulo VIII – Dos Índios, p. 88.
Breiman, L. 2001. Random Forests. Machine Learning 45(1): 5-32.
Congalton, R. G. 1988. A comparison of sampling schemes used in generating error matrices for assessing the accuracy of maps generated from remotely sensed data. Photogrammetric Engineering & Remote Sensing 54: 593–600.
Cover, T.; Hart, P. 1967. Nearest neighbor pattern classification. IEEE Transactions on Information Theory 13(1): 21-27.
Crósta, A. P. 1993. Processamento digital de imagens de Sensoriamento Remoto. Ed rev. UNICAMP-Instituto de Geociências, Campinas, São Paulo, Brasil.
Dias, Y. A. S.; Machado, F. F.; Beltrão, N. E. S. 2023. Avaliação do uso de índices espectrais para mapeamento de cobertura da terra em áreas de mineração em Ipixuna do Pará (PA). In.: ANAIS DO XX Simpósio Brasileiro de Sensoriamento Remoto, 2023, Florianópolis, SC, Brasil. Anais eletrônicos…, p.3159-3162.
Dietterich, T. G. 1998. Approximate Statistical Tests for Comparing Supervised Classification Learning Algorithms. Neural Computation 10(7): 1895–1923.
Diniz, C. G; Souza, A. A. A; Santos, D. C; Dias, M. C; Luz, N. C; Moraes, D. R. V. 2015 DETER-B: The New Amazon Near Real-Time Deforestation Detection System. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing 8(7): 3619-3628.
Fisher, A.; Rudin, C.; Dominici, F. 2019. All Models are Wrong, but Many are Useful: Learning a Variable’s Importance by Studying an Entire Class of Prediction Models Simultaneously. Journal of Machine Learning Research 20(177): 1–81.
FUNAI. Funai destaca importância dos povos indígenas para proteção da Amazônia. Portal Amazônia, 5 set. 2023. Disponível em: <https://portalamazonia. com/amazonia/funai-destaca-importancia-dos-povos-indigenas-para-protecao-da-amazonia/>. Acesso em: 25 agosto 2025.
Géron, A. 2019. Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems. 2. ed. Sebastopol: O’Reilly Media.
Hastie, T.; Tibshirani, R.; Friedman, J. 2009. The Elements of Statistical Learning. 2ed. Springer, New York, USA.
Hoff, R. 2021. Análise qualitativa e quantitativa do relevo de vinhedos a partir de imagem ALOS em Encruzilhada do Sul, Brasil. Bento Gonçalves: Embrapa Uva e Vinho.
Huete, A. R. A. 1988. A soil-adjusted vegetation index (SAVI). Remote Sensing of Environment 25(3): 295-309.
Kuhn, M.; Johnson, K. 2013. Applied Predictive Modeling. Springer, New York, USA.
Lacaux, J. P; Tourre, Y. M.; Vignolles, C.; Ndione, J. A.; Lafaye, M. 2007. Classification of ponds from high-spatial resolution remote sensing: Application to Rift Valley fever epidemics in Senegal. Remote Sensing of Environment 106(1): 66–74.
Manzolli, B.; Rajão, R.; Bragança, A. C. H.; Oliveira, P. T. M.; Alcântara, G. K. de A.; Nunes, F.; Filho, B. S. 2021. Legalidade da produção de ouro no Brasil. Editora IGC/UFMG. Belo Horizonte, Minas Gerais, Brasil.
MAPBIOMAS. 2023. DETERB-AMAZONIA. Laudo do alerta código 885120. Disponível em: < https://alerta. mapbiomas. org/metodo-mapbiomas-alerta > Acesso em: 10 março 2025.
Maxwell, A. E.; Warner, T. A.; Fang, F. 2018. Implementation of machine-learning classification in remote sensing: An applied review. International Journal of Remote Sensing 39(9): 2784–2817.
McFeeters, S. K. 1996. The use of the Normalized Difference Water Index (NDWI) in the delineation of open water features. International Journal of Remote Sensing. 17(7): 1425-1432.
Peres, L. G. M.; Ferreira, G. H. S.; Cambraia Filho, D. J.; Oliveira, L. T. P; Pereira, D. O. S. 2023. Identificação de garimpos na Amazônia brasileira por meio de detecção de mudanças e índices de vegetação em imagens PlanetScope. In: SIMPÓSIO BRASILEIRO DE SENSORIAMENTO REMOTO, XX, 2023, São José dos Campos, SP, Brasil. Anais…, p. 2311–2312.
Ramos, C. A. 2001. A importância das Florestas em Pé na Amazônia. IPAM – Instituto de Pesquisa Ambiental da Amazônia. Disponível em: < https://ipam. org. br/cartilhas-ipam/a-importancia-das-florestas-em-pe/>. Acesso em: 10 março 2025.
Richards, J. A. 2022. Remote Sensing Digital Image Analysis. 6ed. Springer, Chan, Switzerland.
Rouse Jr, J. W.; HAAS, R. H.; SCHELL, J. A.; DEERING, D. W. 1974. Monitoring vegetation systems in the Great Plains with ERTS. NASA. Goddard Space Flight Center 3D ERTS-1Symp 1: 309-317.
Thompson, S. K. 1987. Sample size for estimating multinomial proportions. The American Statistician 41(1): 42–46.
United States Geological Survey (USGS). 2025. Spectral Characteristics Viewer. Disponível em: <https://landsat. usgs. gov/spectral-characteristics-viewer> Acesso em: 25 agosto 2025.
Xu, H. 2006. Modification of Normalized Difference Water Index (NDWI) to Enhance Open Water Features in Remotely Sensed Imagery. International Journal of Remote Sensing 27: 3025-3033.


Resumo executivo oriundo de Trabalho de Conclusão de Curso de Especialização em Data Science e Analytics do MBA USP/Esalq

Saiba mais sobre o curso; clique aqui:

Quem editou este artigo

Você também pode gostar

Quer ficar por dentro das nossas últimas publicações? Inscreva-se em nossa newsletter!

Receba conteúdos e fique sempre atualizado sobre as novidades em gestão, liderança e carreira com a Revista E&S.

Ao preencher o formulário você está ciente de que podemos enviar comunicações e conteúdos da Revista E&S. Confira nossa Política de Privacidade