Imagem Avaliação da regeneração do Cerrado com Dados Orbitais e Drone/LiDAR

19 de fevereiro de 2026

Avaliação da regeneração do Cerrado com Dados Orbitais e Drone/LiDAR

Rômullo Oliveira Louzada; Thiago Gentil Ramires

Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.

Este estudo avaliou o poder preditivo de variáveis de sensoriamento remoto orbital (Landsat-9, Sentinel-2) na estimativa do número de árvores e da altura média, obtidas por LiDAR de drone em sítios de regeneração avançada do Cerrado. Utilizando algoritmos de aprendizado de máquina (Random Forest, XGBoost, CatBoost), buscou-se modelar a estrutura vertical e a densidade da vegetação. A necessidade de métricas quantitativas para monitorar a sucessão ecológica impulsiona a integração de dados de alta resolução, como os de LiDAR, com a cobertura de imagens de satélite. A validação de modelos preditivos robustos é fundamental para a ciência da restauração, a validação de projetos de crédito de carbono e o planejamento de políticas de conservação.

O sensoriamento remoto é um recurso indispensável para monitorar ecossistemas, especialmente em áreas em recuperação (Dubovyk, 2017). Sua cobertura espacial, precisão e recorrência o posicionam como uma ferramenta influente nos estudos ambientais (Chuvieco, 2020). É utilizado para investigar processos de degradação como desmatamento (Tharun et al., 2024), exploração de madeira (Gao et al., 2020), incêndios florestais (Yang et al., 2024), secas (Kumar et al., 2024) e pragas (Mngadi et al., 2024). A tecnologia também é central na avaliação de processos de restauração e na quantificação do grau de conservação de ambientes naturais (Wang et al., 2024).

Por isso, o sensoriamento remoto é empregado no monitoramento de projetos de crédito de carbono, como REDD+ (Carter et al., 2021; Demarchi et al., 2023) e iniciativas de florestamento, reflorestamento e revegetação (ARR) (Vincent et al., 2025). No entanto, a avaliação precisa do grau de restauração por dados orbitais permanece um desafio. A complexidade reside na necessidade de integrar múltiplos índices espectrais, diferentes escalas e técnicas analíticas para capturar as alterações na estrutura e funcionalidade dos ecossistemas (Dupuis et al., 2020). A combinação de diferentes fontes de dados e abordagens metodológicas robustas é crucial para aprimorar a acurácia das análises.

A qualidade da informação sobre a vegetação depende da resolução espacial dos sensores e dos comprimentos de onda. A série histórica de imagens Landsat, disponível desde 1985, tem sido fundamental para estudos em larga escala, com bandas espectrais sensíveis à clorofila e ao teor de água (Van Leeuwen, 2009). Índices como NDVI, SAVI e EVI, e transformações como o Tasseled Cap, permitem estimar vigor, biomassa e estresse hídrico (Venancio et al., 2020). O sensor Sentinel-2 expande esse potencial com maior resolução espacial (10 a 20 metros), maior frequência de revisita e bandas na região do red-edge, sensíveis à densidade foliar. Adicionalmente, as bandas termais do Landsat permitem estimar a temperatura da superfície, um indicador de estresse térmico (Neinavaz et al., 2019).

O imageamento por veículos aéreos não tripulados (VANTs), ou drones, consolidou-se como uma ferramenta de altíssima resolução espacial, flexibilidade e custo reduzido (Yao et al., 2019; Zhang e Zhu, 2023). A integração da tecnologia LiDAR a drones permite a medição detalhada de altura, densidade e distribuição das árvores com precisão superior aos métodos tradicionais (Neuville et al., 2022; Li et al., 2024). A nuvem de pontos tridimensional gerada pelo LiDAR serve para a calibração e validação de modelos de biomassa e carbono (Coops et al., 2025; Xu et al., 2025). Contudo, a integração de dados de múltiplas fontes, como satélite e LiDAR, é complexa e exige estratégias metodológicas robustas (Pelletier et al., 2016). Algoritmos de aprendizado de máquina, como o Random Forest, destacam-se por sua capacidade de modelar relações complexas e identificar as variáveis mais relevantes (Belgiu e Drăguţ, 2016; Luan et al., 2020).

A área de estudo compreende 661 hectares da Fazenda Continental, no Parque Estadual Nascentes do Rio Taquari, em Alcinópolis, MS. A região, no bioma Cerrado, foi usada para pecuária extensiva por mais de quatro décadas antes de ser adquirida pelo governo estadual em 2022. Atualmente, integra o projeto “Sementes do Taquari”, que visa a restauração ecológica e a conservação do solo e da água (Louzada et al., 2025). A vegetação predominante é o Cerrado stricto sensu, com formações de Cerradão em áreas mais úmidas (Silva et al., 2011). O relevo é de planaltos e vales, com altitudes de 616 a 852 metros. O clima é tropical, com inverno seco e verão chuvoso, e os solos são neossolos quartzarênicos.

A metodologia foi estruturada em desenho experimental, processamento de dados orbitais e modelagem. As áreas de regeneração foram delimitadas por vetorização manual no Google Earth Pro. Os níveis de regeneração foram classificados com base na diferença do Índice de Vegetação por Diferença Normalizada (NDVI) (Rouse Jr. et al., 1973) entre 2004 (Landsat-5) e 2025 (Landsat-8). A imagem de diferença foi reclassificada pelo método de quebras naturais (Jenks) em três classes: regeneração inicial, intermediária e avançada, sendo esta última o foco da coleta LiDAR. O levantamento LiDAR foi executado com um drone DJI Matrice 350 e sensor Zenmuse L2, a 100 metros de altura e 70% de sobreposição. A nuvem de pontos foi processada no DJI Terra para gerar o Modelo Digital do Terreno (MDT) e o Modelo Digital da Superfície (MDS). A subtração desses modelos resultou no Modelo de Altura do Dossel (CHM), a partir do qual a altura e a localização das árvores foram detectadas com um script em Python (rasterio, scipy), considerando uma janela de 5×5 pixels e altura mínima de 2 metros.

As variáveis preditoras foram extraídas de imagens Landsat-9 (L9) e Sentinel-2 (S2) de julho de 2025. O conjunto de dados incluiu 76 variáveis para o L9 e 115 para o S2, abrangendo bandas espectrais, índices de vegetação (NDVI, EVI, SAVI, MSAVI, TSAVI), índices de solo (BI, CI, RI), transformações Tasseled Cap (TCBRI, TCVEG, TCWET, TCSOIL_BRI), temperatura da superfície (LST) derivada de L9 no Google Earth Engine (Ermida et al., 2020), e métricas de textura da Matriz de Co-ocorrência em Níveis de Cinza (GLCM), como contraste, correlação e entropia, processadas no SNAP 9.0.

Para a modelagem, foram selecionados 1.000 pixels das imagens L9 e S2 sobrepostos à classe de regeneração avançada, resultando em um conjunto amostral de 766 polígonos para L9 e 952 para S2 após a remoção de polígonos parciais. As métricas do LiDAR, número de árvores (NTree) e altura média das árvores (THAVG), foram as variáveis-resposta. Os algoritmos de aprendizado de máquina Random Forest (RF) (Breiman, 2001), Extreme Gradient Boosting (XGBoost) (Chen e Guestrin, 2016) e Categorical Boosting (CatBoost) (Prokhorenkova et al., 2018) foram empregados. Os dados foram divididos em 80% para treinamento e 20% para validação. A otimização dos hiperparâmetros foi realizada por validação cruzada com busca em grade (GridSearchCV). A performance dos modelos foi avaliada pela raiz quadrada do erro médio quadrático (RMSE), sua versão percentual (RMSE%) e o erro médio (Bias).

A análise da diferença de NDVI entre 2004 e 2025 mostrou incrementos significativos nas extremidades sudeste e sudoeste e em porções ao norte, indicando sucessão ecológica, enquanto as porções centrais tiveram variações discretas. Isso permitiu estratificar a área em três níveis de regeneração, com o estrato avançado correspondendo a uma variação de NDVI entre 0,40 e 0,63. Esta classificação direcionou a coleta de dados LiDAR, confirmando o NDVI como uma ferramenta eficaz para o planejamento de levantamentos (Gandhi et al., 2015; Huang et al., 2021).

O levantamento com drone/LiDAR apresentou lacunas na aquisição de dados, atribuídas à perda de sinal GNSS/RTK, um problema recorrente em áreas com relevo acidentado (Li et al., 2023) e florestas densas (Abdi et al., 2022). Apesar disso, o Modelo de Altura do Dossel (CHM) gerado foi robusto, com altura máxima de 28,59 metros. As áreas com maior altura de dossel coincidiram com a classe de regeneração avançada, especialmente na porção sul/sudeste, validando a classificação inicial baseada no NDVI.

A detecção automática de árvores a partir do CHM, embora eficiente, apresentou desafios. Em algumas regiões, copas de árvores maiores, com dimensões superiores a cinco pixels, foram fragmentadas pelo algoritmo. Esse superdimensionamento resultou na detecção de um número de indivíduos superior ao real, um artefato comum em métodos baseados em CHM. A literatura sugere a implementação de etapas de pós-processamento, como a classificação dos segmentos (Lisiewicz et al., 2022), e a realização de coletas em diferentes estações do ano para melhorar a segmentação de copas (Pu et al., 2023).

A avaliação do desempenho dos modelos indicou superioridade na predição da altura média das árvores (THAVG) em comparação com o número de árvores (NTree). O algoritmo Random Forest apresentou um desempenho ligeiramente superior. Para NTree, o melhor modelo (RF com dados do Sentinel-2) alcançou um RMSE% de 52,79, indicando alta incerteza. Em contraste, para THAVG, a combinação de RF com dados do Landsat-9 obteve um RMSE% de 20,13, resultado de boa acurácia para o Cerrado. A discrepância de desempenho entre os sensores foi significativa apenas para a modelagem de NTree, enquanto os resultados para THAVG foram consistentes entre L9 e S2.

Esses achados corroboram estudos que apontam ganhos marginais na predição de variáveis estruturais ao se utilizar dados do Sentinel-2 em relação ao Landsat (Astola et al., 2019; Zhou et al., 2023). A maior estabilidade na predição de THAVG sugere que variáveis estruturais contínuas são mais facilmente modeladas por sensores de resolução moderada do que variáveis discretas. A dificuldade em estimar NTree provavelmente decorre do fato de que múltiplos indivíduos podem estar contidos em um único pixel de 10 metros. A literatura reforça que variáveis como altura, área basal e volume tendem a apresentar melhor desempenho em análises de sensoriamento remoto em comparação com a contagem de árvores (Dalla Corte et al., 2020; Peng et al., 2020; Khan et al., 2025).

A análise de importância das variáveis revelou a contribuição de diferentes preditores. Para a estimativa de NTree, o modelo RF com dados do Sentinel-2 destacou a métrica de textura B3CORR (correlação da banda verde) como a mais relevante, seguida pelo índice EVI. Isso sugere que a heterogeneidade espacial do dossel é um indicador importante da densidade. Para a estimativa de THAVG, os principais preditores foram os índices espectrais EVI e TCWET (umidade do Tasseled Cap), seguidos por uma métrica de textura (B3HOM) e o índice de brilho TCBRI. Isso indica que a altura da vegetação está mais associada ao vigor fotossintético e ao teor de umidade, enquanto a densidade está mais ligada à sua textura espacial.

A comparação entre valores observados e preditos confirmou as tendências de desempenho. Os gráficos de dispersão para NTree mostraram grande dispersão, evidenciando a dificuldade do modelo em capturar a variabilidade da contagem. Em contrapartida, a relação para THAVG foi mais linear e concentrada, indicando predição mais estável. A análise espacial dos erros mostrou que o modelo de NTree tendeu a subestimar a contagem de árvores, enquanto o modelo de THAVG apresentou um padrão de superestimação na porção sudeste; a vegetação é mais densa, e predições mais acuradas nas demais regiões.

Este estudo demonstrou a viabilidade de integrar dados LiDAR de alta

Referências:
ABDI, Omid et al. Evaluation of forest features determining GNSS positioning accuracy of a novel low-cost, mobile RTK system using LiDAR and TreeNet. Remote Sensing, v. 14, n. 12, p. 2856, 2022.
ASTOLA, Heikki et al. Comparison of Sentinel-2 and Landsat 8 imagery for forest variable prediction in boreal region. Remote Sensing of Environment, v. 223, p. 257-273, 2019.
BELGIU, Mariana; DRĂGUŢ, Lucian. Random forest in remote sensing: A review of applications and future directions. ISPRS journal of photogrammetry and remote sensing, v. 114, p. 24-31, 2016.
BREIMAN, L. Random Forests. Machine learning, v. 45, p. 5-32, 2001.
CARTER, Sarah et al. Capacity development for use of remote sensing for redd+ mrv using online and offline activities: Impacts and lessons learned. Remote Sensing, v. 13, n. 11, p. 2172, 2021.
CHEN, Tianqi; GUESTRIN, Carlos. Xgboost: A scalable tree boosting system. In: Proceedings of the 22nd acm sigkdd international conference on knowledge discovery and data mining. 2016. p. 785-794.
CHUVIECO, Emilio. Fundamentals of satellite remote sensing: An environmental approach. CRC press, 2020.
COOPS, Nicholas C. et al. Advances in laser scanning to assess carbon in forests: From ground-based to space-based sensors. Current Forestry Reports, v. 11, n. 1, p. 11, 2025.
DALLA CORTE, Ana Paula et al. Forest inventory with high-density UAV-Lidar: Machine learning approaches for predicting individual tree attributes. Computers and Electronics in Agriculture, v. 179, p. 105815, 2020.
DEMARCHI, Gabriela et al. Using publicly available remote sensing products to evaluate REDD+ projects in Brazil. Global Environmental Change, v. 80, p. 102653, 2023.
DUBOVYK, Olena. The role of Remote Sensing in land degradation assessments: opportunities and challenges. European Journal of Remote Sensing, v. 50, n. 1, p. 601-613, 2017.
DUPUIS, Chloé et al. How can remote sensing help monitor tropical moist forest degradation?—a systematic review. Remote Sensing, v. 12, n. 7, p. 1087, 2020.
ERMIDA, Sofia L. et al. Google earth engine open-source code for land surface temperature estimation from the landsat series. Remote Sensing, v. 12, n. 9, p. 1471, 2020.
GANDHI, G. Meera et al. Ndvi: Vegetation change detection using remote sensing and gis–A case study of Vellore District. Procedia computer science, v. 57, p. 1199-1210, 2015.
GAO, Yan et al. Remote sensing of forest degradation: a review. Environmental Research Letters, v. 15, n. 10, p. 103001, 2020.
HUANG, Sha et al. A commentary review on the use of normalized difference vegetation index (NDVI) in the era of popular remote sensing. Journal of forestry research, v. 32, n. 1, p. 1-6, 2021.
HUETE, Alfredo R. A soil-adjusted vegetation index (SAVI). Remote sensing of environment, v. 25, n. 3, p. 295-309, 1988.
KHAN, Ariful et al. Estimation of tree attributes in mixed tropical hill forests using Landsat-8 and Sentinel-1 data. Discover Environment, v. 3, n. 1, p. 69, 2025.
KUMAR, Vijendra et al. Advancements in drought using remote sensing: assessing progress, overcoming challenges, and exploring future opportunities. Theoretical and Applied Climatology, v. 155, n. 6, p. 4251-4288, 2024.
LI, Xingxing et al. Enhancing RTK performance in urban environments by tightly integrating INS and LiDAR. IEEE Transactions on Vehicular Technology, v. 72, n. 8, p. 9845-9856, 2023.
LI, Lanlan et al. Mapping elevational patterns of functional diversity of canopy species in an alpine forest using drone multispectral and LiDAR data. Ecological Indicators, v. 169, p. 112965, 2024.
LISIEWICZ, Maciej et al. Correcting the results of CHM-based individual tree detection algorithms to improve their accuracy and reliability. Remote Sensing, v. 14, n. 8, p. 1822, 20

Resumo executivo oriundo de Trabalho de Conclusão de Curso de Especialização em Data Science e Analytics do MBA USP/Esalq

Saiba mais sobre o curso; clique aqui:

Quem editou este artigo

Você também pode gostar

Quer ficar por dentro das nossas últimas publicações? Inscreva-se em nossa newsletter!

Receba conteúdos e fique sempre atualizado sobre as novidades em gestão, liderança e carreira com a Revista E&S.

Ao preencher o formulário você está ciente de que podemos enviar comunicações e conteúdos da Revista E&S. Confira nossa Política de Privacidade