Imagem Definição de níveis de controle de instrumentação com técnica de regressão múltipla

30 de janeiro de 2026

Definição de níveis de controle de instrumentação com técnica de regressão múltipla

Bernardo Emanuel Lopes Silva; Elisa Morandé Sales

Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.

Este estudo avalia a aplicação de técnicas de Machine Learning, com ênfase na regressão múltipla, para definir níveis de controle estatísticos para piezômetros e medidores de nível d’água em barragens de sedimentos e rejeitos. A pesquisa desenvolve um método que utiliza dados históricos de instrumentação e variáveis ambientais para gerar limites de controle dinâmicos e automatizados, superando as limitações dos métodos tradicionais. Analisa-se como as previsões dos modelos podem apoiar a tomada de decisões de engenheiros geotécnicos, aprimorando o monitoramento e a segurança das estruturas. A abordagem visa um sistema de alerta robusto e adaptativo para a detecção precoce de anomalias e prevenção de desastres.

A segurança de barragens tornou-se prioritária na engenharia geotécnica brasileira após os colapsos em Fundão e Brumadinho, que evidenciaram a necessidade de monitoramento rigoroso e contínuo. A instrumentação geotécnica é fundamental, permitindo a identificação de anomalias que indicam riscos à estabilidade. Conforme De Freitas (2022), a eficácia do monitoramento depende da aquisição, registro e processamento sistemático de dados de instrumentos implantados na barragem. A análise desses dados permite acompanhar o comportamento da estrutura e compará-lo com as premissas de projeto, sendo a base para a gestão de segurança.

Tradicionalmente, a identificação de anomalias utiliza níveis de controle determinísticos, como a “Carta de Risco”, para verificar se os parâmetros estão dentro dos limites de segurança (Reis et al., 2024). Contudo, a abordagem tem limitações. ZORZAL et al. (2016) apontam que esses limites são gerados a partir de cenários de condições extremas da linha freática, o que pode levar a resultados inadequados, como a simulação de saturação do talude de jusante. Tais cenários, mesmo com fatores de segurança que atendem aos limites normativos, podem mascarar a suscetibilidade a mecanismos de ruptura como a erosão regressiva (piping), tornando o fator de segurança pouco representativo do risco real.

Diante das deficiências dos modelos determinísticos, abordagens estatísticas surgiram como alternativa. Fusaro (2007) foi pioneiro ao propor a definição de níveis de controle com base em análises estatísticas de dados históricos, visando gerar alertas automáticos para alterações no comportamento da série temporal de um instrumento. Ele estabeleceu faixas de consistência para dados de poropressão por meio de regressões lineares que relacionavam cotas piezométricas com o nível de água do reservatório. Apesar do avanço, essas técnicas ainda dependem de análises individuais e exigem procedimentos manuais de exclusão de pontos anômalos, limitando a velocidade e a escalabilidade da interpretação dos dados.

O avanço computacional e a popularização do machine learning criaram oportunidades para aprimorar a análise de dados de instrumentação. Modelos supervisionados, como a regressão múltipla, podem identificar padrões complexos e prever comportamentos com maior acurácia. A regressão múltipla estima a relação entre uma variável dependente e múltiplas variáveis independentes. Segundo Montgomery, Peck e Vining (2012), o método é aplicado em engenharia para avaliar o impacto de variáveis como precipitação e sazonalidade nas leituras piezométricas. Embora possa ser menos preciso que métodos como ARIMA para previsão de curtíssimo prazo, sua vantagem é elucidar a influência de fatores externos, auxiliando na distinção entre variações normais e anomalias. Esta pesquisa propõe uma abordagem mais robusta e adaptativa para um monitoramento eficaz.

A metodologia é quantitativa e experimental, baseada na análise de dados históricos de barragens de terra para disposição de rejeitos e sedimentos, cujas identidades foram omitidas por confidencialidade. A pesquisa combinou três procedimentos: pesquisa bibliográfica para fundamentar as técnicas de machine learning e monitoramento; pesquisa experimental com a aplicação de modelos de regressão múltipla; e um estudo de caso focado na análise de dados de um piezômetro (barragem de sedimentos) e de um medidor de nível d’água (barragem de rejeito).

O conjunto de dados foi preparado para a modelagem, tratando a ausência de leituras em dias como domingos e feriados. Para garantir a continuidade, os dados foram organizados em uma série diária, e os valores ausentes preenchidos por interpolação linear. As variáveis preditoras (independentes) incluíram pluviometria diária, leituras de régua linimétrica (quando disponíveis) e sazonalidade, capturada pela transformação da variável “mês” em variáveis indicadoras (dummies). Adicionalmente, foram criadas variáveis de pluviometria acumulada em janelas móveis de 5, 10, 15, 20, 25 e 30 dias para modelar a resposta tardia dos instrumentos a eventos de chuva, influenciada pelo tempo de infiltração da água no solo.

Para otimizar os modelos, foram aplicadas transformações na variável resposta. Os dados foram padronizados com o método z-score e, em seguida, submetidos a uma transformação de Yeo-Johnson, conforme Weisberg (2001). A escolha desta transformação foi motivada pela limitação da Box-Cox, que exige valores positivos e apresentou instabilidade numérica no caso. A transformação de Yeo-Johnson, que aceita valores positivos e negativos (Riani et al., 2023), mostrou-se mais adequada para estabilizar a variância e melhorar a normalidade dos resíduos. Para a seleção das variáveis mais relevantes, foi empregado o procedimento automatizado Stepwise, que remove sequencialmente variáveis com baixa significância estatística (p-value > 0,05), simplificando o modelo e evitando superajuste.

Foram avaliados seis modelos para o piezômetro e quatro para o medidor de nível d’água (modelos com régua acumulada não foram aplicados a este por indisponibilidade de dados). Os modelos ajustados foram usados para calcular os limites de controle, definidos como os intervalos de confiança de 95% para os valores previstos. O desempenho foi comparado com base no R² ajustado, que mede a variabilidade explicada pelo modelo, e no logaritmo da verossimilhança (Log-Likelihood), que avalia o ajuste aos dados (Fávero et al., 2017). Realizou-se o Teste de Breusch-Pagan para verificar a heterocedasticidade nos resíduos. Por fim, os resultados foram comparados com os limites de controle mensais da metodologia de Fusaro (2007), baseada na média e em dois desvios padrão das leituras de cada mês.

A análise inicial pela metodologia de Fusaro (2007) revelou um comportamento sazonal para ambos os instrumentos. Os limites de controle mensais, calculados com base na média e em dois desvios padrão, mostraram variação cíclica ao longo do ano, justificada por fatores como pluviometria e nível do reservatório. A estatística descritiva dos dados brutos corroborou essa observação, mostrando uma ampla gama de valores para as leituras e para a pluviometria, que variou de 0 a 141 mm diários.

A análise de clusterização com o algoritmo k-means (k=4) agrupou os dados em quatro períodos com comportamentos semelhantes. Para o piezômetro, o cluster 0 correspondeu aos meses de janeiro a março (pluviometria máxima), enquanto o cluster 1 (julho a setembro) representou a estiagem. Os períodos de maior e menor pluviometria não coincidiram com as leituras máximas e mínimas, sugerindo uma resposta defasada. No medidor de nível de água, o período de maiores leituras (cluster 0) foi consistentemente precedido pelo de maiores pluviometrias (cluster 1), reforçando a hipótese de um tempo de resposta. Essa análise validou a importância de incluir variáveis sazonais e de pluviometria acumulada nos modelos.

A avaliação comparativa dos modelos de regressão múltipla mostrou que o Modelo 4, que incorporou pluviometrias acumuladas e passou por padronização e transformação Yeo-Johnson, apresentou o melhor desempenho para ambos os instrumentos. Ele alcançou o maior valor de Log-Likelihood (-2228,39 para o piezômetro e -1776,66 para o medidor de nível de água). Os modelos que utilizaram a transformação Yeo-Johnson exibiram ganho significativo no Log-Likelihood, indicando melhor ajuste. Os valores de R² ajustado, entre 0.42 e 0.51, foram considerados satisfatórios para o objetivo do estudo, que era criar uma ferramenta para definição de faixas de controle, não maximizar a capacidade preditiva.

O procedimento Stepwise de seleção de variáveis revelou a dinâmica de cada instrumento. Para o piezômetro, nos modelos com leitura da régua linimétrica, a pluviometria diária foi removida por falta de significância estatística, indicando que a régua já capturava o efeito da precipitação. Apenas a pluviometria acumulada de 20 dias foi mantida, sugerindo um tempo de resposta mais longo. Para o medidor de nível de água, o Stepwise manteve as pluviometrias acumuladas de 5 e 30 dias, indicando uma resposta com efeito de curto e longo prazo. A remoção de certas dummies mensais (como “mês 2”) sugere que o comportamento em fevereiro foi similar ao do mês de referência (janeiro).

A comparação entre os limites de controle mensais médios do Modelo 4 e os do método de Fusaro (2007) demonstrou proximidade. Para o piezômetro, a maior diferença entre os limites superiores foi de 0,76 metros (mês 12), e para o medidor de nível de água, 1,68 metros (mês 3). Essa semelhança valida a regressão múltipla como alternativa consistente à abordagem tradicional. A principal vantagem do modelo de regressão, no entanto, é sua natureza dinâmica: em vez de um limite fixo mensal, ele gera um limite de controle diário, ajustado com base nas condições de pluviometria e nível do reservatório, proporcionando um monitoramento mais granular e sensível.

Os testes de Breusch-Pagan confirmaram a presença de heterocedasticidade nos resíduos de todos os modelos, significando que a variância dos erros não é constante. Embora isso viole uma premissa da regressão linear para inferência estatística, não compromete a validade da aplicação para o objetivo prático deste estudo: a definição de intervalos de controle. O modelo permanece robusto para identificar pontos que se desviam do comportamento esperado, mesmo com variância não constante. A escolha da regressão múltipla em detrimento de modelos como o ARIMA foi

Referências:
BRASIL. 2022. Resolução nº 95, de 7 de fevereiro de 2022. Consolida os atos normativos que dispõem sobre segurança de barragens de mineração. Diário Oficial da União, Brasília, DF, 08 fev. 2022.
De Freitas, Isabela Vasconcelos Leite et al. 2022. Revisão metodológica para a análise de monitoramento e instrumentação de barragem de rejeitos de mineração. In: XX Congresso Brasileiro de Mecânica dos Solos e Engenharia Geotécnica – COBRAMSEG, 2022, Campinas, SP
Fávero, L. P.; Belfiore, P. 2017. Manual de análise de dados: estatística e modelagem multivariada com Excel®, SPSS® e Stata®. Elsevier Brasil, Rio de Janeiro, RJ, Brasil.
Fusaro, T. C. 2007. Análise Estatística Aplicada ao Controle de Instrumentação Geotécnica em Barragens de Terra. Tese de Doutorado em Engenharia, Universidade de São Paulo (USP), São Paulo, SP, Brasil.
Koh, Eun-Hee; Lee, Eunhee; Lee, Kang-Kun. Application of geographically weighted regression models to predict spatial characteristics of nitrate contamination: Implications for an effective groundwater management strategy. Journal of environmental management, v. 268, p. 110646, 2020.
Montgomery, D. C.; Peck, E. A.; Vining, G. G. 2012. Introduction to Linear Regression Analysis. John Wiley & Sons, Hoboken, NJ, EUA.
Reis, Custódio Junio et al. 2024. Proposta para definição de níveis de controle em estruturas com restrição de acesso. In: Congresso Brasileiro de Mecânica dos Solos e Engenharia Geotécnica – COBRAMSEG, 2024, Balneário Camboriu, SC, Brasil.
Riani, M.; Atkinson, A. C.; Corbellini, A. 2023. Automatic robust Box–Cox and extended Yeo–Johnson transformations in regression. Statistical Methods & Applications, v. 32, n. 1, p. 75-102.
Weisberg, S. 2001. Yeo-Johnson power transformations. Department of Applied Statistics, University of Minnesota, Minneapolis, MN, EUA.
Zorzal, R.; Santos, R.; Elian, L.; Ribeiro, L.; Dias, M. 2016. Proposição de metodologia para elaboração de carta de risco de barragens de terra e terra-enrocamento. In: Congresso Brasileiro de Mecânica dos Solos e Engenharia Geotécnica – COBRAMSEG, 2016, Belo Horizonte, MG, Brasil.


Resumo executivo oriundo de Trabalho de Conclusão de Curso de Especialização em Data Science e Analytics do MBA USP/Esalq

Saiba mais sobre o curso; clique aqui:

Quem editou este artigo

Você também pode gostar

Quer ficar por dentro das nossas últimas publicações? Inscreva-se em nossa newsletter!

Receba conteúdos e fique sempre atualizado sobre as novidades em gestão, liderança e carreira com a Revista E&S.

Ao preencher o formulário você está ciente de que podemos enviar comunicações e conteúdos da Revista E&S. Confira nossa Política de Privacidade