Imagem Avaliação de Ensaios Triaxiais CIU com Métodos Não Supervisionados de Machine Learning

26 de fevereiro de 2026

Avaliação de Ensaios Triaxiais CIU com Métodos Não Supervisionados de Machine Learning

João Marcílio Pires Caixeta; Igor Pinheiro de Araújo Costa

Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.

Este estudo propõe e avalia uma metodologia para interpretar resultados de ensaios triaxiais consolidados não drenados (CIU) por meio de machine learning não supervisionado. A abordagem combina clusterização hierárquica e K-means para identificar padrões de comportamento intrínsecos em amostras de solo e investigar efeitos sistemáticos na resposta tensão-deformação. O objetivo é superar as limitações da análise tradicional, baseada na inspeção visual, oferecendo um procedimento quantitativo, reprodutível e escalável para avaliar grandes conjuntos de dados geotécnicos, aprimorando o controle de qualidade e a confiabilidade das interpretações.

A engenharia geotécnica utiliza ensaios triaxiais para caracterizar o comportamento mecânico dos solos. O ensaio consolidado não drenado (CIU) é fundamental para simular carregamentos rápidos em solos de baixa permeabilidade, permitindo a determinação de parâmetros de resistência e deformabilidade (Bishop e Henkel, 1962; Mitchell e Soga, 2005). A representação dos resultados através dos invariantes de tensão, como o desvio de tensões (t) e a tensão efetiva média (s’), é padrão para a interpretação de fenômenos de contractância e dilatância, que governam a geração de poropressão e a mobilização da resistência (Wood, 1990).

Apesar dos protocolos consolidados como a norma ASTM D4767 (ASTM, 2020), a interpretação integrada de campanhas de ensaios triaxiais é um desafio. Projetos de grande porte geram centenas de ensaios, muitas vezes de múltiplos laboratórios. A análise convencional, baseada na avaliação individual de cada curva, é subjetiva, trabalhosa e não escalável, dificultando a identificação de padrões coletivos, anomalias e, crucialmente, a quantificação de efeitos sistemáticos introduzidos por variações entre laboratórios ou procedimentos.

Para superar essas limitações, métodos de machine learning não supervisionado oferecem um arcabouço para a análise exploratória de dados geotécnicos (Hastie, Tibshirani e Friedman, 2009). A análise de cluster (clusterização) é uma técnica proeminente que agrupa observações (amostras de solo) com base na similaridade, de modo que os itens em um mesmo grupo são mais parecidos entre si do que com os de outros grupos (Everitt et al., 2011). Essa segmentação automática e objetiva é ideal para sintetizar a informação de múltiplas trajetórias de tensão-deformação, revelando grupos de comportamento distintos.

Este estudo explora duas técnicas de clusterização: a hierárquica aglomerativa e a não hierárquica K-means. A clusterização hierárquica constrói um dendrograma ao fundir progressivamente as amostras mais similares, visualizando a estrutura de agrupamento (Murtagh e Contreras, 2012). O algoritmo K-means particiona os dados em um número pré-definido de clusters (K), otimizando a homogeneidade interna de cada grupo (Fávero e Belfiore, 2024). Ao aplicar ambas as técnicas a um conjunto de ensaios CIU de um mesmo material, a metodologia visa agrupar amostras por comportamento mecânico e usar essa segmentação para investigar a origem das variações, como a influência do laboratório executor, servindo como ferramenta de controle de qualidade.

O estudo utilizou dados de ensaios de compressão triaxial CIU, executados conforme a norma ASTM D4767 (ASTM, 2020). As amostras, de um mesmo material, foram moldadas com grau de compactação de 98%. O protocolo incluiu saturação (parâmetro B de Skempton > 0,95), adensamento isotrópico sob quatro tensões de confinamento (400, 800, 1200 e 1800 kPa) e cisalhamento não drenado com controle de deformação axial (Bishop & Henkel, 1962; Head, 1994). Para a análise, o comportamento tensão-deformação de cada corpo de prova foi representado no plano de invariantes de tensão efetiva (s’, t). As curvas contínuas foram amostradas em seis níveis de deformação axial (0,1%, 0,25%, 0,5%, 1%, 2,5% e 10%). Para cada uma das 14 amostras, os pares (s’, t) registrados nesses pontos, para cada um dos quatro níveis de adensamento, resultaram em um vetor de 48 variáveis por amostra. Antes da clusterização, os dados foram padronizados pelo método Z-Score para garantir que todas as variáveis contribuíssem igualmente para o cálculo das distâncias.

A primeira abordagem foi a clusterização hierárquica aglomerativa. Utilizando a distância euclidiana como medida de dissimilaridade e o método de encadeamento único (single linkage) para fusão, o processo foi visualizado por meio de um dendrograma (Murtagh e Contreras, 2012). A segunda abordagem foi o algoritmo não hierárquico K-means (Johnson e Wichern, 2007). O número ótimo de clusters (K) foi determinado pelo método do cotovelo (Elbow method), que analisa a Soma Total dos Quadrados Dentro dos Clusters (WCSS). Uma vez definido K, o algoritmo K-means atribui iterativamente cada amostra ao centroide mais próximo e recalcula os centroides até a convergência. Para ambas as técnicas, foram gerados cinco modelos: um com o conjunto completo de 48 variáveis e quatro modelos específicos para cada nível de adensamento.

A análise inicial dos resultados brutos, plotando todas as trajetórias no plano s’ x t, revelou heterogeneidade comportamental apesar de as amostras serem do mesmo material. Foram identificados visualmente três padrões: um grupo com comportamento predominantemente contrátil (trajetória para a esquerda, indicando geração de poropressão); um segundo grupo com comportamento transicional; e uma única amostra (Amostra 2) com comportamento marcadamente dilatante (aumento da tensão efetiva média). Essa diferenciação era mais evidente com o aumento da tensão de adensamento, especialmente a 1200 e 1800 kPa.

A clusterização hierárquica aglomerativa confirmou as observações iniciais. Em todos os dendrogramas, a Amostra 2 foi consistentemente identificada como um outlier, sendo a última a se agrupar. Um subconjunto de amostras (1, 6, 8, 10, 11 e 14) também formou um cluster coeso. Contudo, os dendrogramas exibiram o efeito de “chaining” (encadeamento), característico do método de single linkage, que cria clusters alongados e pouco compactos. Essa característica foi considerada inadequada para o objetivo de definir grupos homogêneos, concluindo-se que esta configuração de clusterização hierárquica não era a mais eficaz para a segmentação.

A clusterização não hierárquica com K-means produziu resultados mais robustos. A aplicação do método do cotovelo indicou consistentemente K=3 como o número ótimo de clusters para os modelos que consideraram todos os corpos de prova e para os adensados a 800, 1200 e 1800 kPa. Apenas para 400 kPa; a diferenciação era menor, o método sugeriu K=5. A escolha de K=3 alinhou-se com os três padrões de comportamento identificados visualmente. O modelo K-means com o conjunto completo de variáveis demonstrou um agrupamento preciso: o Cluster 0 agrupou as amostras com comportamento contrátil; o Cluster 1 foi formado exclusivamente pela Amostra 2 (outlier dilatante); e o Cluster 2 reuniu as amostras com comportamento transicional. A visualização gráfica das curvas coloridas por cluster confirmou a alta homogeneidade interna dos grupos. Os modelos para níveis de adensamento mais elevados (1200 e 1800 kPa) também produziram segmentações claras e consistentes.

Após a definição dos clusters, a investigação buscou as causas das diferenças de comportamento. Uma análise descritiva dos dados de caracterização geotécnica (limites de Atterberg, massa específica dos grãos, granulometria) revelou que não havia diferenças estatisticamente significativas nos parâmetros de índice entre os clusters. As propriedades físicas eram muito semelhantes entre os grupos, descartando a hipótese de que as variações no comportamento tensão-deformação fossem devidas à heterogeneidade do material.

Com a hipótese de heterogeneidade do material enfraquecida, a análise focou em fatores extrínsecos, especificamente o laboratório executor. As 14 amostras foram ensaiadas em dois laboratórios (A e B). A tabulação cruzada entre cluster e laboratório revelou um padrão inequívoco. No modelo K-means principal, o Cluster 0 (contrátil) era composto por 8 amostras do Laboratório A e 1 do Laboratório B. O Cluster 1 (outlier) continha a única amostra restante do Laboratório B, e o Cluster 2 (transicional) era formado exclusivamente por 4 amostras do Laboratório B. Este padrão de segregação por laboratório foi consistente nos demais modelos. Para os corpos de prova adensados a 800 kPa, por exemplo, um cluster continha todas as 8 amostras do Laboratório A, enquanto os outros dois continham exclusivamente as 6 amostras do Laboratório B. Essa forte correlação entre o comportamento mecânico e o laboratório executor é a principal descoberta do estudo, indicando um efeito sistemático.

A discussão dos resultados indica que, mesmo com amostras de mesma gênese e características de índice, as trajetórias tensão-deformação diferiram sistematicamente entre os dois laboratórios. Este achado sugere que variações sutis nos procedimentos de preparo, calibração de equipamentos, taxas de deformação ou outros aspectos do protocolo experimental podem impactar significativamente os resultados. Tal efeito sistemático, difícil de detectar em análises convencionais, foi claramente revelado pela clusterização. O resultado reforça a importância da padronização rigorosa e da realização de ensaios interlaboratoriais (round-robin tests) para garantir a comparabilidade e a confiabilidade dos dados geotécnicos, especialmente em projetos com múltiplas fontes de dados.

O presente trabalho demonstrou a viabilidade e eficácia de uma metodologia baseada em machine learning não supervisionado para a interpretação integrada de ensaios triaxiais CIU. A abordagem permitiu diferenciar objetivamente amostras com distintos comportamentos tensão-deformação, superando a subjetividade da análise visual. O algoritmo K-means mostrou-se mais efetivo que a clusterização hierárquica com encadeamento único para este conjunto de dados, gerando agrupamentos mais homogêneos. A principal contribuição da metodologia foi a identificação de um claro efeito sistemático de laboratório; amostras com características geotécnicas similares apresentaram respostas mecânicas distintas dependendo do laboratório executor. Este achado sublinha o potencial da abordagem como ferramenta de controle de qualidade para detectar inconsistências em grandes campanhas de ensaios geotécnicos. Conclui-se que o objetivo foi atingido.

Referências:
ASTM INTERNATIONAL. [2020]. ASTM D4767 – Standard Test Method for Consolidated Undrained Triaxial Compression Test for Cohesive Soils (CU) with Pore Water Pressure Measurement. ASTM International, West Conshohocken, PA, USA.
Bishop, A. W.; Henkel, D. J. 1962. The Measurement of Soil Properties in the Triaxial Test. 2ed. Edward Arnold, London, UK.
Everitt, B. S.; Landau, S.; Leese, M.; Stahl, D. 2011. Cluster Analysis. 5ed. Wiley, Chichester, UK.
Fávero, L. P.; Belfiore, P. 2024. Manual de análise de dados: estatística e machine learning com Excel, SPSS, Stata, R e Python. 2ed. LTC GEN, Rio de Janeiro, RJ, Brasil.
Hastie, T.; Tibshirani, R.; Friedman, J. 2009. The Elements of Statistical Learning. 2ed. Springer, New York, NY, USA.
Head, K. H. 1994. Manual of Soil Laboratory Testing. Vol. 3: Effective Stress Tests. 2ed. John Wiley & Sons, Chichester, UK.
Johnson, R. A.; Wichern, D. W. 2007. Applied Multivariate Statistical Analysis. 6ed. Pearson Prentice Hall, Upper Saddle River, NJ, USA.
Mitchell, J. K.; Soga, K. 2005. Fundamentals of Soil Behavior. 3ed. Wiley, Hoboken, NJ, USA.
Murtagh, F.; Contreras, P. 2012. Algorithms for hierarchical clustering: na overview. WIREs Data Mining and Knowledge Discovery 2(1): 86–97.
Wood, D. M. 1990. Soil Behaviour and Critical State Soil Mechanics. Cambridge University Press, Cambridge, UK.

Resumo executivo oriundo de Trabalho de Conclusão de Curso de Especialização em Data Science e Analytics do MBA USP/Esalq

Saiba mais sobre o curso; clique aqui:

Quem editou este artigo

Você também pode gostar

Quer ficar por dentro das nossas últimas publicações? Inscreva-se em nossa newsletter!

Receba conteúdos e fique sempre atualizado sobre as novidades em gestão, liderança e carreira com a Revista E&S.

Ao preencher o formulário você está ciente de que podemos enviar comunicações e conteúdos da Revista E&S. Confira nossa Política de Privacidade