Imagem Predição da duração de pesquisas sísmicas marítimas a partir de interrupções ambientais

10 de fevereiro de 2026

Predição da duração de pesquisas sísmicas marítimas a partir de interrupções ambientais

Pollianna Santos Ferraz; Fábio Lima

Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.

Este trabalho objetivou predizer a duração de futuras pesquisas sísmicas com base no tempo de interrupções causadas por medidas mitigadoras da legislação brasileira, considerando também a eficiência da atividade. A investigação desenvolveu um modelo quantitativo para auxiliar no planejamento estratégico e na gestão de riscos de projetos de prospecção de hidrocarbonetos, fornecendo uma estimativa mais precisa dos cronogramas. A premissa é que a frequência e a duração das paralisações forçadas pelo monitoramento da biota marinha são um fator preditivo significativo para a duração total dos projetos. Ao isolar e analisar o impacto dessas interrupções, o estudo busca preencher uma lacuna na literatura, que frequentemente aborda atrasos de forma multifatorial sem quantificar especificamente a contribuição das exigências ambientais. A análise testa a capacidade de diferentes algoritmos de aprendizado de máquina para generalizar padrões a partir de dados históricos e oferecer previsões robustas.

A prospecção de reservatórios marinhos de petróleo e gás depende de pesquisas sísmicas para o mapeamento do subsolo oceânico. A técnica de sistema de reflexão emite ondas sonoras por canhões de ar comprimido e registra os ecos refletidos pelas camadas geológicas, gerando imagens detalhadas das estruturas subterrâneas (Yilmaz, 2001). No Brasil, a Lei Federal nº 9.478/1997 abriu o setor à iniciativa privada, intensificando a necessidade de um arcabouço de licenciamento ambiental (Brasil, 1997). A resolução nº 237/1997 do Conselho Nacional do Meio Ambiente (CONAMA) estabeleceu as normas para o licenciamento de atividades potencialmente poluidoras, enquadrando a pesquisa sísmica como uma operação que exige avaliação e controle de impacto ambiental rigorosos (CONAMA, 1997).

O principal impacto ambiental da pesquisa sísmica é a emissão sonora de alta intensidade. Os pulsos sísmicos operam em frequências entre 10 e 200 Hz (Gausland, 2003), e a intensidade das ondas sonoras pode atingir níveis de pressão de até 240 decibéis (dB) referenciados a 1 micropascal (μPa) na água, com potencial para causar distúrbios na fauna marinha (Caldwell e Dragoset, 2000). Para mitigar esses efeitos, a legislação brasileira, via diretrizes do IBAMA, exige medidas de controle estritas. Destacam-se o Projeto de Monitoramento da Biota Marinha (PMBM), com observadores visuais a bordo, e o Monitoramento Acústico Passivo (MAP), que utiliza hidrofones para detectar vocalizações de mamíferos marinhos. A finalidade de ambos é acionar a paralisação imediata da emissão sonora sempre que mamíferos marinhos são detectados dentro de uma zona de exclusão pré-definida (IBAMA, 2018).

O Monitoramento Acústico Passivo (MAP) representou um avanço na detecção de mamíferos marinhos, especialmente para espécies crípticas, noturnas ou que passam muito tempo submersas (Akamatsu et al., 2001; Barlow e Taylor, 2005). Estudos demonstram que a combinação de métodos acústicos e visuais aumenta a probabilidade de detecção (Burham et al., 2016). Contudo, essa maior eficácia resulta em um aumento na frequência de interrupções da atividade sísmica. Cada paralisação (“shutdown”) interrompe a aquisição de dados e exige tempo adicional para a retomada, estendendo a duração e os custos do projeto (Gausland, 2000). O registro sistemático dessas interrupções, mantido pelo IBAMA no banco de dados público Netuno desde 2011, fornece a base empírica para a aplicação de técnicas de aprendizado de máquina, que utilizam a experiência passada para melhorar o desempenho em tarefas futuras (Mitchell, 1997).

A aplicação de modelos preditivos baseados em dados históricos é consolidada em diversas áreas, como comércio eletrônico (Lops et al., 2010; Zhang e Bockstedt, 2020), mercado financeiro (Macedo et al., 2013; Qiu et al., 2016), biologia estrutural (AlQuraishi, 2021), medicina (Gupta et al., 2021) e ciências sociais (Lundberg et al., 2022). Na geociência e engenharia offshore, modelos preditivos são utilizados para analisar dados marinhos (Ali et al., 2021; Lu et al., 2024) ou estimar propriedades geofísicas (Dumke e Berndt, 2019). Este trabalho aplica essa abordagem para modelar a duração de projetos sísmicos sob a influência das regulamentações ambientais, buscando transformar dados de conformidade em inteligência preditiva.

A metodologia iniciou com a coleta e o pré-processamento de dados do Banco de Dados Netuno (BDN) do IBAMA. De 21 projetos concluídos entre 2016 e 2024, a amostra final foi consolidada em 16, os únicos com informações completas sobre datas de início e término e duração das interrupções. A limpeza de dados envolveu a remoção de colunas irrelevantes, como nomes de operadores e coordenadas, a correção de formatos de data e a unificação dos registros de monitoramento visual (PMBM) e acústico (MAP) em um conjunto de dados coeso.

A análise exploratória dos dados, conduzida em Python com as bibliotecas Seaborn, Matplotlib e Numpy, revelou alta variabilidade, com áreas de projeto de 739 km² a 45.244 km² e durações de 21 a 929 dias. A variável “Eficiência” apresentou distribuição assimétrica à direita. O teste de normalidade de Shapiro-Wilk rejeitou a hipótese de normalidade para “Eficiência” (W = 0.749; p < 0.01). Seguindo as recomendações de Hair et al. (2009), foi aplicada uma transformação logarítmica (ln(eficiência + 1)), que normalizou a distribuição (W = 0.943; p = 0.3935), adequando-a para as análises de regressão. Uma matriz de correlação foi gerada para investigar as relações lineares entre as variáveis.

Para a modelagem preditiva, foram comparados múltiplos algoritmos de regressão. A análise começou com modelos de regressão linear simples e múltipla. Em seguida, foram testados algoritmos de aprendizado de máquina com a biblioteca Scikit-learn (Pedregosa et al., 2011): Random Forest Regressor, Suporte a Vetores de Regressão (SVR), e as regressões Ridge e Lasso, técnicas de regularização para controlar multicolinearidade. Para uma avaliação robusta, foi utilizada a validação cruzada k-fold com k=5, método que proporciona uma estimativa estável do erro de generalização, importante em cenários com amostras limitadas. O desempenho de cada modelo foi quantificado pelo coeficiente de determinação (R²) e pelo Erro Médio Quadrático (RMSE).

A análise de regressão linear simples mostrou que o tempo de interrupção por detecção acústica (deteccaodias) teve uma relação positiva e estatisticamente significativa com a duração total, explicando 36,5% de sua variância (R² = 0,365, p = 0,013). A variável de interrupção por observação visual (visualdias) demonstrou uma capacidade preditiva individual ainda maior, explicando 51,6% da variância na duração dos projetos (R² = 0,516, p = 0,002). Este achado sugere que as avistagens diretas de fauna marinha foram um indicador mais forte de atrasos. Em contrapartida, a eficiência operacional, mesmo após a transformação, não apresentou associação estatisticamente significativa com a duração quando analisada isoladamente (R² = 0,005, p = 0,800).

A superioridade preditiva da observação visual pode ser atribuída a avistagens de espécies de grande porte ou grupos que exigem períodos de paralisação mais longos. Alternativamente, a localização dos projetos pode coincidir com áreas de maior concentração de espécies mais facilmente avistáveis. A correlação negativa moderada observada entre as interrupções e a eficiência é esperada, pois cada paralisação representa uma interrupção no avanço da aquisição de dados (IBAMA, 2018). Contudo, a moderação dessa correlação reforça que a eficiência operacional é uma métrica multifatorial, influenciada por outros elementos não capturados, como falhas mecânicas e condições climáticas adversas, fatores citados como causas de atrasos em operações marítimas (Gausland, 2000; Caldwell e Dragoset, 2000).

Avançando para a regressão linear múltipla, que combinou as variáveis de interrupção acústica, visual e eficiência, o modelo global demonstrou ser estatisticamente significativo (F = 4,726; p < 0,05). Coletivamente, as variáveis preditoras explicaram 54,2% da variância total na duração dos projetos (R² = 0,542). Este resultado indica que mais da metade da variabilidade no tempo de conclusão das pesquisas pode ser atribuída à combinação das interrupções ambientais e da eficiência. Curiosamente, ao serem incluídas no modelo múltiplo, as variáveis individuais perderam sua significância estatística (p > 0,05 para todas), fenômeno que pode sugerir multicolinearidade ou que o poder preditivo reside na interação entre elas.

O desempenho do modelo de regressão múltipla (R² = 0,542) é consistente com o observado em estudos de predição em outros domínios com dados limitados. Por exemplo, em pesquisas para prever o tempo de internação hospitalar, modelos de regressão multivariada frequentemente alcançam R² em torno de 0,42 (Rothberg et al., 2023), enquanto modelos pediátricos podem atingir 0,63 (Bezerra et al., 2022). Na engenharia de software, a previsão da duração de projetos reportou desempenhos inferiores a 0,50 (Minku et al., 2018). Portanto, o resultado obtido representa um avanço na quantificação do impacto das variáveis ambientais e operacionais, refletindo um padrão de desempenho esperado para bases de dados do mundo real com poucas observações.

Na modelagem preditiva com algoritmos de aprendizado de máquina, os resultados foram contraintuitivos. Nenhum dos modelos testados (Random Forest, SVR, Ridge e Lasso) superou o desempenho de um modelo de linha de base, resultando em valores de R² médios negativos na validação cruzada, que variaram de -1,16 a -2,72. Um R² negativo indica que o modelo tem um desempenho pior do que simplesmente usar a média da variável alvo como previsão. Os valores de Erro Médio Quadrático (RMSE) também foram elevados, confirmando a baixa acurácia. Este fraco desempenho é um sintoma de modelos que não conseguem generalizar os padrões dos dados, um problema associado a conjuntos de dados com poucas amostras (Sharma et al., 2021).

A ausência de variáveis preditoras cruciais é outro fator explicativo para o baixo desempenho. O conjunto de dados não continha informações sobre outras fontes de interrupção, como tempo de parada para manutenção, paradas devido a condições climáticas adversas ou outras questões operacionais. A literatura confirma que esses fatores são causas significativas de atrasos (Gausland, 2000). Estudos em outras áreas que obtiveram sucesso com modelos preditivos, como na previsão da duração de projetos de construção, utilizaram conjuntos de dados muito maiores (mais de 80 projetos) e mais variáveis preditoras, alcançando R² superiores a 0,85 (Kang et al., 2020).

A experiência deste estudo ecoa as conclusões de outras pesquisas. Em um estudo para predição de tempo cirúrgico, a melhoria do poder preditivo de modelos mais sofisticados foi condicionada à adição de variáveis de contexto operacional (Rothberg et al., 2023). Isso reforça que, para problemas complexos, a

Referências:
Akamatsu, T.; Wang, D.; Wang, K.; Wei, Z. 2001. Comparison between visual and passive acoustic detection of finless porpoises in the Yangtze River, China. Journal of the Acoustical Society of America 109(4): 1723–1727.
Ali, A., Fathalla, A., Salah, A., Bekhit, M., & Eldesouky, E. 2021. Marine data prediction: an evaluation of machine learning, deep learning, and statistical predictive models. Computational Intelligence and Neuroscience, 2021.1: 8551167.
AlQuraishi, M. 2021. Machine learning in protein structure prediction. Current Opinion in Chemical Biology 65: 1–8.
Barlow, J.; Taylor, B. L. 2005. Estimates of sperm whale abundance in the northeastern temperate Pacific from a combined acoustic and visual survey. Marine Mammal Science 21(3): 429–445.
Bezerra, D. A.; Andrade, T. R.; Souza, F. A. A.; Silva, L. P. 2022. Aplicação de algoritmos de aprendizado de máquina para previsão da duração de internações hospitalares. Revista Brasileira de Engenharia Biomédica, 38(1): 45–56.
Brasil. 1997. Lei nº 9.478, de 6 de agosto de 1997. Dispõe sobre a política energética nacional, as atividades relativas ao monopólio do petróleo, institui o Conselho Nacional de Política Energética e a Agência Nacional do Petróleo. Diário Oficial da União, Brasília, DF, 7 ago. Seção 1, p.16925
Burham, R. E.; Palm, R. S.; Duffus, D. A.; Mouy, X.; Riera, A. 2016. The combined use of visual and acoustic data collection techniques for winter killer whale (Orcinus orca) observations. Global Ecology and Conservation 8: 24–30.
Caldwell, J.; Dragoset, W. 2000. A brief overview of seismic air-gun arrays. The Leading Edge 19: 898-902.
Cleger-Tamayo,

Resumo executivo oriundo de Trabalho de Conclusão de Curso de Especialização em Data Science e Analytics do MBA USP/Esalq

Saiba mais sobre o curso; clique aqui:

Quem editou este artigo

Você também pode gostar

Quer ficar por dentro das nossas últimas publicações? Inscreva-se em nossa newsletter!

Receba conteúdos e fique sempre atualizado sobre as novidades em gestão, liderança e carreira com a Revista E&S.

Ao preencher o formulário você está ciente de que podemos enviar comunicações e conteúdos da Revista E&S. Confira nossa Política de Privacidade