Resumo Executivo

06 de maio de 2026

Agente de IA para Análise e Prevenção de Acidentes Aeronáuticos

Luis Guilherme Pelzl Ferreira; Ana Cláudia Melo Tiessi Gomes De Oliveira

Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.

A segurança da aviação civil constitui um dos pilares fundamentais para a operação eficiente e confiável dos sistemas de transporte aéreo em escala global, exigindo mecanismos rigorosos de monitoramento e análise de riscos. No cenário brasileiro, o Centro de Investigação e Prevenção de Acidentes Aeronáuticos (CENIPA) desempenha um papel estratégico ao disponibilizar dados abertos sobre ocorrências aeronáuticas, o que permite a constituição de uma base de informações essencial para análises preventivas e para a formulação de políticas de segurança operacional robustas. A complexidade inerente ao setor aéreo demanda que tais dados sejam processados com precisão, uma vez que a interpretação correta de falhas passadas é o principal insumo para evitar catástrofes futuras. Nesse contexto, os sistemas multiagente emergem como uma abordagem tecnológica promissora para o processamento e a análise de dados aeronáuticos complexos, permitindo que diferentes entidades computacionais colaborem na extração de conhecimento útil. Conforme Wooldridge (2009), um agente é definido como um sistema computacional capaz de operar de forma autônoma, determinando suas próprias ações para atingir objetivos designados sem a necessidade de instruções explícitas constantes. Quando múltiplos agentes interagem, seja cooperando, coordenando ou negociando por meio de infraestruturas de rede para alcançar objetivos diversos, eles formam um sistema multiagente. Essa capacidade de interação entre agentes independentes é considerada crucial para gerenciar a vasta gama de informações e processos envolvidos na segurança da aviação, especialmente diante do volume crescente de registros digitais.

A crescente complexidade e o volume massivo desses dados exigem abordagens analíticas avançadas, sendo a inteligência artificial uma ferramenta de destaque para a extração automatizada de insights que seriam dificilmente detectados por métodos puramente manuais. Zaoui et al. (2024) destacam que a utilização de tecnologias baseadas em inteligência artificial está se tornando essencial para o desenvolvimento de novos serviços e soluções inovadoras no setor aeronáutico, permitindo uma transição de modelos reativos para modelos preditivos de segurança. Complementarmente, Rasheed et al. (2024) demonstraram que modelos de linguagem de larga escala podem automatizar eficientemente a extração de informações relevantes e identificar padrões ocultos em grandes bases de dados através de abordagens multiagente, acelerando significativamente processos analíticos tradicionais que antes consumiam semanas de trabalho especializado. Estudos recentes reforçam o papel fundamental da inteligência artificial na análise e interpretação de dados de acidentes aéreos como estratégia para prevenir ocorrências futuras (Lopes et al., 2025). Ziakkas e Pechlivanis (2023) evidenciaram que modelos de aprendizado de máquina são capazes de realizar a classificação de relatórios de acidentes no contexto da aviação, desde que adequadamente treinados, e que a análise de fatores humanos com apoio da inteligência artificial pode criar novo conhecimento a partir de falhas anteriores. Gao e Mavris (2022) demonstraram que a integração de métodos estatísticos e de machine learning nas análises ambientais da aviação permitiu ganhos significativos em eficiência e precisão, enquanto Siow (2025) confirmou que modelos supervisionados como Random Forest e SVM mostram desempenho robusto na classificação de ocorrências de segurança aeronáutica, atingindo métricas de precisão elevadas.

A evolução tecnológica na investigação aeronáutica moderna também passa pelo uso de simulações computacionais, que representam um dos avanços mais relevantes para recriar cenários complexos e testar hipóteses investigativas sem os riscos do ambiente real (Scandiuzzi, 2025). Passarella et al. (2024) complementam essa perspectiva ao ressaltar que, com a capacidade de armazenar grandes volumes de dados, as caixas-pretas e os registros digitais tornaram-se recursos essenciais nas investigações contemporâneas. Adicionalmente, o uso de sistemas de aeronaves remotamente pilotadas tem sido considerado útil por investigadores para a coleta de dados visuais em locais de difícil acesso após acidentes (Santa Maria et al., 2021). A motivação para o desenvolvimento de ferramentas inteligentes fundamenta-se na necessidade de aprimorar a interpretação automatizada dos dados do CENIPA, identificando tendências e anomalias que possam indicar riscos operacionais latentes. A automatização dessa análise contribui diretamente para a redução da intervenção manual, a diminuição de erros interpretativos e o aumento da confiabilidade dos resultados, possibilitando respostas mais ágeis às mudanças nos indicadores de segurança. O objetivo central reside na criação de um agente de inteligência artificial capaz de analisar dados abertos, promovendo a transparência governamental e a geração de insights que subsidiem a prevenção de acidentes aeronáuticos por meio do processamento inteligente de informações estruturadas e não estruturadas.

A metodologia adotada para a construção da solução tecnológica baseou-se em uma abordagem aplicada de integração entre sistemas de automação de processos e análise de dados, com foco na implementação de fluxos de trabalho otimizados. Inicialmente, o desenvolvimento contemplou uma solução utilizando a biblioteca Streamlit para a criação de interfaces de dados interativas. No entanto, após uma avaliação criteriosa dos requisitos de implantação e da necessidade de facilitar a adoção da solução por usuários finais sem profundo conhecimento técnico, optou-se pela migração para uma arquitetura baseada na plataforma N8N. Essa mudança foi motivada pela maior facilidade de implantação e pela interface visual intuitiva que o N8N proporciona, permitindo a construção e modificação de workflows automatizados de forma mais acessível. A infraestrutura tecnológica final foi estruturada em um ambiente de nuvem, composta por três componentes principais: a plataforma de automação N8N, o sistema de gerenciamento de banco de dados Supabase e uma interface de visualização de dados integrada. O N8N foi configurado como a plataforma central de automação, permitindo a criação de fluxos de trabalho através de uma interface visual de nós interconectados, o que priorizou a simplicidade de manutenção e a capacidade de realizar modificações nos processos operacionais sem a necessidade de codificação manual extensiva.

Os dados utilizados na investigação foram coletados de portais governamentais e processados por meio de workflows automatizados configurados no N8N. O sistema foi estruturado para capturar informações de múltiplas fontes, processá-las através de nós de transformação e direcioná-las para o banco de dados Supabase, que utiliza a tecnologia PostgreSQL em nuvem. Essa transição do modelo inicial para o N8N permitiu maior flexibilidade na configuração dos processos, eliminando a necessidade de scripts manuais para cada etapa do pipeline de dados. O Supabase proporcionou capacidades robustas de armazenamento, consulta e sincronização em tempo real, com uma estrutura modelada para considerar as especificidades dos dados aeronáuticos, incluindo tabelas relacionais e índices otimizados para consultas frequentes. Previamente ao desenvolvimento do agente conversacional, conduziu-se uma análise exploratória detalhada para a caracterização da base de dados e a identificação de padrões preliminares. Essa análise incluiu a geração de estatísticas descritivas das variáveis principais, a identificação de valores ausentes e o tratamento de inconsistências nos registros. Foram elaboradas visualizações para a compreensão da distribuição temporal das ocorrências, a distribuição geográfica por unidades federativas e a classificação por tipo de ocorrência e modelo de aeronave. Para as análises gráficas e o tratamento estatístico inicial, utilizaram-se bibliotecas da linguagem Python, como Pandas, Matplotlib e Seaborn, garantindo a precisão na identificação de tendências históricas.

A arquitetura modular do agente conversacional inteligente foi desenhada para garantir a escalabilidade e a precisão das respostas. O fluxo inicia-se com a recepção de mensagens enviadas pelo usuário em um canal de chat, passando por uma etapa de pré-processamento onde a entrada é normalizada ou ajustada manualmente antes de ser submetida ao núcleo analítico. O agente de inteligência artificial atua como o coordenador central da aplicação, sendo responsável por interpretar a intenção do usuário e acionar as ferramentas adequadas. Para a interpretação de linguagem natural, o sistema utiliza modelos da OpenAI, especificamente o GPT-4, que processa a mensagem considerando o contexto da conversa armazenado em uma memória Redis (Redis Chat Memory). Essa memória é fundamental para manter o histórico do diálogo e promover a coerência nas interações subsequentes. Caso a solicitação do usuário exija dados específicos, o agente executa consultas em um banco de dados relacional utilizando comandos SQL gerados dinamicamente para buscar ou filtrar informações nas tabelas do CENIPA. Para perguntas mais complexas que envolvem contextos extensos ou documentos técnicos, o sistema utiliza uma base vetorial no Supabase (Vector Store), onde os dados são armazenados como embeddings. Esse processo de geração de embeddings transforma o conteúdo textual em vetores numéricos por meio da API da OpenAI, permitindo buscas semânticas eficientes que identificam as informações mais relevantes para responder ao usuário com base na similaridade vetorial.

A metodologia de testes foi aplicada em ambiente controlado, avaliando cada componente individualmente antes da integração completa. Os testes incluíram a verificação de conectividade entre os nós do workflow, a validação da integridade de dados durante o processo de vetorização e a análise da performance de processamento das consultas. A arquitetura multi-modal permitiu que o sistema combinasse a busca estruturada em bancos de dados SQL com o processamento de linguagem natural e a recuperação vetorial, proporcionando respostas precisas e contextualmente relevantes. A interface web desenvolvida para a interação conversacional demonstrou o funcionamento prático do sistema, permitindo que usuários realizassem consultas como a identificação das aeronaves com maior número de ocorrências ou os tipos de incidentes mais frequentes em determinados períodos. A validação da migração para o N8N confirmou a superioridade dessa abordagem em termos de facilidade de manutenção e redução de custos operacionais, uma vez que a infraestrutura anterior exigia manutenção contínua de código e servidores dedicados para hospedagem de aplicações Python complexas.

Os resultados obtidos demonstram a viabilidade técnica e operacional da implementação de um agente de inteligência artificial para a análise automatizada dos dados do CENIPA. A análise comparativa entre as abordagens tecnológicas evidenciou que a solução baseada em N8N superou o modelo original em múltiplos aspectos, especialmente no que tange à acessibilidade para usuários não especializados. Do ponto de vista econômico, a arquitetura final apresentou uma redução significativa nos custos, permitindo um deployment simplificado em ambiente de nuvem com gastos previsíveis. O agente demonstrou uma capacidade consistente de fornecer respostas coesas e apropriadas às consultas formuladas em linguagem natural, integrando-se perfeitamente ao sistema de descoberta automática de metadados. Durante os testes funcionais, o sistema apresentou eficácia na interpretação de consultas complexas, incluindo análises estatísticas agregadas e comparações temporais. Por exemplo, o sistema identificou que as cinco aeronaves com maior número de ocorrências na base de dados analisada foram o modelo 737-8EH com 103 registros, seguido pelo 737-4B6 com 77, o A320-214 com 73, o ERJ 190-200 IGW com 69 e o 737-4Y0 também com 69 ocorrências. Essa precisão na extração de dados quantitativos valida a eficácia dos fluxos de automação e das queries SQL geradas pelo agente.

A distribuição geográfica das ocorrências também foi mapeada com precisão, revelando que o estado de São Paulo concentra o maior volume de registros, seguido por Rio de Janeiro, Minas Gerais, Paraná e Rio Grande do Sul. Essa identificação de padrões geográficos alinha-se com os achados de Rasheed et al. (2024), que reforçam a capacidade de modelos de linguagem de larga escala em automatizar a extração de informações em grandes bases de dados. A funcionalidade de memória conversacional via Redis mostrou-se fundamental para a manutenção do contexto, permitindo que os usuários refinassem suas investigações de forma iterativa, aprofundando análises específicas através de perguntas de seguimento. O sistema demonstrou aptidão para formular situações analíticas complexas, correlacionando diferentes variáveis presentes no dataset e apresentando insights em linguagem acessível. Comparativamente aos resultados preliminares, onde o tempo médio de resposta era inferior a 15 segundos para consultas de complexidade moderada, o sistema manteve um desempenho similar para consultas simples, apresentando maior robustez na execução de workflows que exigiam a paralelização de processos e múltiplas operações no banco de dados.

Apesar dos avanços, foram identificadas limitações relacionadas ao tempo de resposta em consultas que demandam varredura completa de grandes volumes de dados ou análises estatísticas muito extensas. A latência adicional introduzida pela comunicação entre os múltiplos nós do workflow e a necessidade de descoberta de metadados em tempo real podem impactar a experiência do usuário em cenários que exijam respostas instantâneas. No entanto, a facilidade de implantação representa uma vantagem competitiva significativa, especialmente para organizações com recursos técnicos limitados, corroborando a visão de Zaoui et al. (2024) sobre a importância da inteligência artificial para a inovação no setor aeronáutico. Outro desafio identificado diz respeito ao fenômeno das alucinações em modelos de linguagem, que podem ocorrer devido a dados insuficientes ou limitações de conhecimento por data de corte (Belagatti, 2024). Para mitigar esse risco, o sistema foi configurado para restringir suas pesquisas ao escopo dos dados disponíveis, preservando a integridade das informações e promovendo maior confiabilidade nos resultados apresentados. A aplicação de processos contínuos de otimização nos prompts e na estrutura de recuperação de dados tem se mostrado eficaz para minimizar esses erros e oferecer respostas mais precisas e contextualizadas.

A análise crítica dos resultados confirma que a democratização do acesso aos dados aeronáuticos é possível através de interfaces conversacionais inteligentes. O sistema eliminou a necessidade de conhecimento prévio em linguagens de programação ou ferramentas estatísticas complexas, transformando o processo analítico em uma experiência intuitiva. Esse avanço alinha-se com os princípios de transparência governamental, maximizando o valor social das informações disponibilizadas pelo CENIPA. Os princípios de arquitetura validados possuem aplicabilidade direta em outros domínios governamentais que operam com dados abertos estruturados, como saúde pública e segurança rodoviária. A facilidade de acesso a insights analíticos pode contribuir para uma maior participação social em discussões sobre políticas de segurança, permitindo que diferentes atores utilizem evidências empíricas em suas contribuições. Como perspectiva futura, a implementação de uma engenharia de prompt mais sofisticada e a otimização contínua dos fluxos de dados poderão reduzir ainda mais as inconsistências e aumentar a precisão analítica, garantindo que a ferramenta permaneça robusta e confiável para o suporte à decisão no setor de aviação.

Conclui-se que o objetivo foi atingido, uma vez que o desenvolvimento do agente de inteligência artificial demonstrou eficácia na automação da análise de dados do CENIPA, reduzindo barreiras técnicas e promovendo a democratização do acesso a informações críticas de segurança aeronáutica. A arquitetura baseada em N8N e Supabase provou ser uma solução economicamente viável e tecnicamente robusta, capaz de processar consultas complexas em linguagem natural com tempos de resposta adequados e alta precisão na extração de dados quantitativos e geográficos. O sistema não apenas facilita a interpretação de padrões históricos, mas também estabelece um modelo metodológico replicável para outros domínios de dados abertos, contribuindo significativamente para a transparência governamental e para o fortalecimento da cultura de segurança operacional na aviação civil brasileira.

Referências Bibliográficas:

BELAGATTI, P. Alucinações LLM e estratégias de mitigação. Publicado em 29 abr. 2024. Disponível em: https://www-singlestore-com.translate.goog/blog/. Acesso em: 29 set. 2025.

GAO, Z.; MAVRIS, D. N. Statistics and machine learning in aviation environmental impact analysis: a survey of recent progress. Aerospace, v. 9, n. 12, p. 750, 2022. DOI: https://doi.org/10.3390/aerospace9120750.

LOPES, N. M. et al. Challenges and prospects of artificial intelligence in aviation: a bibliometric study. Data Science and Management, v. 8, p. 207-223, 2025. DOI: https://doi.org/10.1016/j.dsm.2024.11.001.

PASSARELLA, R. et al. Development of a machine learning model for predicting abnormalities of commercial airplanes. Data Science and Management, v. 7, p. 256-265, 2024. DOI: https://doi.org/10.1016/j.dsm.2024.03.002.

RASHEED, Z.; WASEEM, M.; AHMAD, A.; KEMELL, K.-K.; XIAOFENG, W.; NGUYEN DUC, A.; ABRAHAMSSON, P. Can large language models serve as data analysts? A multi-agent assisted approach for qualitative data analysis. arXiv, v. 1, 2 fev. 2024. Disponível em: https://arxiv.org/abs/2402.01386. Acesso em: 29 set. 2025.

SANTA MARIA, H. D. et al. Remotely Piloted Aircraft: Analysis of the Deployment in Aeronautical Accident Investigation Bureau. Journal of Aerospace Technology and Management, v. 13, e0121, 2021. DOI: https://doi.org/10.1590/jatm.v13.1187.

SCANDIUZZI, J. R. V. Investigação de acidentes aéreos: métodos modernos, simulações computacionais e comparação entre NTSB e CENIPA. BJDV, v. 11, n. 2, p.s.n, 2025.

SIOW, B. Y. A practical approach to using supervised machine learning models to classify aviation safety occurrences. arXiv preprint, arXiv:2504.09063, 2025. Disponível em: https://arxiv.org/abs/2504.09063. Acesso em: 29 set. 2025.

WOOLDRIDGE, Michael. An introduction to multiagent systems. 2. ed. Chichester: Wiley, 2009. 488 p. ISBN 978-0-470-51946-2.

ZAIKKAS, D.; PECHLIVANIS, K. Artificial intelligence applications in aviation accident classification: preliminary exploratory study. Decision Analytics Journal, v. 9, p. 100358, 2023. DOI: https://doi.org/10.1016/j.dajour.2023.100358.

ZAOUI, A. et al. Impact of artificial intelligence on aeronautics: an industry-wide review. Journal of Engineering and Technology Management, v. 71, p. 101800, 2024. DOI: https://doi.org/10.1016/j.jengtecman.2024.101800.

Resumo executivo oriundo de Trabalho de Conclusão de Curso da Especialização em Engenharia de Software do MBA USP/Esalq

Para saber mais sobre o curso, clique aqui e acesse a plataforma MBX Academy

Quem editou este artigo

Mais recentes

Você também pode gostar

Quer ficar por dentro das nossas últimas publicações? Inscreva-se em nossa newsletter!

Receba conteúdos e fique sempre atualizado sobre as novidades em gestão, liderança e carreira com a Revista E&S.

Ao preencher o formulário você está ciente de que podemos enviar comunicações e conteúdos da Revista E&S. Confira nossa Política de Privacidade