Resumo Executivo

29 de abril de 2026

API para Classificação de Relevo Ferroviário via Inteligência Artificial

Ítalo Siqueira Gonçalves; Ariel Da Silva Dias

Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.

A malha ferroviária brasileira constitui um elemento vital para a logística e o desenvolvimento econômico nacional, sendo fundamental para o transporte de commodities e insumos de alto valor agregado. A caracterização técnica precisa desses corredores de transporte é uma premissa para um planejamento eficiente, uma manutenção adequada e investimentos estratégicos de longo prazo. Nesse contexto, a variável topográfica, ou o relevo, surge como um fator de extrema relevância, uma vez que influencia diretamente os custos de construção, as velocidades operacionais permitidas, o consumo de energia das locomotivas e a segurança das operações ferroviárias. Tais critérios já se encontram consolidados para o modo rodoviário, conforme estabelecido no Manual de Projeto Geométrico de Rodovias Rurais (DNER, 1999). Enquanto o Departamento Nacional de Infraestrutura de Transportes dispõe de metodologias consolidadas para a classificação de relevo no modo rodoviário, nota-se uma lacuna de padronização para o modo ferroviário, o que dificulta análises comparativas e uma visão sistêmica da infraestrutura nacional de transportes.

A gestão eficiente da infraestrutura requer a caracterização técnica minuciosa dos trechos, sendo o relevo um fator crítico para o planejamento e a manutenção. A integração de técnicas de Geoprocessamento e Inteligência Artificial permite compatibilizar a análise ferroviária com a metodologia já empregada pelo órgão regulador para o modo rodoviário. O desenvolvimento de um sistema de consulta automatizada que, a partir de coordenadas geográficas, retorne a classificação de relevo do trecho ferroviário mais próximo, representa um avanço na digitalização de ativos infraestruturais. O método baseia-se na extração de dados de pixels de relevo georreferenciados ao longo dos eixos ferroviários, utilizando-se de ferramentas de processamento espacial para a análise inicial. Para a categorização do relevo, o emprego do algoritmo de agrupamento não supervisionado permite identificar padrões intrínsecos nos dados sem a necessidade de exemplos prévios (Han, Kamber & Pei, 2012). A escolha por uma abordagem não supervisionada justifica-se pela natureza exploratória da análise, que busca identificar agrupamentos naturais nos perfis de relevo.

A aplicação de algoritmos de aprendizado de máquina, especificamente voltados para a clusterização, possibilita agrupar os perfis de relevo em categorias distintas, simplificando a análise e refletindo a prática comum de categorização em faixas, como plano, ondulado e montanhoso (MacQueen, 1967). A classificação final de cada trecho ferroviário é definida pela predominância da extensão de um determinado agrupamento ao longo do seu comprimento total. Para operacionalizar e democratizar o acesso a essas informações, a implementação de uma interface de programação de aplicações torna-se essencial, permitindo que usuários finais e outros sistemas recuperem informações geoespaciais de forma ágil. A arquitetura de tal interface deve ser projetada para receber coordenadas de latitude e longitude e, por meio de cálculos de proximidade, retornar os dados técnicos do trecho ferroviário correspondente.

A qualidade da classificação está diretamente vinculada à resolução e acurácia dos dados de relevo utilizados, como os modelos digitais de elevação. A definição do número de agrupamentos, embora alinhada com a prática normativa, busca capturar a complexidade da paisagem brasileira. O foco na predominância por extensão é uma escolha metodológica que visa a simplificação necessária para o planejamento macroscópico, embora possa omitir trechos críticos pontuais de relevo acidentado em extensões reduzidas. A sistematização dessas informações oferece uma base sólida para futuros refinamentos e aplicações em engenharia de transportes, permitindo uma integração mais fluida entre diferentes bases de dados governamentais.

Para a realização da análise, utilizaram-se dados primários de fontes oficiais, garantindo a fidedignidade dos resultados. A malha ferroviária georreferenciada foi obtida junto ao Ministério dos Transportes, refletindo a situação das ferrovias em operação e em planejamento no ano de 2025. Paralelamente, os pixels de classificação do relevo foram adquiridos do Serviço Geológico do Brasil, datados originalmente de 2010, mas que permanecem como referência nacional para a declividade do terreno (SGB, 2010). O processamento espacial foi realizado por meio de técnicas de geoprocessamento no software Quantum GIS, permitindo a interseção exata entre o traçado vetorial da malha ferroviária e a matriz de pixels de relevo (QGIS, 2023).

O procedimento operacional consistiu na extração da extensão de cada tipo de relevo associado a cada pixel do traçado ferroviário. Esses dados foram organizados em estruturas tabulares onde cada registro representa um trecho ferroviário único, identificado por um código de identificação, sua extensão total e a metragem correspondente a cada uma das seis classes de relevo originais da base de dados do Serviço Geológico do Brasil. A preparação dos dados para o algoritmo de aprendizado de máquina exigiu a conversão dos valores absolutos de extensão em proporções relativas à extensão total de cada trecho. Essa normalização é um passo crítico, pois permite que a análise se concentre na composição percentual do relevo, assegurando a comparabilidade entre trechos curtos e longos, independentemente de seus comprimentos totais (McKinney, 2017).

Após a normalização, aplicou-se a padronização das variáveis para que todas tivessem média zero e desvio padrão igual a 1. Esse procedimento garante que todas as classes de relevo tenham igual importância no cálculo das distâncias euclidianas realizado pelo algoritmo de agrupamento, evitando que variáveis com maiores magnitudes numéricas distorçam os resultados. O modelo de clusterização foi configurado para identificar três grupos distintos, utilizando uma semente aleatória fixa para garantir a reprodutibilidade dos experimentos. A análise da adequação do número de grupos foi realizada por meio do método do cotovelo, que avalia a inércia ou a soma das distâncias quadradas intra-cluster, e pelo coeficiente de silhueta, que mede a coesão e a separação dos agrupamentos formados.

Os rótulos de agrupamento atribuídos a cada trecho foram incorporados ao conjunto de dados original, permitindo a interpretação qualitativa de cada grupo. Para compreender as características de cada categoria, gerou-se uma tabela de centróides representando o perfil médio de proporções de relevo por cluster. Os resultados finais foram exportados para formatos compatíveis com sistemas de informação, organizando as proporções dos tipos de relevo em relação à extensão total e a identificação do cluster correspondente. Essa estrutura de dados serviu como base para a alimentação da interface de programação de aplicações desenvolvida em linguagem Python.

A implementação da interface utilizou o framework FastAPI, escolhido por sua alta performance e facilidade de criação de endpoints baseados em padrões abertos. A arquitetura foi planejada para garantir escalabilidade e baixo tempo de resposta, tornando o sistema adequado para uso em larga escala. O funcionamento da interface baseia-se na entrada de coordenadas geográficas que servem como ponto de referência para a consulta. O sistema carrega a base de dados processada e, para cada requisição, realiza o cálculo da distância entre o ponto fornecido pelo usuário e a localização média de cada trecho ferroviário cadastrado. Para esse cálculo, empregou-se a fórmula de Haversine, que considera a curvatura da Terra para determinar a distância entre dois pontos em uma esfera a partir de suas latitudes e longitudes.

A estrutura da aplicação foi configurada com metadados essenciais e modelos de dados definidos para validação e serialização automática. Implementou-se um sistema de armazenamento em memória para otimizar a recuperação dos registros, simulando a eficiência de um banco de dados de alto desempenho. Foram desenvolvidos endpoints funcionais para informações básicas, monitoramento de saúde do sistema e operações de gerenciamento de registros. Um ponto técnico relevante na implementação foi a necessidade de conversão de tipos de dados específicos de bibliotecas de análise de dados para tipos nativos da linguagem de programação, garantindo a compatibilidade com o formato de intercâmbio de dados JSON.

A validação da interface envolveu a criação de cenários de teste para busca por identificadores existentes, tratamento de registros inexistentes e consultas por coordenadas. Integrou-se também um middleware de registro para documentar todas as requisições de forma detalhada, facilitando a auditoria e o monitoramento do sistema em tempo real. Com o servidor em execução, tornou-se possível acessar os dados classificados diretamente pela interface web, utilizando coordenadas geográficas como entrada, o que cumpre o objetivo de disponibilizar informações estratégicas de forma prática e precisa.

Os resultados do geoprocessamento e da compatibilização para a classificação de trechos resultaram em um conjunto de dados contendo 4427 registros. Cada registro foi enriquecido com a classificação do agrupamento correspondente, permitindo uma análise espacial detalhada da malha ferroviária. No que diz respeito à configuração do algoritmo de aprendizado de máquina, a determinação do número ideal de grupos foi validada pela convergência de múltiplos métodos métricos. O método do cotovelo apresentou uma curva de inércia com diminuição acentuada até o ponto correspondente a três grupos, seguida por uma suavização progressiva do declínio. Esse padrão indica que o ganho de variância explicada deixa de ser significativo com o aumento adicional de clusters, validando a escolha paramétrica.

Complementarmente, a análise do coeficiente de silhueta revelou que a configuração com três grupos atinge um score máximo de aproximadamente 0,42. Valores de silhueta superiores a 0,4 são considerados satisfatórios em estudos exploratórios, demonstrando que os agrupamentos possuem boa separação e coerência interna. Para valores inferiores ou superiores a três, observou-se uma redução no coeficiente, confirmando que essa configuração representa o equilíbrio ideal entre a compactação dentro de cada grupo e a separação entre grupos distintos. Esses resultados validam a robustez da classificação, garantindo tanto a eficiência computacional quanto a qualidade analítica do agrupamento realizado.

Com base na classificação final, os três grupos identificados foram caracterizados de forma adaptada em relação à classificação de relevo original. O resultado revelou 2851 ocorrências em áreas predominantemente planas, 1566 em áreas onduladas e apenas 10 em regiões classificadas como montanhosas. Essa distribuição indica uma clara predominância de trechos ferroviários em terrenos planos, representando aproximadamente 64% do total da malha analisada. Os trechos em relevo ondulado correspondem a cerca de 35%, enquanto os trechos montanhosos representam menos de 1% da extensão total. Essa configuração demonstra que a infraestrutura ferroviária existente no país privilegia áreas de relevo mais suave, evitando grandes variações altimétricas.

A adaptação da classificação ao contexto ferroviário demonstra que a engenharia de transportes historicamente busca minimizar a penetração em regiões montanhosas devido aos elevados custos de implantação e às limitações técnicas das composições ferroviárias em vencer rampas acentuadas. A presença mínima do grupo montanhoso sugere que esses trechos correspondem a intervenções especiais, como túneis e grandes viadutos em serras, ou a classificações residuais que demandam análises complementares para confirmar sua consistência com as condições reais de campo. A predominância de áreas planas e onduladas é coerente com a lógica de maximização da eficiência energética e da capacidade de carga das ferrovias brasileiras.

Em sequência, os testes de desempenho da interface de programação demonstraram alta confiabilidade e segurança. Em avaliações de carga com 100 requisições simultâneas, o sistema apresentou uma taxa de sucesso de 100%, com um tempo total de execução de 0,56 segundos para o lote completo. A distribuição dos tempos de resposta mostrou que 59% das requisições foram processadas em até 70 ms, com um tempo médio global de 68 ms. Esses resultados indicam uma excelente responsividade, sendo que 90% das consultas foram concluídas em menos de 107 ms, o que é fundamental para sistemas que exigem interação em tempo real ou integração com outras ferramentas de suporte à decisão.

Testes unitários validaram as funções críticas de normalização de colunas, conversão de coordenadas e cálculo de distâncias, apresentando resultados positivos em todas as avaliações. Isso demonstra que o sistema atende rigorosamente às regras de negócio propostas e contribui para a integridade dos dados disponibilizados. Testes de emulação confirmaram a correta execução dos endpoints principais, validando cenários de busca por identificadores válidos e inválidos. Da mesma forma, testes de integração demonstraram que a interface interage corretamente com seus componentes internos, mantendo tempos de processamento estáveis e previsíveis.

A validação dos modelos de dados confirmou a consistência e a integridade das informações, com mecanismos robustos para detectar inconsistências e impedir o uso de dados incorretos por parte dos usuários. Testes de tratamento de erros evidenciaram que a aplicação lida adequadamente com entradas inválidas ou ausentes, retornando códigos de status apropriados e mensagens informativas. Sob múltiplas requisições consecutivas, o sistema manteve a estabilidade, confirmando sua capacidade de suportar alta frequência de acessos sem degradação da performance. Adicionalmente, testes de segurança validaram a proteção contra ataques comuns, como injeção de código e tentativas de acesso a arquivos sensíveis do sistema, com aprovação em todos os cenários testados (Golmohammadi, Zhang & Arcuri, 2023).

A implementação do algoritmo de clusterização para classificação de trechos, combinada com a arquitetura moderna da interface de consulta, mostrou-se eficiente tanto no processamento quanto na disponibilização dos resultados. Os dados gerados indicam que o sistema é capaz de lidar com diferentes cenários de uso, mantendo performance adequada e garantindo a segurança das informações estratégicas. Caso sejam alterados pontos específicos dos algoritmos, como a estratégia de normalização ou o método de cálculo de distâncias, poderia ser observado um impacto direto na precisão dos resultados, o que reforça a importância da calibração realizada. As principais vantagens da solução incluem a robustez no tratamento de erros e a agilidade no acesso a dados que antes exigiam processamento manual complexo.

Como limitação, aponta-se a escalabilidade em cenários de volumes massivos de dados devido ao uso de armazenamento em memória, embora os testes atuais não tenham indicado problemas significativos para a dimensão da malha ferroviária nacional. A utilização do ponto médio de cada trecho para o cálculo de proximidade mostrou-se uma abordagem prática e eficaz para a escala macroscópica de planejamento, embora a consideração de múltiplos pontos por segmento pudesse aumentar a precisão em trechos sinuosos ou muito extensos. A metodologia proposta estabelece um fluxo de trabalho reprodutível que integra geoprocessamento e ciência de dados para a gestão de infraestrutura.

A discussão dos resultados revela que a integração de ferramentas de inteligência artificial na análise de infraestrutura de transportes permite uma visão mais granular e padronizada dos ativos nacionais. A compatibilização com as normas de relevo do modo rodoviário facilita o planejamento intermodal, permitindo que gestores comparem custos e viabilidade de diferentes modais em uma mesma região geográfica. A disponibilidade desses dados via interface programável reduz barreiras de acesso e fomenta o desenvolvimento de novas ferramentas de análise espacial e logística. O reconhecimento das limitações dos modelos digitais de elevação e da simplificação inerente à clusterização é fundamental para a interpretação correta dos dados por engenheiros e planejadores.

Conclui-se que o objetivo foi atingido por meio do desenvolvimento de uma metodologia sistemática que integrou geoprocessamento e aprendizado de máquina para a classificação automatizada de trechos ferroviários com base no relevo. A aplicação do algoritmo de agrupamento permitiu a identificação de padrões topográficos consistentes em toda a malha nacional, enquanto a interface de programação de aplicações desenvolvida demonstrou ser uma ferramenta robusta, segura e de alta performance para a disponibilização dessas informações estratégicas. A predominância de trechos em relevo plano e ondulado reflete as diretrizes históricas da engenharia ferroviária no país, e a solução tecnológica proposta oferece um suporte ágil para a tomada de decisão, planejamento de manutenção e estudos de viabilidade de novos investimentos no setor de transportes.

Referências Bibliográficas:

BRASIL. Departamento Nacional de Infraestrutura de Transportes – DNIT. Manual de projeto geométrico de rodovias rurais. Rio de Janeiro: DNIT, 1999. Disponível em: https://www.gov.br/dnit/pt-br/assuntos/planejamento-e-pesquisa/ipr/coletanea-de-manuais/vigentes/706_manual_de_projeto_geometrico.pdf. Acesso em: 22 set. 2025.

GOLMOHAMMADI, Amid; ZHANG, Man; ARCURI, Andrea. Testing RESTful APIs: A Survey. ACM Transactions on Software Engineering and Methodology, v. 33, n. 1, art. 27, 2023. DOI: https://doi.org/10.1145/3617175. Disponível em: https://doi.org/10.1145/3617175. Acesso em: 30 set. 2025.

HAN, Jiawei; KAMBER, Micheline; PEI, Jian. Data mining: concepts and techniques. 3. ed. Waltham: Morgan Kaufmann, 2012.

MACQUEEN, J. B. Some methods for classification and analysis of multivariate observations. In: CAM, Lucien M.; NEYMAN, Jerzy (Ed.). Proceedings of the Fifth Berkeley Symposium on Mathematical Statistics and Probability. Volume 1: Statistics. Berkeley: University of California Press, 1967. p. 281–297. Disponível em: https://projecteuclid.org/euclid.bsmsp/1200512992. Acesso em: 30 set. 2025.

MCKINNEY, Wes. Python for data analysis: data wrangling with pandas, NumPy, and IPython. 2. ed. Sebastopol: O’Reilly Media, 2017. Disponível em: https://www.oreilly.com/library/view/python-for-data/9781491957653/. Acesso em: 30 set. 2025.

QGIS Project. QGIS user guide release 3.22. QGIS, 2023. Disponível em: https://docs.qgis.org/3.22/pdf/pt_BR/QGIS-3.22-DesktopUserGuide-pt_BR.pdf. Acesso em: 13 mai. 2025.

SERVIÇO GEOLÓGICO DO BRASIL. Mapa de Declividade em Percentual do Relevo Brasileiro. SGB, 2010. Disponível em: https://www.sgb.gov.br/mapa-de-declividade-em-percentual-do-relevo-brasileiro. Acesso em: 03 fev. 2025.


Resumo executivo oriundo de Trabalho de Conclusão de Curso da Especialização em Engenharia de Software do MBA USP/Esalq

Para saber mais sobre o curso, clique aqui e acesse a plataforma MBX Academy

Quem editou este artigo

Mais recentes

Você também pode gostar

Quer ficar por dentro das nossas últimas publicações? Inscreva-se em nossa newsletter!

Receba conteúdos e fique sempre atualizado sobre as novidades em gestão, liderança e carreira com a Revista E&S.

Ao preencher o formulário você está ciente de que podemos enviar comunicações e conteúdos da Revista E&S. Confira nossa Política de Privacidade