
12 de junho de 2026
Infraestrutura aérea e mercado de turismo internacional em solo brasileiro a partir de aprendizado de máquina
Aline Dos Santos Sousa; Erik Miguel de Elias
DOI: 10.22167/2675-6528-2026M09
Artigo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.
Resumo
O mercado de turismo internacional no Brasil permanece abaixo de seu potencial e ocupa posições inferiores em rankings globais, com a infraestrutura aérea identificada como fator crítico para essa lacuna. Diante desse cenário, objetivou-se identificar padrões e correlações entre variáveis da infraestrutura aérea e o volume de turismo internacional, empregando técnicas de aprendizado de máquina não supervisionado. A metodologia quantitativa e exploratória aplicou sequencialmente a Correlação de Pearson, a Análise de Componentes Principais (ACP) e a Análise de Cluster. Os resultados revelaram correlações positivas e estatisticamente significativas entre o fluxo de turistas e variáveis operacionais, como quantidade de voos, passageiros e capacidade de assentos. A ACP consolidou essas variáveis em dimensões latentes, nas quais a “capacidade operacional” mostrou-se altamente influente. A análise de clusters identificou três agrupamentos com concentração geográfica acentuada: um cluster principal com supremacia operacional, responsável por mais de 55% do fluxo turístico, e dois clusters com participação significativamente menor. Os achados sugerem que a concentração da infraestrutura aérea é um fator determinante para o crescimento e a distribuição do turismo internacional no país, recomendando-se políticas públicas para a descentralização e o desenvolvimento de novos hubs regionais.
Palavras-chave: Aprendizado de máquina; Capacidade operacional; Transporte; Turismo internacional.
1. Introdução
O Brasil, com suas vastas dimensões continentais e a riqueza de suas atrações turísticas, que abrangem desde eventos culturais vibrantes até paisagens naturais deslumbrantes, possui um potencial considerável para o turismo internacional. Contudo, o país ainda ocupa posições inferiores nos rankings globais de turismo, conforme apontado por Sarmento e Pereira (2024) e dados da Organização Mundial do Turismo (OMT).
Essa defasagem é evidenciada em números. Enquanto nações europeias como Espanha e França registraram 83 milhões e 89 milhões de visitantes, respectivamente, em 2018, e o México recebeu cerca de 44,3 milhões de turistas internacionais, o Brasil, em 2024, atraiu um total de 6,6 milhões de turistas estrangeiros. Embora esse número represente um crescimento de 12,6% em relação a 2023, segundo dados da Embratur (2025), o país permanece significativamente aquém de outros destinos turísticos globais em termos de fluxo de visitantes, conforme destacado pelo Jornal da Universidade de São Paulo (USP, 2023).
A complexidade do setor turístico e a busca por explicações para esse cenário de baixo desempenho têm sido objeto de amplo debate entre especialistas. Diversos fatores são identificados como contribuintes para o reduzido número de turistas internacionais no Brasil, incluindo a grande distância geográfica entre o país e os principais mercados emissores de turistas, bem como a barreira linguística, conforme ressaltado por Carvalho (2011).
Além desses aspectos, o turismo é um setor intrinsecamente dependente da integração de múltiplos sistemas que operam de forma interligada. Nesse contexto, a infraestrutura de transporte emerge como um elemento crucial para o desenvolvimento turístico, influenciando diretamente a experiência dos visitantes e a acessibilidade aos destinos brasileiros. A qualidade e a disponibilidade desses serviços são essenciais para o crescimento econômico e a competitividade do turismo, como enfatizado por Arruda et al. (2021).
No que concerne ao transporte terrestre, o Brasil enfrenta desafios significativos, marcados pela insuficiência de investimentos em rodovias e malhas ferroviárias. O relatório da Confederação Nacional do Transporte (CNT, 2024) indica que os recursos autorizados para investimentos no período de 2018 a 2023 foram 50,3% inferiores à média dos anos anteriores, evidenciando uma lacuna que impacta a mobilidade e o acesso aos destinos turísticos.
No âmbito do transporte aéreo, apesar do aumento no número de viagens e aeronaves registrado pela Agência Nacional de Aviação Civil (ANAC), o setor ainda apresenta um panorama preocupante em relação à qualidade e eficácia dos serviços. Muitos dos principais aeroportos brasileiros operam acima de sua capacidade, comprometendo a experiência dos passageiros e a competitividade do turismo nacional. A infraestrutura aérea regional, por sua vez, é limitada, resultando em uma oferta restrita de voos domésticos e dificultando a conectividade entre regiões, o que restringe a expansão do turismo para destinos menos explorados (Rodrigues et al., 2014).
A concentração de voos nas capitais, somada à escassez de infraestrutura aeroportuária adequada e à vasta extensão territorial do Brasil, acentua os desafios para o transporte e a distribuição de turistas internacionais. O setor aéreo ainda enfrenta barreiras como a alta judicialização e dificuldades para a entrada de novas empresas, mesmo diante de um crescimento expressivo da demanda, conforme o relatório geral de desenvolvimento da ANAC (2024).
Diante desse cenário, diversas iniciativas públicas e privadas foram implementadas para impulsionar o turismo, incluindo as Políticas Públicas de Turismo (PPTur) e os Planos Nacionais de Turismo (PNT), com o apoio do Ministério do Turismo (MTUR) e do Conselho Nacional de Turismo (CNTur). No entanto, os PNTs entre 2018 e 2022 não atenderam plenamente às demandas do setor, devido à limitada incorporação da pesquisa científica e à falta de alinhamento entre diagnóstico, metas e indicadores, o que dificultou a avaliação e o progresso efetivo (Reis e Santos, 2023).
A persistência dessas lacunas e a complexidade dos fatores envolvidos justificam a necessidade de uma análise aprofundada que utilize abordagens inovadoras para desvendar as relações entre a infraestrutura aérea e o fluxo turístico. Compreender esses padrões é fundamental para subsidiar políticas públicas mais eficazes e estratégias privadas que visem ao desenvolvimento e à descentralização do turismo internacional no Brasil. Assim, este estudo objetiva identificar padrões e correlações entre variáveis da infraestrutura aérea e o volume de turismo internacional em solo brasileiro a partir de técnicas de aprendizado de máquina não supervisionado.
2. Material e Métodos
O estudo adotou uma abordagem exploratória-quantitativa para investigar o fenômeno, buscando analisar objetivamente as relações entre variáveis e mensurar padrões e tendências (Creswell, 2010; Prodanov e Freitas, 2013). A metodologia incorporou, ainda, natureza descritiva e explicativa (Gil, 2017), aplicando técnicas de aprendizado de máquina não supervisionado para a detecção de padrões intrínsecos aos dados sem dependência de categorias pré-definidas (O’Reilly, 2018).
A coleta de dados utilizou informações públicas sobre o turismo e aeroportos em solo brasileiro, abrangendo o período de 2021 a 2024. Os dados foram obtidos nas bases abertas da Agência Nacional de Aviação Civil (ANAC) e do Ministério do Turismo (MTur). As variáveis selecionadas eram exclusivamente quantitativas, conforme a necessidade das técnicas estatísticas empregadas, que requerem dados numéricos contínuos para a validade das medidas de distância, variância e associação (Rencher, 2003).
A fase de tratamento dos dados envolveu etapas de limpeza, organização e transformação das informações coletadas para garantir a qualidade e a confiabilidade da base de dados (McKinney, 2023). Utilizou-se o software Anaconda e a linguagem Python, com as bibliotecas Pandas, Matplotlib, NumPy, Seaborn, Plotly, Scipy, Scikit-learn, Pingouin e Statsmodels para conduzir o tratamento e a análise dos dados.
Realizaram-se agregações para extrair variáveis relevantes, incluindo o cálculo do número de voos, passageiros, turistas por aeroporto e empresas aéreas. Extraiu-se a duração máxima, média e mínima dos voos por aeroporto e classificaram-se os tipos de aeroportos conforme a categorização da ANAC (RBAC n° 153, Emenda nº 4). Calculou-se, também, a distância, em quilômetros, entre os aeroportos de Guarulhos (SBGR), Brasília (SBBR) e Rio de Janeiro (SBGL) e os demais aeroportos do país.
Após os processos de agregação, aplicou-se a padronização z-score às variáveis, que se encontravam em escalas distintas, para que todas contribuíssem igualmente para as análises (Fávero e Belfiore, 2024). Essa transformação resultou em dados com média zero e desvio padrão unitário. Como etapa preliminar à análise, realizou-se uma análise exploratória dos dados para compreender a distribuição do número de turistas internacionais no Brasil.
As técnicas de aprendizado de máquina não supervisionado foram empregadas sequencialmente. Primeiramente, aplicou-se o coeficiente de correlação de Pearson para quantificar associações lineares diretas entre pares de variáveis, identificando relações entre aspectos da infraestrutura aeroportuária e o fluxo turístico (Fávero e Belfiore, 2024). A quantidade de turistas foi a variável de interesse, e as métricas de infraestrutura aeroportuária foram consideradas variáveis potencialmente explicativas.
Em seguida, utilizou-se a Análise de Componentes Principais (ACP) para extrair componentes que sintetizaram a infraestrutura aeroportuária brasileira em dimensões latentes, reduzindo a dimensionalidade dos dados (Jolliffe, 2002). Antes da aplicação, verificou-se a adequação dos dados por meio do teste de Esfericidade de Bartlett (Fávero e Belfiore, 2024). A ACP foi aplicada sobre a matriz de correlação, e a seleção dos componentes baseou-se nos critérios de Kaiser (autovalor > 1) e de variância acumulada (70-90%) (Jolliffe, 2002). As cargas fatoriais foram calculadas para a interpretação dos componentes (Rencher, 2003).
Por fim, aplicou-se a análise de cluster, especificamente o método não hierárquico K-means, para agrupar os estados brasileiros com infraestrutura aeroportuária semelhante (Rokach & Maimon, 2005). Os “scores” dos componentes principais, obtidos na etapa anterior da ACP, foram utilizados como dados de entrada para o algoritmo de clusterização (Ding e He, 2004). O número ideal de clusters (K) foi determinado pelo método do cotovelo (Fávero e Belfiore, 2024).
Após a definição de K, o algoritmo K-means organizou as observações em grupos por meio de um processo iterativo de atribuição e atualização de centróides, minimizando a soma dos quadrados intra-cluster (Pedregosa et al., 2011; Fávero e Belfiore, 2024). Para avaliar a qualidade global da segmentação, calculou-se o coeficiente de Silhueta. Adicionalmente, para validar estatisticamente as diferenças entre os grupos, empregou-se a análise de variância unidirecional (ANOVA), rejeitando-se a hipótese nula de igualdade de médias quando o p-value era inferior a 0,05 (Fávero e Belfiore, 2024).
3. Resultados e Discussão
A análise dos dados revelou uma distribuição assimétrica do turismo internacional entre os estados brasileiros no período de 2021 a 2024. Observou-se uma concentração acentuada de turistas em regiões específicas, com São Paulo respondendo por 55,33% do fluxo total, seguido pelo Rio de Janeiro com 29,53% e Santa Catarina com 4,82%. Essa predominância corrobora a literatura que destaca a importância da infraestrutura de transporte aéreo para o desenvolvimento econômico e turístico, conforme apontado por Oliveira (2009).
A concentração de turistas nesses estados coincide diretamente com a localização dos principais aeroportos internacionais do país, como Guarulhos em São Paulo e Galeão no Rio de Janeiro. Este padrão de distribuição permaneceu estável ao longo dos anos analisados, de 2021 a 2024, indicando a existência de polos turísticos consolidados. A presença de uma infraestrutura aeroportuária robusta, caracterizada por um maior volume de voos, é um fator determinante para essa concentração, atuando como um catalisador para o fluxo de visitantes. Resultados Coeficiente de Correlação de Pearson
A aplicação do coeficiente de correlação de Pearson permitiu quantificar as relações lineares entre as variáveis da infraestrutura aérea e o volume de turismo internacional. Verificou-se uma forte correlação positiva e estatisticamente significativa entre a quantidade de turistas e variáveis operacionais como o número de passageiros (0,93), a quantidade de voos (0,92) e a capacidade máxima de assentos (0,90). Esses resultados indicam que o fluxo turístico está diretamente associado à intensidade da movimentação aérea e à capacidade das aeronaves, sugerindo uma interdependência e um crescimento conjunto dessas variáveis, conforme Fávero e Belfiore (2024).
Adicionalmente, foram identificadas correlações positivas, embora de magnitude moderada a fraca, entre o número de companhias aéreas disponíveis (0,83) e a quantidade de aeroportos (0,36) em cada localidade. Esses achados reforçam a hipótese de que a conectividade aérea e o alcance geográfico, seja pela densidade da infraestrutura ou pela extensão das rotas, exercem uma influência positiva na dinâmica do turismo regional. A disponibilidade de opções de voo e a capilaridade da rede aeroportuária são, portanto, elementos que contribuem para a atratividade dos destinos.
Em contrapartida, observaram-se correlações negativas moderadas entre a quantidade de turistas e as variáveis de distância geográfica aos principais centros aeroportuários. A distância até Guarulhos apresentou uma correlação de -0,52, a distância até o Rio de Janeiro de -0,51 e a distância até Brasília de -0,34. Coeficientes negativos, segundo Fávero e Belfiore (2024), indicam uma relação inversa, sugerindo que quanto maior a distância de um destino aos grandes hubs aeroportuários, menor tende a ser o volume de turistas recebidos. A proximidade a esses centros estratégicos é, assim, um fator crítico para a atratividade turística.
A análise das correlações entre a classe dos aeroportos e a quantidade de turistas revelou padrões específicos. Uma forte relação positiva (0,84) foi observada para aeroportos de classe 4, que processam mais de 5.000.000 de passageiros, confirmando que os grandes polos aeroportuários estão fortemente associados a um maior fluxo turístico. Aeroportos de classe 2, com 200.000 a 999.999 passageiros, também mostraram uma correlação moderada (0,60) com o volume de turistas.
Em contraste, aeroportos de classe 1, com menos de 200.000 passageiros, apresentaram correlações fracas e negativas (-0,26), indicando que não são impulsionadores significativos do turismo em escala macro, estando mais associados a demandas locais. A correlação negativa fraca (-0,29) para aeroportos de classe 3, que atendem de 1.000.000 a 4.999.999 passageiros, foi um achado mais complexo e contraintuitivo, sugerindo que, mesmo em aeroportos importantes, outros fatores além do volume de passageiros devem ser considerados para uma análise mais aprofundada do turismo. Resultados da Análise de Componentes Principais (ACP)
A adequação da matriz de correlação para a Análise de Componentes Principais (ACP) foi confirmada pelo Teste de Esfericidade de Bartlett, que resultou em um valor estatisticamente significativo (χ² = 12.901,256; valor-p < 0,001). Este resultado permitiu rejeitar a hipótese nula, confirmando a presença de correlações suficientes para a aplicação da ACP, conforme Fávero e Belfiore (2024). A técnica permitiu sintetizar a infraestrutura aeroportuária brasileira em dimensões latentes associadas à expansão do turismo.
Foram retidos quatro componentes principais (CP1 a CP4), que, em conjunto, explicaram 79,61% da variância total dos dados, com base nos critérios de Kaiser (autovalor > 1) e de variância acumulada (70-90%), conforme Jolliffe (2002). A interpretação desses componentes foi realizada a partir da matriz de cargas fatoriais rotacionadas, que simplificou a estrutura e permitiu identificar os construtos subjacentes que melhor representam as variáveis originais.
O CP1 foi denominado “Proximidade dos hubs”, e seu eixo horizontal diferenciou os estados pela distância aos grandes centros aeroportuários. Estados como Acre, Roraima, Amapá e Amazonas apresentaram “scores” negativos, indicando maior afastamento, enquanto São Paulo, Rio de Janeiro, Minas Gerais e Distrito Federal exibiram “scores” positivos, refletindo maior proximidade. Isso sugere que a localização geográfica em relação aos principais aeroportos é um fator crucial para a dinâmica do turismo internacional.
O CP2 foi interpretado como “Capacidade Operacional”, evidenciando a intensidade das operações aéreas. São Paulo destacou-se com valores excepcionalmente elevados neste componente, confirmando sua predominância nacional em termos de volume de voos, passageiros e capacidade operacional. Este achado reforça a centralidade de São Paulo como o principal ponto de entrada e saída para turistas internacionais, dada a sua infraestrutura aérea robusta e capacidade de movimentação.
O CP3, denominado “Voos de longo curso”, demarcou operações de maior duração e distância. O Distrito Federal apresentou uma posição extrema no sentido positivo, indicando que sua infraestrutura aérea está singularmente associada a este tipo de operação. Em contraste, estados como Pará, Amazonas e Paraná aglomeraram-se na extremidade negativa, sugerindo uma característica oposta, possivelmente mais orientada a voos de curta duração, o que reflete diferentes perfis operacionais regionais.
Por fim, o CP4, rotulado como “Amplitude Operacional”, representou a variação na duração dos voos e o perfil dos aeroportos. O estado do Acre alcançou o “score” mais elevado, sugerindo um perfil operacional específico com grande variação nos tempos de voo. Essa dispersão dos estados no plano formado pelos componentes principais revelou dinâmicas operacionais distintas e a complexidade da infraestrutura aérea brasileira.
A relação entre as cargas fatoriais e o volume de turistas foi investigada, contrastando estados de alto e baixo influxo turístico. Os estados com maior volume turístico, como Bahia, São Paulo, Rio de Janeiro e Santa Catarina, concentraram-se predominantemente nos quadrantes superiores direitos, com “scores” positivos em CP1 e CP2. Em contrapartida, estados com menor volume, como Acre, Amapá e Roraima, aglomeraram-se nos quadrantes inferiores esquerdos, com “scores” negativos. Essa segregação espacial marcante evidencia a disparidade operacional e de conectividade, corroborando a perspectiva de Page (2005) de que o transporte aéreo atua como gerador de fluxos turísticos.
As altas cargas fatoriais no CP2, que representa a capacidade operacional, indicaram que a oferta de voos, assentos e conectividade precede e catalisa o fluxo turístico, impulsionando um ciclo de desenvolvimento. A posição periférica de estados como Acre, Amapá e Roraima, por sua vez, evidencia o efeito inibidor da ausência desses fatores geradores. A proximidade a hubs aeroportuários e a intensidade operacional configuram-se, portanto, como condições necessárias para a consolidação da demanda e atração de turistas, alinhando-se à teoria de Kasarda (2000) sobre aeroportos como núcleos catalisadores do desenvolvimento. Resultados da Clusterização
Para determinar a quantidade ideal de agrupamentos (“clusters”) a partir dos quatro componentes principais, utilizou-se o método do cotovelo. Essa técnica, aplicada em conjunto com o algoritmo K-Means, analisou o comportamento da curva da soma dos quadrados das distâncias intra-cluster em função do número de clusters, permitindo identificar visualmente o ponto de inflexão que indica o número ideal de agrupamentos. A análise sugeriu a formação de três clusters como a configuração que melhor equilibra a homogeneidade interna dos grupos.
O algoritmo K-Means foi executado com k=3, e a distribuição dos estados em cada agrupamento revelou perfis distintos. O “cluster” 0, composto exclusivamente por São Paulo, destacou-se por valores excepcionalmente elevados nos CPs 1 (7,539) e 2 (4,308). Isso confirma São Paulo como o epicentro do sistema aeroportuário nacional, com máxima proximidade aos hubs e capacidade operacional predominante. O estado também apresentou um “score” negativo no CP3 (-0,876), indicando uma orientação para operações de curta e média distância, em oposição a voos de longo curso.
O “cluster” 0, representando São Paulo, caracterizou-se por uma elevada magnitude operacional, com volumes muito altos de passageiros (desvio padrão de +3,67), voos (+3,63) e aeronaves de grande porte (assentos_max: +3,40). Este cluster também apresentou uma forte concentração de aeroportos de classe 4 (desvio padrão de +2,74), que são os de maior volume no país, e uma alta diversidade de companhias aéreas (desvio padrão de +2,53). Esses dados reforçam a posição de São Paulo como o principal hub de turismo internacional no Brasil.
O “cluster” 1, que incluiu Rio de Janeiro, Minas Gerais, Paraná, Bahia, Santa Catarina, Mato Grosso do Sul e Pará, apresentou um perfil intermediário. Este grupo obteve um “score” positivo no CP1 (1,650), indicando boa conectividade aos hubs, mas um “score” negativo no CP2 (-1,402), sugerindo capacidade operacional moderada. O grupo manteve-se próximo da média nos CPs 3 e 4, denotando uma operação balanceada sem especializações extremas em voos de longo curso ou amplitude operacional.
Os estados do “cluster” 1 caracterizaram-se pela proximidade geográfica aos principais hubs, com distâncias mínimas reduzidas para Guarulhos (desvio padrão de -0,71) e Rio de Janeiro (desvio padrão de -0,69). Também se destacou pela maior quantidade de aeroportos de classe 3 (desvio padrão de +0,72) e por apresentar distâncias médias moderadas para o Rio de Janeiro (desvio padrão de +0,64). Esses resultados indicam que, embora esses estados tenham boa conectividade, sua capacidade operacional é mais limitada em comparação com o cluster principal.
O “cluster” 2, composto por Acre, Amapá, Roraima, Amazonas, Rio Grande do Norte, Pernambuco, Distrito Federal e Ceará, caracterizou-se pelo menor “score” no CP1 (-2,386), indicando maior distância dos grandes hubs. Este grupo apresentou um perfil operacional distinto, com o maior “score” positivo no CP3 (0,516), sugerindo relativa especialização em operações de longo curso, possivelmente reflexo de conexões interestaduais ou internacionais específicas. As maiores distâncias mínimas até Guarulhos (desvio padrão de +0,79) e Rio de Janeiro (desvio padrão de +0,76) foram características marcantes.
Os resultados da clusterização corroboram a existência de uma hierarquia operacional no sistema aeroportuário brasileiro, que se reflete diretamente no potencial turístico dos estados. A análise identificou três padrões distintos: um cluster âncora (Cluster 0 SP), caracterizado por sua função de hub primário e capacidade operacional dominante; um cluster integrado (Cluster 1), com conectividade intermediária; e um cluster especializado (Cluster 2), com perfil operacional distinto e maior distância dos principais centros aeroportuários primários. Essa estratificação quantifica empiricamente a premissa teórica de que a conectividade aérea é um fator estruturador da dinâmica turística, posicionando os hubs aeroportuários como propulsores centrais da atividade econômica e turística (Page, 2005; Graham, 2018), e os demais destinos em uma rede hierárquica dependente dessa conectividade (Prideaux, 2000).
A qualidade global da segmentação foi avaliada pelo coeficiente de Silhueta, que obteve um valor de 0,307. De acordo com Fávero e Belfiore (2024), este valor se enquadra na faixa que indica uma estrutura de agrupamento fraca, porém válida (0,26 a 0,50). Isso sugere que, embora os clusters sejam discerníveis, há uma sobreposição moderada entre eles e fronteiras pouco densas, indicando que a distinção entre os grupos não é totalmente nítida, mas ainda assim significativa para a análise.
Para validar estatisticamente as diferenças entre os grupos, aplicou-se uma análise de variância unidirecional (ANOVA) para cada variável original. Os resultados confirmaram que a segmentação em clusters capturou diferenças significativas entre os grupos para a maioria das variáveis analisadas. Variáveis operacionais como quantidade de passageiros (F=70,46; p<0,001), quantidade de voos (F=60,23; p<0,001) e assentos máximos (F=24,46; p<0,001) apresentaram diferenças altamente significativas entre as médias dos clusters, validando seu papel como fatores determinantes e críticos da segmentação.
As métricas de distância em relação aos principais centros aeroportuários do país, como Guarulhos e Rio de Janeiro, também exibiram associações significativas com a formação dos grupos. Para a estrutura aeroportuária em Guarulhos, as distâncias mínima e máxima foram muito significativas (p<0,01). Para o Rio de Janeiro, todas as métricas de distância (média, mínima e máxima) também se mostraram significativas (p<0,05). Por outro lado, variáveis relacionadas à capacidade de assentos mínima e à duração dos voos (voos_min_hora, voos_max_hora, voo_total_hora) não apresentaram diferenças estatisticamente significativas (p>0,05) entre os clusters, indicando que essas características não são fatores discriminantes para a segmentação obtida.
Em síntese, os resultados desta pesquisa demonstram que a infraestrutura aérea desempenha um papel crucial no desenvolvimento e na distribuição do turismo internacional no Brasil. A concentração de voos, passageiros e capacidade de assentos em poucos hubs aeroportuários, como São Paulo, é um fator determinante para o volume de turistas. A análise de clusters revelou uma hierarquia operacional clara, com estados de maior proximidade e capacidade operacional atraindo significativamente mais visitantes, enquanto regiões mais distantes e com infraestrutura limitada enfrentam desafios na atração turística. Essa dinâmica sublinha a necessidade de políticas que visem à descentralização e ao desenvolvimento de novos hubs regionais para otimizar o potencial turístico do país.
4. Conclusão
Este estudo objetivou identificar padrões e correlações entre variáveis da infraestrutura aérea e o volume de turismo internacional no Brasil, empregando técnicas de aprendizado de máquina não supervisionado. Verificou-se uma forte correlação positiva entre o fluxo de turistas e a capacidade operacional da infraestrutura aérea, como o número de voos, passageiros e assentos máximos. Em contrapartida, observou-se uma correlação negativa entre o volume de turistas e a distância dos principais hubs aeroportuários, evidenciando a importância da proximidade a esses centros. A Análise de Componentes Principais consolidou essas variáveis em dimensões latentes, nas quais a “Capacidade Operacional” e a “Proximidade dos hubs” mostraram-se determinantes para a dinâmica do turismo. A análise de clusters, por sua vez, revelou a existência de três agrupamentos distintos de estados, com São Paulo destacando-se como um cluster âncora de supremacia operacional, responsável por mais de 55% do fluxo turístico internacional. Os demais clusters apresentaram perfis intermediários ou especializados, com menor participação no volume de turistas e maior distância dos grandes hubs.
A principal contribuição deste estudo reside na quantificação empírica da relação entre a infraestrutura aérea e o turismo internacional, evidenciando que a concentração operacional em poucos hubs é um fator estruturador da distribuição de visitantes no país. Os resultados reforçam a necessidade de um planejamento estratégico que aborde a disparidade regional, sugerindo que o desenvolvimento do turismo internacional está intrinsecamente ligado à descentralização do transporte aéreo e à criação de novos hubs regionais. Contudo, reconhece-se que a análise se limitou a dados estaduais e variáveis de infraestrutura, não incorporando informações municipais, métricas de deslocamento detalhadas ou dados específicos de voos internacionais, o que poderia refinar a compreensão do fenômeno. Para estudos futuros, recomenda-se a exploração de outros modelos de aprendizado de máquina e a inclusão de bases de dados municipais e de rotas aéreas internacionais. Adicionalmente, sugere-se a priorização de incentivos para a diversificação de voos em aeroportos regionais e uma integração mais efetiva entre o planejamento da infraestrutura aérea e as campanhas de promoção turística, alinhando a oferta às rotas de conectividade existentes.
Referências Bibliográficas
CARVALHO, Mariana Aldrigui. 2011. Turismo e relações internacionais: uma abordagem exploratória sobre o papel do turismo na construção da imagem internacional do Brasil.
EMBRATUR. 2025. O Brasil encerra 2024 com recorde de 6,65 milhões de turistas estrangeiros, alta de 12,6%. Revista Notícias, 15(3): 10-15. Disponível em: https://embratur.com.br/2025/01/07/brasil-encerra-2024-com-recorde-de-665-milhoes-de-turistas-estrangeiros-alta-de-126/. Acesso em: 28 mar. 2025.
Sarmento, R.R.S.; Pereira, H.C.L. 2024. Determinantes do Fluxo Internacional de Turistas para o Brasil: evidências empíricas para o período 1989-2018. Revista de Turismo Contemporâneo, 12(3): 427-449.
Universidade de São Paulo [USP]. 2023. Problemas estruturais afastam turistas do Brasil. Jornal da USP. Disponível em: https://jornal.usp.br/?p=642335. Acesso em: 25 fev. 2025.
Artigo oriundo de Trabalho de Conclusão de Curso de Especialização em Data Science e Analytics do MBA USP/Esalq
Saiba mais sobre o curso; clique aqui:





























