13 de abril de 2026
Bitcoin e Macroeconomia: Modelo Híbrido SARIMAX-XGBoost
Raphael Hetmanek Peixoto de Souza; Daniel Alvarez Firmino
Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.
O Bitcoin consolidou-se como um dos ativos financeiros mais discutidos e analisados da última década, destacando-se não apenas pela inovação tecnológica que representa, mas principalmente pela volatilidade acentuada que o diferencia drasticamente de ativos tradicionais. Desde sua gênese, em 2008, a criptomoeda percorreu ciclos intensos de valorização e correção, o que fomenta debates contínuos sobre sua viabilidade como reserva de valor ou ativo de longo prazo (Yermack, 2013; Baur et al., 2018). Esse comportamento oscilatório não ocorre de forma isolada, sendo influenciado tanto por dinâmicas intrínsecas ao ecossistema de criptoativos quanto por variáveis macroeconômicas globais de grande escala, como taxas de juros, liquidez monetária e índices inflacionários. Compreender e prever tais movimentos constitui um desafio técnico e acadêmico de elevada complexidade, exigindo ferramentas que transcendam a análise linear simples.
A relevância da taxa básica de juros dos Estados Unidos para o preço do Bitcoin reside na sua capacidade de moldar o apetite por risco global. Quando os juros estão elevados, o retorno de ativos considerados livres de risco aumenta, o que tende a reduzir a atratividade de ativos voláteis, exercendo pressão negativa sobre as cotações das criptomoedas. Inversamente, períodos de cortes nas taxas costumam favorecer fluxos de capital em direção ao risco. Paralelamente, a expansão da base monetária, representada pelo indicador M2, amplia a disponibilidade de capital no sistema financeiro. Historicamente, o aumento da liquidez está correlacionado à maior demanda por ativos escassos, sustentando os preços do Bitcoin em momentos de expansão econômica. A inflação, por sua vez, atua de forma ambígua: pode elevar o custo do capital, prejudicando investimentos, ou fortalecer a tese do Bitcoin como uma proteção contra a desvalorização das moedas fiduciárias. Por fim, a utilização da capacidade produtiva serve como um termômetro do ciclo econômico, onde níveis elevados sinalizam uma economia aquecida e maior tolerância ao risco, enquanto retrações coincidem com fases de aversão e correções de mercado.
No âmbito das previsões financeiras, a literatura científica identifica três frentes metodológicas principais. A primeira compreende os modelos econométricos tradicionais, como ARIMA e SARIMAX, que possuem sólida fundamentação estatística e oferecem alta interpretabilidade (Lütkepohl, 2005; Balcilar et al., 2017). Entretanto, a estrutura linear desses modelos frequentemente falha em capturar a volatilidade extrema e os choques especulativos inerentes ao mercado de criptoativos, resultando em previsões excessivamente suavizadas (Charles & Darné, 2019). A segunda frente envolve algoritmos de machine learning, como o XGBoost, que se destacam pela flexibilidade em identificar padrões não lineares complexos em ambientes de alta incerteza (Fischer & Krauss, 2018; Chen & Guestrin, 2016). A terceira frente, onde se insere esta análise, foca em modelos híbridos que buscam integrar a robustez estrutural da econometria com a sensibilidade adaptativa do aprendizado de máquina. Estudos anteriores já demonstraram que essa integração resulta em ganhos preditivos consistentes (Zhang, 2003; Wang et al., 2018).
A proposta de uma abordagem híbrida SARIMAX-XGBoost para a previsão do preço do Bitcoin em um horizonte de 12 meses fundamenta-se na premissa de que o SARIMAX pode isolar a tendência estrutural e os efeitos sazonais das variáveis exógenas, enquanto o XGBoost atua sobre os resíduos para ajustar padrões não lineares e choques de curto prazo. Essa dualidade permite uma avaliação que respeita a coerência macroeconômica sem ignorar a volatilidade residual. A aplicação de métodos de validação rigorosos, como o procedimento de rolling window, garante que o desempenho dos modelos seja testado em diferentes fases do mercado, desde picos especulativos até períodos de estabilização. Complementarmente, o uso do teste de Harvey, Leybourne e Newbold oferece uma base estatística para verificar se as melhorias de acurácia observadas são de fato significativas ou apenas flutuações amostrais, conferindo rigor metodológico à comparação entre o modelo puro e a estrutura híbrida.
O delineamento metodológico baseia-se em um período de análise que abrange de janeiro de 2019 a julho de 2025, utilizando dados mensais de fechamento do preço do Bitcoin em dólares, obtidos via CoinMarketCap. As quatro variáveis exógenas selecionadas — taxa de juros, liquidez M2, inflação (CPI) e capacidade instalada — foram extraídas do Federal Reserve e submetidas a um tratamento rigoroso para garantir a frequência mensal e a consistência estatística. A exploração inicial dos dados revelou um comportamento do Bitcoin marcado por instabilidade extrema, com picos notáveis em 2021 e uma correção severa em 2022, contrastando com a suavidade relativa das variáveis macroeconômicas, que, no entanto, apresentaram inflexões críticas durante a pandemia de COVID-19 e o subsequente ciclo de aperto monetário iniciado em 2022.
A modelagem SARIMAX foi implementada como o componente inicial para capturar a influência das variáveis externas. Para estabilizar a variância da série de preços, aplicou-se a transformação logarítmica, um procedimento padrão em séries temporais financeiras para mitigar o impacto de valores extremos. A seleção dos parâmetros autorregressivos, de diferenciação e de médias móveis ocorreu de forma automatizada, garantindo o melhor ajuste estatístico aos dados históricos. Um diferencial relevante no processo preditivo foi a projeção individual das variáveis exógenas por meio de modelos ARIMA univariados. Essa escolha metodológica assegurou que cada variável macroeconômica seguisse uma trajetória consistente com sua própria dinâmica histórica, evitando simplificações excessivas que poderiam comprometer a qualidade das previsões finais do preço do ativo principal.
Após a estimação do SARIMAX, o algoritmo XGBoost foi empregado para modelar os erros residuais. O XGBoost, baseado no princípio de gradient boosting, constrói árvores de decisão sucessivas onde cada nova árvore tenta corrigir os erros das anteriores. No contexto deste estudo, o algoritmo foi treinado especificamente sobre a diferença entre os valores reais observados e os valores previstos pelo SARIMAX. Para capturar a dependência temporal de curto prazo nos resíduos, foram utilizadas três defasagens (lags) consecutivas como variáveis explicativas. Essa configuração permitiu que o modelo aprendesse padrões remanescentes e não linearidades que a estrutura linear do SARIMAX, por definição, não seria capaz de processar. A integração final resultou em um modelo capaz de unir a capacidade explicativa macroeconômica com a flexibilidade preditiva do aprendizado de máquina.
O processo de validação por rolling window foi estruturado em três rodadas distintas para assegurar a robustez dos resultados. A primeira rodada utilizou dados de treino até o final de 2022 com teste em 2023; a segunda estendeu o treino até o final de 2023 com teste em 2024; e a terceira utilizou treino até o final de 2024 com teste no primeiro semestre de 2025. Essa divisão é estratégica, pois os anos de 2023 e 2024 foram marcados por alta volatilidade e mudanças de tendência, representando o cenário ideal para testar a resiliência dos modelos. A qualidade das previsões foi mensurada por meio do RMSE, que penaliza grandes desvios, do MAE, que fornece a magnitude média do erro em dólares, e do MAPE, que permite a comparação percentual. Todos os cálculos foram realizados após a reconversão dos valores logarítmicos para o nível original de preços, garantindo a interpretabilidade financeira direta.
As projeções das variáveis exógenas revelaram um cenário de relativa estabilidade para o horizonte futuro. A taxa de juros norte-americana apresentou uma trajetória de leve recuo, passando de 4,33% em julho de 2025 para 4,32% em junho de 2026, sugerindo uma manutenção da política monetária em patamares elevados sem novos choques de aperto. O indicador de liquidez M2 manteve seu crescimento estrutural, evoluindo de 22180 bilhões para 23396 bilhões no mesmo período, o que indica uma injeção contínua de liquidez no sistema. A inflação seguiu uma trajetória ascendente, variando de 322,9 para 334,2 pontos, evidenciando a persistência das pressões sobre os preços ao consumidor. Já a utilização da capacidade produtiva mostrou-se estável, com uma redução marginal de 77,93% para 77,85%, sinalizando que a atividade industrial opera próxima ao seu limite técnico.
Os resultados obtidos com o modelo SARIMAX puro demonstraram as limitações inerentes às abordagens lineares em mercados voláteis. Em 2023, o modelo apresentou um RMSE de 15342,7 dólares e um MAPE de 45,4%, refletindo uma dificuldade acentuada em acompanhar as oscilações rápidas do Bitcoin. Embora o modelo consiga identificar a tendência geral de longo prazo, ele tende a suavizar excessivamente os movimentos, perdendo os picos e vales que definem a rentabilidade e o risco do ativo. Em 2024, houve uma melhora relativa nas métricas, com o MAPE reduzindo para 30,6%, mas os erros ainda permaneceram elevados devido ao forte componente especulativo do período. Somente no primeiro semestre de 2025, em um contexto de mercado mais estável, o SARIMAX puro exibiu um desempenho superior, com um MAPE de 7,73%, demonstrando que sua eficácia está condicionada à menor volatilidade da série.
A análise do modelo híbrido revelou um comportamento distinto e mais dinâmico. Em 2023, o RMSE foi de 15084 dólares com um MAPE de 43,16%. Embora numericamente próximos aos do SARIMAX puro, as trajetórias geradas pelo modelo híbrido mostraram-se mais sensíveis aos choques de curto prazo. Em 2024, o desempenho do híbrido melhorou, registrando um RMSE de 28097 dólares e um MAPE de 31,14%. O ponto de maior destaque ocorreu em 2025, onde o modelo híbrido alcançou um RMSE de 13454 dólares e um MAPE de apenas 10,58%. Esses dados sugerem que a inclusão do XGBoost permitiu ao sistema incorporar padrões recentes de volatilidade, tornando as previsões mais aderentes ao comportamento real do ativo conforme o modelo acumulava informações sobre os erros passados.
A projeção de 12 meses à frente, partindo de julho de 2025, evidenciou as divergências estruturais entre as duas abordagens. O SARIMAX puro indicou uma valorização constante e linear, partindo de 103,7 mil dólares e alcançando 123,2 mil dólares em junho de 2026. Essa trajetória é fortemente ancorada nas projeções das variáveis exógenas, refletindo o impacto positivo da liquidez crescente e da inflação persistente. Contudo, essa projeção falha em representar a volatilidade intrínseca do Bitcoin, apresentando uma linha de crescimento sem as oscilações características do mercado. Já a projeção híbrida apresentou um formato muito mais próximo da realidade histórica, introduzindo ciclos de curto prazo e correções. O modelo híbrido previu uma valorização inicial para 122,5 mil dólares em agosto de 2025, seguida por uma correção para 110 mil dólares em setembro e uma nova queda para 102,3 mil dólares em outubro. Retomadas significativas foram projetadas para o final de 2025 e início de 2026, com o preço atingindo um pico de 140,1 mil dólares em abril de 2026, antes de estabilizar em torno de 116 mil dólares em junho.
Essa trajetória oscilatória do modelo híbrido é condizente com o padrão observado historicamente no Bitcoin, que raramente sustenta movimentos lineares por períodos prolongados. A capacidade do modelo híbrido de incorporar fundamentos macroeconômicos e, simultaneamente, simular dinâmicas especulativas e ajustes de mercado, torna-o uma ferramenta superior para a gestão de risco. A análise comparativa reforça o que a literatura já sugeria sobre as vantagens das estruturas integradas (Zhang, 2003; Oliveira & Nobre, 2022). A combinação entre SARIMAX e XGBoost aumenta a sensibilidade às oscilações sem perder a conexão com os fundamentos econômicos globais, oferecendo uma visão mais holística do comportamento do ativo.
Apesar das melhorias observadas nas métricas descritivas, a aplicação do teste de Harvey, Leybourne e Newbold trouxe uma perspectiva crítica necessária. Em todos os períodos avaliados, as diferenças de desempenho entre o SARIMAX puro e o modelo híbrido não foram estatisticamente significativas ao nível de 5%. Em 2023, os p-values para as funções de perda quadrática e absoluta foram de 0,644 e 0,371, respectivamente. Em 2024, embora a estatística HLN tenha sido positiva (1,42), sugerindo uma vantagem pontual do híbrido, o p-value de 0,183 permaneceu acima do limiar de rejeição da hipótese nula. Mesmo em 2025, com uma janela de seis meses, os p-values de 0,578 e 0,572 confirmaram a ausência de superioridade estatística formal. Esse resultado implica que, embora o modelo híbrido produza trajetórias visualmente mais realistas e métricas de erro ligeiramente melhores em certos contextos, a evidência não é suficiente para afirmar que um modelo substitui o outro de forma definitiva.
Em termos práticos, os achados indicam que os dois modelos devem ser interpretados como complementares. Para gestores de fundos e instituições que buscam previsões de médio e longo prazo baseadas em fundamentos, o SARIMAX oferece uma âncora sólida em variáveis macroeconômicas. Sua robustez em cenários de crescimento gradual ou estabilidade o torna uma ferramenta confiável para análises de cenário. Por outro lado, para investidores individuais e traders que operam em horizontes mais curtos, a sensibilidade do modelo híbrido a movimentos abruptos oferece uma vantagem estratégica na antecipação de volatilidade e na calibração de estratégias de entrada e saída. A capacidade do híbrido de gerar simulações que incluem correções de mercado é particularmente útil para o desenho de políticas de stop-loss e gestão de capital.
A discussão sobre os resultados também deve considerar as limitações do estudo e as possibilidades de expansão. A dependência de modelos ARIMA univariados para projetar as variáveis exógenas, embora robusta, pode ser refinada por meio de modelos multivariados como VAR ou VECM, que capturam as interdependências entre os próprios indicadores macroeconômicos. Além disso, a etapa de aprendizado de máquina poderia explorar outras arquiteturas, como redes neurais LSTM, que são especificamente projetadas para lidar com dependências temporais de longo prazo, ou modelos baseados em Transformers, que têm demonstrado sucesso crescente em séries financeiras complexas. A inclusão de variáveis de sentimento de mercado, extraídas de redes sociais ou volumes de busca, também poderia enriquecer a capacidade do XGBoost em prever choques puramente especulativos que não possuem raiz direta em dados macroeconômicos.
A análise detalhada das métricas de erro ao longo do tempo sugere que o modelo híbrido se beneficia do aprendizado acumulado. A redução drástica do MAPE para 10,58% em 2025 indica que, conforme a série histórica cresce e os padrões de erro do SARIMAX se tornam mais conhecidos pelo XGBoost, a capacidade de ajuste fino aumenta. Isso reforça a tese de que modelos de machine learning exigem volumes substanciais de dados para superar as limitações de modelos estatísticos tradicionais. No caso do Bitcoin, onde o histórico de dados de alta qualidade é relativamente curto se comparado a mercados de ações ou commodities, a abordagem híbrida apresenta-se como o caminho mais equilibrado para lidar com a escassez de dados históricos versus a necessidade de capturar complexidades modernas.
A convergência dos resultados aponta que o preço do Bitcoin em 2025 e 2026 continuará a ser fortemente influenciado pela liquidez global. O crescimento projetado da M2 para além dos 23000 bilhões de dólares atua como um suporte fundamental para o preço, enquanto a manutenção de juros elevados limita o potencial de uma valorização parabólica descontrolada. O modelo híbrido, ao projetar um topo em 140,1 mil dólares seguido de uma acomodação em 116 mil dólares, oferece uma visão que equilibra o otimismo fundamentalista com a cautela técnica. Essa perspectiva é vital para evitar o viés de confirmação em períodos de euforia e para manter a disciplina estratégica durante as correções inevitáveis.
Conclui-se que o objetivo foi atingido ao demonstrar que a integração entre o modelo SARIMAX e o algoritmo XGBoost proporciona uma análise mais profunda e realista do preço do Bitcoin do que as abordagens isoladas, embora a superioridade estatística formal não tenha sido comprovada pelo teste de Harvey, Leybourne e Newbold. O estudo evidenciou que o SARIMAX é eficaz na captura de tendências estruturais ligadas a variáveis macroeconômicas, como liquidez e juros, enquanto o XGBoost agrega valor ao modelar a volatilidade residual e padrões não lineares. Os resultados práticos sugerem que o modelo híbrido é mais sensível a choques de mercado, oferecendo trajetórias preditivas que refletem melhor a natureza oscilatória do ativo. Para investidores e gestores, a utilização conjunta dessas ferramentas permite uma tomada de decisão mais fundamentada, equilibrando a visão macroeconômica de longo prazo com a necessidade de monitorar riscos de curto prazo em um mercado caracterizado por incerteza extrema.
Referências Bibliográficas:
Balcilar, M., Bouri, E., Gupta, R., & Roubaud, D. (2017). Can volume predict Bitcoin returns and volatility? A quantiles-based approach.
Baur, D. G., Hong, K., & Lee, A. D. (2018). Bitcoin: Medium of exchange or speculative assets. Journal of International Financial Markets, Institutions and Money.
Chen, T., & Guestrin, C. (2016). XGBoost: A scalable tree boosting system. In Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining.
Oliveira, F. A., & Nobre, J. (2022). Modelos híbridos aplicados à previsão de ativos financeiros: uma abordagem com machine learning. Revista Brasileira de Finanças.
Wang, Y., & Ni, J. (2019). A XGBoost Risk Model via Feature Selection and Bayesian Hyper-parameter Optimization.
Yermack, D. (2013). Is Bitcoin a real currency? An economic appraisal.
Zhang, G. P. (2003). Time series forecasting using a hybrid ARIMA and neural network model. Neurocomputing.
Resumo executivo oriundo de Trabalho de Conclusão de Curso de Especialização em Data Science e Analytics do MBA USP/Esalq
Saiba mais sobre o curso; clique aqui:




























