Imagem Modelagem Preditiva de Faixas de Temperatura em Cubas Eletrolíticas de Alumínio

26 de fevereiro de 2026

Modelagem Preditiva de Faixas de Temperatura em Cubas Eletrolíticas de Alumínio

João Pedro Monzani Nóra; Sandro Ricardo Fuzatto

Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.

O objetivo deste trabalho foi desenvolver um modelo supervisionado de aprendizado de máquina para prever faixas de temperatura do banho eletrolítico em cubas de produção de alumínio. Esta é uma variável crítica que impacta a eficiência do processo de redução, a produtividade, o consumo energético e as emissões. A antecipação de suas variações permite otimizar o controle térmico, fornecendo insights para a indústria do alumínio com foco em estabilidade operacional, sustentabilidade e produtividade. A pesquisa aplicou um modelo para classificar a temperatura em três categorias: “Abaixo da Faixa”, “Na Faixa” e “Acima da Faixa”, permitindo intervenções proativas e precisas. A capacidade de prever desvios térmicos antes que se tornem críticos representa um avanço em relação aos métodos de controle reativos.

O alumínio é um dos metais mais versáteis e utilizados na indústria moderna, com papel fundamental na economia global. Sua combinação de leveza, resistência à corrosão e alta condutividade o torna indispensável em setores como automobilístico, aeroespacial, de embalagens e construção civil (Rosa et al., 2024). A produção comercial baseia-se no processo Hall-Héroult, estabelecido em 1889, que envolve a fusão de criolita e alumina (Prasad, 2000). Este método é intensivo em energia, o que impulsiona a busca por inovações que aumentem a eficiência e a sustentabilidade. A demanda por soluções que reduzam o consumo de combustíveis e emissões estimula o desenvolvimento de novas ligas, ampliando seu campo de aplicação (ABAL, 2012).

O mercado mundial de alumínio é liderado por China, Rússia, Canadá e Emirados Árabes Unidos, com a China como maior produtora e consumidora. O Brasil ocupa a oitava posição entre os maiores produtores de alumínio e a terceira em produção de alumina (ABAL, 2023). A demanda global é impulsionada pelos setores de construção e transporte, e pela transição para fontes de energia renováveis, como turbinas eólicas e painéis solares, que utilizam alumínio extensivamente (Hund et al., 2020). O setor enfrenta desafios como a volatilidade dos preços e a pressão regulatória para reduzir a pegada de carbono, tornando a otimização da eficiência energética uma prioridade estratégica.

No Brasil, a indústria do alumínio possui relevância econômica substancial. O país detém vastas reservas de bauxita, o que lhe confere destaque como exportador. Contudo, a competitividade é desafiada por altos custos energéticos e pela necessidade de investimentos em tecnologias mais limpas (ABAL, 2023). O processo de redução de alumina em cubas eletrolíticas é a etapa central; o óxido de alumínio é transformado em alumínio metálico. A eficiência desta etapa depende do controle preciso de múltiplas variáveis, sendo a temperatura do banho um dos fatores mais influentes na produtividade e no consumo de energia (Marinho, 2019).

A complexidade do processo de eletrólise torna a aplicação de técnicas de aprendizado de máquina uma abordagem promissora para a otimização. Modelos supervisionados, como árvores de decisão e algoritmos de boosting, são eficazes com grandes volumes de dados históricos rotulados, permitindo a construção de modelos preditivos precisos. Esses modelos aprendem os padrões complexos e as interações não lineares entre as variáveis de processo, que são difíceis de modelar com abordagens estatísticas tradicionais (James et al., 2013). Ao prever a tendência da temperatura do banho, é possível ajustar parâmetros operacionais de forma antecipada, evitando desvios que levariam a perdas de eficiência ou eventos indesejados.

A análise foi conduzida em cubas de redução de alumínio da tecnologia VSS Soderberg, um sistema de eletrólise contínua. Os principais parâmetros de controle que governam o balanço térmico são a temperatura do banho, o excesso de fluoreto de alumínio (AlF₃) e o percentual de fluoreto de cálcio (CaF₂) (Marinho, 2019). O controle térmico é influenciado pela corrente elétrica, tensão, níveis de banho e metal, composição química do eletrólito e estado de conservação dos eletrodos. A manutenção da temperatura na faixa ótima, entre 955°C e 965°C, é crucial. Temperaturas abaixo do limite podem causar a mistura indesejada das fases metal e banho. Temperaturas acima aumentam a solubilidade do alumínio no banho, favorecendo sua reoxidação e reduzindo a eficiência da corrente (Marinho, 2018).

Os dados foram extraídos de uma base SQL Server, abrangendo informações operacionais, medições elétricas e composição química. Um total de 62.041 observações foi consolidado utilizando Python e bibliotecas como Pandas e NumPy. O pré-processamento incluiu a padronização de identificadores, conversão de datas e ordenação temporal. Um identificador único foi criado para fundir diferentes fontes de dados. A partir dos dados brutos, foram geradas variáveis derivadas para capturar a dinâmica do processo, como a temperatura com atraso de um dia (“Temperatura_delay”), médias móveis de sete dias para ruído elétrico e tensão, e a diferença entre os níveis de metal e banho em relação aos seus valores de referência. Valores ausentes foram tratados com métodos de preenchimento progressivo (forward-fill) e substituição pela média.

A variável alvo, “Faixa_Temp”, foi criada para classificar a temperatura do banho em: “Abaixo da Faixa” (< 955°C), “Dentro da Faixa” (955°C-965°C) e “Acima da Faixa” (> 965°C). As demais variáveis foram utilizadas como preditoras. Variáveis categóricas, como a indicação de cubas com alimentação automatizada, foram transformadas em variáveis binárias (dummies) para serem processadas pelo modelo, evitando a introdução de uma ordem arbitrária que poderia levar a interpretações incorretas pelo algoritmo (Fávero e Belfiore, 2017). O conjunto de dados final continha um espectro de informações, desde parâmetros elétricos de alta frequência até a idade da cuba (“Vida”).

Para a seleção do modelo, a biblioteca PyCaret foi utilizada para uma comparação automatizada de algoritmos de classificação (Ali, 2020). O Light Gradient Boosting Machine (LightGBM) emergiu como o de melhor desempenho, sendo uma implementação eficiente de Gradient Boosting conhecida por sua velocidade e precisão em grandes conjuntos de dados (Ke et al., 2017). Os dados foram divididos em conjuntos de treinamento (80%) e teste (20%) de forma estratificada. A otimização dos hiperparâmetros do LightGBM foi conduzida com a biblioteca Optuna, que utiliza algoritmos de busca para encontrar a combinação de parâmetros que maximiza o F1-Score (Akiba et al., 2019). A avaliação final do modelo foi realizada no conjunto de teste com um conjunto abrangente de métricas, incluindo acurácia, precisão, sensibilidade (recall), F1-Score, curva ROC e a matriz de confusão (Souza, 2022).

A análise exploratória dos dados revelou que a classe “Na Faixa” era a mais frequente (49,6%), seguida por “Abaixo” (28,2%) e “Acima” (22,2%), indicando um desequilíbrio moderado. A análise de correlação entre as variáveis preditoras mostrou fortes relações entre algumas variáveis elétricas, como “Vliquida” e “VAlvo”. A decisão de manter ambas foi baseada em seu significado operacional distinto. A correlação entre as preditoras e as classes da variável alvo identificou tendências importantes. A temperatura do dia anterior (“Temperatura_delay”) mostrou uma correlação consistente, indicando a inércia térmica do sistema. O excesso de fluoreto de alumínio (“alf3ex”) apresentou correlação inversa com a temperatura, o que é quimicamente esperado. Temperaturas mais altas foram associadas a menor formação de lombo (eletrólito solidificado), enquanto temperaturas baixas se correlacionaram com maior ruído elétrico de alta frequência (“RRap”).

A análise visual por meio de boxplots confirmou essas tendências. As variáveis “alf3ex” e “RRap” mostraram uma tendência decrescente em seus valores medianos à medida que a temperatura aumentava. Em contrapartida, a variável “Temperatura_delay” exibiu um comportamento inverso, com valores médios e medianos aumentando progressivamente da classe “Abaixo” para a “Acima”, reforçando sua capacidade preditiva. A variável “Incremento”, que representa ajustes de tensão, apresentou alta variabilidade em todas as faixas, especialmente na condição “Abaixo”, refletindo ações corretivas. A condição “Na Faixa” foi caracterizada por níveis intermediários e menor variabilidade na maioria dos indicadores, representando um regime operacional mais estável.

O modelo LightGBM final, após otimização, alcançou uma acurácia global de 0,81 no conjunto de teste de 12.409 observações, prevendo corretamente a faixa de temperatura em 81% dos casos. O desempenho foi consistente entre as classes, com um F1-score médio de 0,81, indicando um bom equilíbrio entre precisão e sensibilidade, mesmo com o desequilíbrio nos dados. A média ponderada das métricas confirmou a robustez do modelo, mostrando que o desempenho na classe majoritária não mascarou a performance nas classes minoritárias.

A capacidade discriminativa do modelo foi avaliada através das curvas ROC. Os valores da área sob a curva (AUC) foram de 0,94 para a classe “Abaixo”, 0,95 para a classe “Acima” e 0,92 para a classe “Na Faixa”. Esses valores, próximos de 1, indicam uma notável capacidade do modelo em distinguir entre as diferentes faixas de temperatura. O alto valor de AUC para a classe “Acima” é particularmente relevante, pois demonstra que o modelo é eficaz em identificar condições de superaquecimento, que são críticas para a eficiência e segurança.

A análise da matriz de confusão detalhou os acertos e erros. Observou-se alta precisão nas classes extremas: para a classe “Abaixo”, o modelo acertou 2.946 de 3.503 instâncias, e para a “Acima”, 2.318 de 2.753. Os erros de classificação ocorreram predominantemente entre classes adjacentes, o que é compreensível dada a natureza contínua da temperatura. A sensibilidade foi de 0,84 para as classes “Abaixo” e “Acima” e de 0,78 para “Na Faixa”, demonstrando que o modelo generaliza bem e identifica corretamente as instâncias de cada categoria, especialmente as condições de desvio térmico.

A importância das variáveis foi analisada utilizando as métricas “split” (frequência de uso) e “gain” (contribuição para a redução do erro) (Microsoft, 2025). A análise de “split” destacou a corrente elétrica, o incremento de tensão, o excesso de fluoreto (“alf3ex”), a variação da resistência durante a extração de metal (“DeltaRCorr”) e a vida da cuba. A análise de “gain” revelou que a “Temperaturadelay” foi a variável de maior impacto, seguida por “alf3ex”, “Incremento” e “Corrente”. O alinhamento entre as duas métricas reforça a robustez das conclusões. A predominância de sinais elétricos, indicadores químicos e a inércia térmica do processo (“Temperaturadelay”) como os preditores mais importantes está em conformidade com o conhecimento técnico do processo, validando a abordagem de aprendizado de máquina.

Este trabalho demonstrou o desenvolvimento e a validação de um modelo preditivo de alto desempenho para a classificação de faixas de temperatura em cubas de redução de alumínio. O algoritmo LightGBM, otimizado com Optuna, alcançou uma acurácia global de 81% e excelentes valores de AUC. A análise de importância das variáveis confirmou que parâmetros elétricos, químicos e o histórico de temperatura são determinantes para prever a estabilidade térmica, alinhando os achados do modelo com o conhecimento de engenharia de processo. Os resultados oferecem insights para a implementação de estratégias de controle proativo, permitindo antecipar desvios, otimizar o consumo de energia e aumentar a estabilidade operacional. A aplicação de aprendizado de máquina no contexto industrial transforma dados em inteligência operacional, promovendo maior eficiência e competitividade. Conclui-se que o objetivo foi atingido: demonstrou-se que um modelo de aprendizado de máquina LightGBM é capaz de prever com alta acurácia as faixas de temperatura do banho eletrolítico em cubas de redução de alumínio, fornecendo uma base sólida para futuras implementações em sistemas de apoio à decisão em tempo real.

Referências:
Akiba, T.; Sano, S.; Yanase, T.; Ohta, T.; & Koyama, M. 2019. Optuna: A Next generation Hyperparameter Optimization Framework. In Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. ACM.
Ali, M. 2020. PyCaret 3.0. Disponível em: <https://pycaret. gitbook. io/docs>.
Associação Brasileira do Alumínio [ABAL]. 2012. Relatório de sustentabilidade da indústria brasileira do alumínio. São Paulo: Abal, 2012.
Associação Brasileira do Alumínio [ABAL]. 2023. Perfil da Indústria Brasileira do Alumínio. São Paulo: ABAL.
Fávero, L. P.; Belfiore, P. 2017. Manual de Análise de Dados: Estatística e Modelagem Multivariada com Excel®, SPSS® e Stata®. 1ª ed. Rio de Janeiro: Elsevier.
Fundamentos da Metalurgia do Alumínio. 2010. Treinamento da Liderança. Votorantim CBA, Alumínio.
Hund, K.; La Porta, D.; Fabregas, T.; Laing, T.; Drexhage, J. 2020. Minerals for climate action: the mineral intensity of the clean energy transition. Washington, DC: International Bank for Reconstruction and Development/The World Bank.
Ilyushin, Y. V.; Kapostey E. I. 2023. Developing a Comprehensive Mathematical Model for Aluminium Production in a Soderberg Electrolyser. Energies 2023, 16, 6313.
James, G.; Witten, D.; Hastie, T.; Tibshirani, R. 2013. An Introduction to Statistical Learning: with Applications in R. New York: Springer.
Ke, G.; Meng, Q.; Finley, T.; Wang, T.; Chen, W.; Ma, W.; Ye, Qi; Liu, Tie‑Yan. 2017. LightGBM: A Highly Efficient Gradient Boosting Decision Tree. In: Advances in Neural Information Processing Systems, v. 30, p. 3146–3154.
Marinho, R. 2019. Influência da temperatura e aditivos na eficiência do processo eletrolítico de redução do alumínio. Universidade de São Paulo.
Marks, J., Roberts R., Bakshi V., Dolin E., Perfluorocarbon (PFC) Generation during Primary Aluminum Production, 2020.
Marks, J., Tabereaux, A., Pape, D., Bakshi, V., Dolin, E. J. 2016. Factors Affecting PFC Emissions from Commercial Aluminum Reduction Cells.
Microsoft Corporation. LGBM documentation, 2025. Disponível em: <https://lightgbm. readthedocs. io/en/latest/pythonapi/lightgbm. Booster. html#lightgbm. Booster. feature_importance>.
Prasad, S. 2000. Studies on the Hall-Heroult aluminum electrowinning process. J. Braz. Chem. Soc. 11(3).
Rosa et al. 2024. Alumínio: uma análise do seu contexto histórico, da reciclabilidade e transmissão energética. Rev. Caderno Pedagógico 21(4): 1–41.
Severo, D. S.; Gusberti, V. 2015. Curso sobre revestimento e balanço térmico de cubas eletrolíticas de alumínio. Votorantim CBA.
Souza, I. 2022. Conheça as métricas mais importantes para avaliar classificadores em Machine Learning. Disponível em: <https://medium. com/%40igor1245souza/conhe%C3%A7a-as-m%C3%A9tricas-mais-importantes-para-avaliar-classificadores-em-machine-learning-bd270602f317>.

Resumo executivo oriundo de Trabalho de Conclusão de Curso de Especialização em Data Science e Analytics do MBA USP/Esalq

Saiba mais sobre o curso; clique aqui:

Quem editou este artigo

Você também pode gostar

Quer ficar por dentro das nossas últimas publicações? Inscreva-se em nossa newsletter!

Receba conteúdos e fique sempre atualizado sobre as novidades em gestão, liderança e carreira com a Revista E&S.

Ao preencher o formulário você está ciente de que podemos enviar comunicações e conteúdos da Revista E&S. Confira nossa Política de Privacidade