Imagem Machine learning na manutenção industrial para antecipação de falhas e decisões

09 de fevereiro de 2026

Machine learning na manutenção industrial para antecipação de falhas e decisões

Paolla da Silva Melegari; Dayane Freire Romagnolo

Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.

No contexto da Indústria 4.0, que integra os mundos físico e digital através de tecnologias como Internet das Coisas (IoT), computação em nuvem e inteligência artificial (Begas et al., 2024), o Machine Learning (ML) emerge como uma ferramenta fundamental para prever falhas em equipamentos, gerando eficiência e redução de custos (Barbosa, 2023). Como subcampo da Inteligência Artificial, o ML utiliza algoritmos para identificar padrões complexos e não lineares em grandes volumes de dados, permitindo a realização de previsões com alta acurácia (Junior et al., 2023; Meerholz et al., 2023). A matéria-prima para esses sistemas é o Big Data, um fluxo contínuo de informações provenientes de sensores de vibração, temperatura, pressão, bem como de sistemas de gestão empresarial (ERP) e de manutenção (CMMS) (Leites, 2023).

Historicamente, a manutenção era vista como um centro de custo reativo, mas a crescente complexidade e automação da produção industrial a reposicionou como um pilar da competitividade, essencial para garantir a continuidade e a qualidade dos processos produtivos (Santos, 2018). A função da manutenção evoluiu significativamente para garantir a máxima confiabilidade, disponibilidade e eficiência dos equipamentos (Macêdo, 2015). Em um estágio ainda mais avançado, a manutenção prescritiva não apenas prevê a falha, mas também automatiza a recomendação de ações corretivas, integrando IA e IoT para minimizar a intervenção humana e otimizar a resposta (Machado et al., 2023). O estudo utilizou um conjunto de dados de manutenção de uma indústria de pneus, abrangendo o período de 2015 a 2022, que foi disponibilizado publicamente na plataforma Kaggle (Kaggle, 2023).

O projeto foi estruturado em um fluxo de quatro fases macro: Limpeza e Preparação dos Dados, Análise Exploratória de Dados (EDA), Modelagem Preditiva e, por fim, a formulação de Recomendações Estratégicas.

A fase de limpeza e preparação dos dados foi crucial para garantir a qualidade e a confiabilidade dos modelos subsequentes. A primeira etapa consistiu na unificação das colunas de data e hora, que estavam separadas, para criar um único campo de timestamp, permitindo o cálculo preciso de durações, como o tempo de reparo. O tratamento de dados ausentes foi realizado de forma criteriosa e contextualizada.

Para a coluna rank, que possuía valores nulos, optou-se por preenchê-los com a categoria “Sem rank”, tratando a ausência de classificação como uma informação em si, em vez de uma simples omissão. Em contrapartida, linhas que apresentavam dados faltantes em colunas críticas como consequencia (que indicava se a falha resultou em parada de máquina) e datahora_fim (essencial para calcular o tempo de inatividade) foram excluídas. Essa remoção seletiva foi preferível à imputação estatística (como preenchimento pela média ou mediana), pois a integridade das variáveis-alvo e das métricas de desempenho é primordial, e a introdução de valores sintéticos poderia distorcer os padrões de falha e custo. Esta abordagem, focada na qualidade e relevância dos registros, é mais alinhada a cenários industriais; a precisão de cada evento é mais importante do que a preservação do volume total de dados (Bekar, Nyqvist e Skoogh, 2020).

Ao final deste processo, o dataset estava completamente livre de valores ausentes e pronto para a análise.

A Análise Exploratória de Dados (EDA) foi conduzida com o objetivo de identificar padrões, tendências e anomalias nos dados históricos, focando nos três principais equipamentos em termos de custo total de manutenção, tempo total de inatividade e frequência de ordens de serviço.

Para isso, foram aplicados filtros para isolar o período mais relevante, de 2018 a 2022, e os dados foram agregados anualmente para permitir comparações claras. Foram gerados gráficos de barras e séries temporais para visualizar a evolução desses indicadores ao longo do tempo para cada equipamento crítico.

A fase de Modelagem Preditiva foi dividida em duas frentes. Primeiro, foi desenvolvido um modelo de classificação para prever a ocorrência de paradas de equipamento (identificada pela variável consequencia com valor 01), um evento de alto impacto na produção. Segundo, foi construído um modelo de regressão para prever o custo da manutenção, auxiliando no planejamento orçamentário e na análise de viabilidade de reparos. O algoritmo Random Forest foi escolhido para ambos os modelos devido à sua robustez, alta performance e resistência a overfitting, especialmente em datasets com interações complexas entre variáveis (Genuer, Poggi e Tuleau-Malot, 2010; Schonlau e Zou, 2020). A avaliação dos modelos foi realizada utilizando a técnica de validação cruzada estratificada com cinco dobras (five-fold cross-validation), que garante que cada subconjunto de dados usado para teste mantenha a mesma proporção de classes da variável-alvo, tornando a avaliação mais robusta.

Para o modelo de classificação, as métricas de desempenho selecionadas foram acurácia, F1-score, Área Sob a Curva ROC (AUC) e recall.

Para o modelo de regressão, foram utilizados o Coeficiente de Determinação (R²), a Raiz do Erro Quadrático Médio (RMSE) e o Erro Percentual Absoluto Médio (MAPE). Os resultados demonstram o significativo potencial do Machine Learning para aprimorar a gestão da manutenção industrial.

A análise exploratória revelou que o ano de 2018 concentrou o maior custo de manutenção do período analisado, com o Equipamento 76 sendo o principal responsável, acumulando um custo de R$ 407.000.

A análise histórica deste equipamento mostrou um padrão recorrente de intervenções de alto custo, sugerindo problemas crônicos de projeto, operação ou manutenção. Em relação ao tempo de manutenção, o Equipamento 72 destacou-se negativamente em 2018, com 1.300 horas de inatividade, enquanto o Equipamento 202 atingiu um pico alarmante de 1.800 horas em 2021. A recorrência de equipamentos específicos, como o 202, 76 e 195, nos rankings de piores desempenhos em múltiplos indicadores, evidencia a necessidade de uma revisão aprofundada dos planos de manutenção existentes. Tais padrões indicam que as estratégias atuais podem não ser eficazes para esses ativos, impactando diretamente o Tempo Médio para Reparo (MTTR) e, consequentemente, a Eficiência Global do Equipamento (OEE), uma métrica chave da produtividade industrial (Nakajima, 1988; Dhillon, 2006). A frequência de falhas, por sua vez, atingiu seu pico em 2021, ano em que o Equipamento 1 registrou sozinho 1.115 falhas.

Este volume extremo de ocorrências para um único ativo reforça a importância de aplicar metodologias de análise de causa raiz, como a Análise de Modos e Efeitos de Falha (FMEA) e a Manutenção Centrada em Confiabilidade (RCM), para identificar as causas fundamentais dos problemas e direcionar ações corretivas prioritárias e mais eficazes (Márquez, 2007).

A análise focada em paradas de máquina (consequência 01) confirmou a criticidade dos equipamentos 141 e 72, cuja reincidência em múltiplos indicadores de falha compromete severamente a confiabilidade da planta e métricas como o Tempo Médio Entre Falhas (MTBF) (Jardine et al., 2006).

Para prever tais eventos disruptivos, o modelo de classificação baseado no algoritmo Random Forest alcançou um desempenho notavelmente elevado: uma AUC de 0,94, indicando excelente capacidade de discriminação entre eventos de parada e não parada; uma acurácia geral de 92,00%; e um F1-score de 0,95, que demonstra um ótimo equilíbrio entre precisão e sensibilidade. O valor de recall de 0,95 é particularmente relevante no contexto da manutenção, pois indica que o modelo é capaz de identificar corretamente 95% de todas as paradas reais, minimizando a ocorrência de falsos negativos, que são os eventos mais custosos para a operação. O alto desempenho do modelo pode ser atribuído não apenas à capacidade do algoritmo, mas também à criteriosa preparação dos dados, que garantiu a qualidade das informações utilizadas para o treinamento (Schonlau e Zou, 2020; Bekar, Nyqvist e Skoogh, 2020).

Além da previsão, o modelo permitiu identificar que os Equipamentos 76, 72 e 1 apresentavam a maior probabilidade de gerar falhas críticas.

Para a previsão de custos, uma tarefa intrinsecamente mais complexa devido à alta variabilidade dos preços de peças e mão de obra, o modelo de regressão Random Forest também apresentou resultados sólidos. Ele alcançou um coeficiente de determinação (R²) de 0,72, o que significa que o modelo consegue explicar 72% da variabilidade dos custos de manutenção com base nas variáveis disponíveis. Este é um resultado robusto, especialmente considerando o volátil contexto industrial; custos podem ser influenciados por fatores externos e eventos imprevisíveis (Kobayashi et al., 2021). O modelo demonstrou consistência na previsão de custos para manutenções rotineiras e de médio porte. No entanto, sua performance é desafiada por eventos atípicos de custo muito elevado, os chamados outliers, que são inerentemente difíceis de prever. Apesar dessa limitação, o modelo se prova uma ferramenta valiosa para o planejamento orçamentário, permitindo estimativas mais acuradas e a identificação de desvios significativos que merecem investigação.

Os resultados obtidos demonstram como a aplicação de Machine Learning pode alinhar a gestão da manutenção às práticas de Digital Business, transformando dados operacionais em um ativo estratégico que apoia decisões táticas e estratégicas, aumentando a competitividade da empresa (Bharadwaj et al., 2013; Rojko, 2017). Um exemplo prático dessa transformação é o caso da Dunlop Aircraft Tyres, que implementou soluções de manutenção preditiva para monitorar seus ativos críticos, resultando em uma redução drástica de paradas não planejadas e um aumento significativo na produtividade (Rockwell Automation, 2020). Com base nos achados deste estudo, são propostas as seguintes recomendações estratégicas: primeiramente, realizar um estudo aprofundado de viabilidade para a substituição ou modernização (retrofit) dos Equipamentos 76, 72 e 1.

O modelo de regressão de custos pode ser utilizado para estimar os custos futuros de manutenção desses ativos, fornecendo dados quantitativos para embasar a análise de Retorno sobre o Investimento (ROI) de um novo equipamento (Mobley, 2002). Em segundo lugar, otimizar os processos de manutenção, utilizando os insights da análise exploratória para padronizar procedimentos nos equipamentos mais problemáticos e capacitar as equipes técnicas para uma cultura orientada a dados; as decisões são baseadas em evidências e não apenas na experiência (Dhillon, 2006). Por fim, recomenda-se a integração dos modelos preditivos desenvolvidos ao sistema de gestão da manutenção (CMMS) da empresa. Essa integração permitiria automatizar a geração de alertas de falha iminente e otimizar o planejamento do estoque de peças de reposição, garantindo que os componentes certos estejam disponíveis no momento certo (Porter & Heppelmann, 2015; Bai et al., 2021).

A digitalização da manutenção gera ganhos que transcendem a operação, influenciando decisões de investimento de capital e alinhando a empresa às metas de sustentabilidade ambiental, social e de governança (ESG) através da redução de desperdícios e do aumento da eficiência energética (Reis et al., 2018). Este trabalho demonstrou a eficácia do Machine Learning como ferramenta para prever falhas e custos no ambiente industrial.

A análise exploratória foi fundamental para identificar os equipamentos críticos (76, 72 e 1) que concentram a maior parte dos custos, tempo de parada e frequência de falhas, servindo como um diagnóstico inicial dos principais pontos de dor da operação. O modelo de classificação Random Forest apresentou alto desempenho na identificação de paradas de máquina, provando ser uma ferramenta confiável para a antecipação de eventos disruptivos. Por sua vez, o modelo de regressão mostrou-se valioso para o planejamento orçamentário e a gestão de custos, apesar da sua sensibilidade a eventos de custo atípico. A reincidência dos mesmos ativos em múltiplos indicadores de baixo desempenho reforça a necessidade de uma abordagem de manutenção mais estratégica e proativa, incorporando metodologias consagradas como FMEA e RCM para atacar as causas raiz das falhas.

A pesquisa comprova que a integração de algoritmos de ML aos sistemas de gestão habilita intervenções proativas, otimiza a alocação de recursos e alinha a manutenção aos princípios da Indústria 4.0.

Para trabalhos futuros, sugere-se a expansão do escopo para um sistema de manutenção preditiva em tempo real, incorporando dados de sensores de IoT, e o desenvolvimento de modelos de simulação de custo-benefício para apoiar decisões de investimento em novos ativos.

Conclui-se que o objetivo foi atingido: demonstrou-se que a aplicação de modelos de Machine Learning permite prever falhas e custos em equipamentos industriais com alta precisão, identificando ativos críticos e orientando decisões estratégicas de manutenção.

Referências:
Bai, C.; Yu, Z.; Doh, H.; Dale, K. Digital transformation for improved energy and product efficiency in tire production: a case study. ResearchGate, 2021.
Barbosa, J. D. M. (2023). Manutenção preditiva com recurso a inteligência artificial. Universidade D Coimbra.
Begas, G. F., Bermudes, J. C., Souza, L. T. de, Villaroel, M. B. R., & Kalili, R. M. (2024). Machine learning na manutenção prescritiva de caldeiras industriais. Revista Contemporânea, 4(6), e4673.
Bekar, E. Turanoglu; Nyqvist, P.; Skoogh, A. An intelligent approach for data pre-processing and analysis in predictive maintenance with an industrial case study. Advances in Mechanical Engineering, v. 12, n. 3, p. 1-14, 2020.
Bharadwaj, A.; El Saady, S.; Kundu, S.; et al. Digital business strategy: toward a next generation of insights. MIS Quarterly, v. 37, n. 2, p. 471–482, 2013.
Breiman, L. Random Forests. Machine Learning, v. 45, n. 1, p. 5-32, 2001.
Dhillon, B. S. Maintainability, Maintenance, and Reliability for Engineers. Boca Raton: CRC Press, 2006.
GENUER, R.; POGGI, J.-M.; TULEAU-MALOT, C. Variable selection using random forests. Pattern Recognition Letters, v. 31, n. 14, p. 2225-2236, 2010.
Jardine, A. K. S.; LIN, D.; Banjevic, D. A review on machinery diagnostics and prognostics implementing condition-based maintenance. Mechanical Systems and Signal Processing, v. 20, n. 7, p. 1483–1510, 2006.
Junior, M. C. S. P., Araújo, M. L. V., De Oliveira, E. A. R., Guimarães, V. B., Saba, H., Jorge, E. M. de F., Filho, A. S. N., & Ferreira, J. S. (2023). Estudo da aplicação de algoritmos de machine learning na manutenção preditiva de motores elétricos. Revista de Gestão e Secretariado (Management and Administrative Professional Review), 14(10), 16542–16561.
Kaggle. Análise de dados de manutenção. In: Análise de dados de manutenção. [S. l.], 2023.
Kobayashi, Y.; Nakamura, H.; Wang, J. Predictive maintenance and cost optimization in industrial systems. Journal of Manufacturing Systems, v. 60, p. 123-135, 2021.
Lee, J. et al. Prognostics and health management design for rotary machinery systems. Mechanical Systems and Signal Processing, v. 42, n. 1-2, p. 314–334, 2014.
Leites, L. R. L. (2023). Estudo de aplicação de técnicas de análise da dados e machine learning em uma indústria de arroz parboilizado: manutenção preditiva de falhas em uma caldeira. Universidade Federal do Pampa.
Macêdo, J. A. G. (2015). Planejamento e controle da manutenção preventiva como meios para diminuir a manutenção corretiva. Universidade Estadual da Paraíba.
Machado, C. O., Monteiro Junior, S. C., Celestino, Y. V. e S., Andrade, J. A. B. de, & Rodrigues Junior, A. S. (2023). Manutenção prescritiva: a evolução da manutenção na indústria 4.0. Revista Ibero-Americana de Humanidades, Ciências e Educação, 9(9), 4444–4458.
Márquez, A. C. The Maintenance Management Framework. London: Springer, 2007.
Meerholz, P. V., Mattos, W. D., Freitas, D. S., & Inacio, E. C. (2023). Um Estudo Sobre o Uso de Modelos de Machine Learning para Manutenção Preditiva Industrial. XIV Computer on the Beach.
Mobley, R. K. An Introduction to Predictive Maintenance. 2. ed. Burlington: Butterworth-Heinemann, 2002.
Nakajima, S. Introduction to TPM: Total Productive Maintenance. Cambridge: Productivity Press, 1988.
Porter, M. E.; Heppelmann, J. E. How smart, connected products are transforming companies. Harvard Business Review, v. 93, n. 10, p. 96–114, 2015.
Reis, J.; Veiga, P.; Pacheco, C.; et al. Digital transformation and organizational performance: a systematic review. Technological Forecasting & Social Change, v. 137, p. 37–50, 2018.
Rockwell Automation. Predictive maintenance: Dunlop Aircraft Tyres case study. Rockwell Automation, 2020.
ROJKO, A. Industry 4.0 concept: Background and overview. International Journal of Interactive Mobile Technologies, v. 11, n. 5, p. 77–90, 2017.
Santos, L. A. (2018). Manutenção preventiva – O processo de planejamento. Pitágoras.
SCHONLAU, M.; ZOU, R. Y. The random forest algorithm for statistical learning. The Stata Journal, v. 20, n. 1, p. 3-29, 2020.

Resumo executivo oriundo de Trabalho de Conclusão de Curso de Especialização em Digital Business do MBA USP/Esalq

Saiba mais sobre o curso; clique aqui:

Quem editou este artigo

Você também pode gostar

Quer ficar por dentro das nossas últimas publicações? Inscreva-se em nossa newsletter!

Receba conteúdos e fique sempre atualizado sobre as novidades em gestão, liderança e carreira com a Revista E&S.

Ao preencher o formulário você está ciente de que podemos enviar comunicações e conteúdos da Revista E&S. Confira nossa Política de Privacidade