Imagem Otimização do tingimento de fios de algodão via análise preditiva e machine learning

23 de fevereiro de 2026

Otimização do tingimento de fios de algodão via análise preditiva e machine learning

Luca Conti Raposo; Ricardo Limongi

Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.

A indústria de denim, um setor robusto com faturamento projetado de R$13,07 bilhões em 2024 (IEMI, 2024), opera em um ambiente de alta competitividade que exige máxima eficiência e consistência de produto. Este processo, que envolve sucessivas imersões dos fios em banhos de corante índigo reduzido e subsequentes passagens por câmaras de oxidação para fixar a cor, é o responsável pelo característico efeito “ring dyeing” (DENIMSANDJEANS, 2011); o corante se concentra na superfície da fibra, deixando o núcleo branco. Um estiramento excessivo compromete a integridade estrutural do fio, reduzindo sua elasticidade residual e aumentando drasticamente a propensão a quebras durante a tecelagem, o que causa paradas de máquina, perda de eficiência e a geração de defeitos no tecido, como barras e falhas de trama (COTTONWORKS, 2017).

A literatura técnica confirma que fios com alongamento inadequado apresentam menor resistência à ruptura e um comportamento imprevisível no tear, afetando negativamente toda a cadeia produtiva subsequente e elevando os custos de produção (Mathangadeera et al., 2020). Essa abordagem transforma o paradigma de controle de processo de reativo para preditivo, fundamentando as decisões operacionais em evidências quantitativas e análises estatísticas (Yildirim, Birant e Alpyildiz, 2018). Um controle inadequado da umidade não apenas afeta a eficácia da etapa de engomagem, que visa proteger o fio para a tecelagem, mas também gera instabilidade dimensional, tornando o fio mais suscetível ao estiramento sob tensão (TEXTILE SCHOOL, 2023). A metodologia adotada foi de natureza quantitativa e seguiu rigorosamente o framework CRISP-DM (Cross-Industry Standard Process for Data Mining), uma abordagem estruturada e iterativa para projetos de ciência de dados (Chapman et al., 2000).

A base de dados utilizada consistiu em 1.915 registros de produção, coletados de forma contínua ao longo de um período de oito meses a partir dos sistemas de controle de processo (SCADA) da máquina de tingimento. Este volume de dados, abrangendo diferentes lotes, artigos e condições operacionais, assegura a representatividade estatística necessária para a construção de modelos preditivos generalizáveis e robustos, capazes de capturar a variabilidade inerente ao processo produtivo (James et al., 2013). A estratégia analítica foi multifacetada para garantir uma compreensão profunda e abrangente do fenômeno. Iniciou-se com uma Análise Exploratória de Dados (EDA) para visualizar as distribuições das variáveis, identificar outliers e entender as estatísticas descritivas básicas. Em seguida, foi realizada uma análise de correlação, utilizando tanto o coeficiente de Pearson, para medir relações lineares, quanto o de Spearman, para capturar relações monotônicas não-lineares, oferecendo uma visão mais completa das interdependências.

A etapa de modelagem preditiva envolveu a construção e comparação de dois algoritmos distintos: a Regressão Linear Múltipla, como um modelo de base para avaliar a linearidade das relações, e o Random Forest Regressor (Breiman, 2001), um algoritmo de ensemble conhecido por sua alta capacidade de modelar interações complexas e não-lineares. A performance dos modelos foi avaliada utilizando métricas padrão como o coeficiente de determinação (R²) e o erro quadrático médio (RMSE). Adicionalmente, foram aplicadas técnicas de aprendizado não supervisionado: a Análise de Componentes Principais (PCA) foi utilizada para reduzir a dimensionalidade do dataset e identificar as principais fontes de variância do processo (Jolliffe, 2002), enquanto o algoritmo de clustering K-Means foi empregado para segmentar os dados em regimes operacionais distintos, revelando padrões de operação com diferentes níveis de performance (MacQueen, 1967).

A otimização final, que traduziu os insights em recomendações práticas, baseou-se na análise de quartis das variáveis mais importantes identificadas pelo modelo Random Forest. Todas as análises foram implementadas na linguagem de programação Python, utilizando as bibliotecas consolidadas do ecossistema de Data Science, como Pandas para manipulação de dados, NumPy para operações numéricas e Scikit-learn para modelagem e avaliação (Pedregosa et al., 2011).

A análise exploratória dos 1.915 registros revelou uma alta variabilidade no processo de tingimento, evidenciando a dificuldade do controle manual. O estiramento total apresentou um valor médio de 1,74%, com um desvio padrão de 0,585 e um coeficiente de variação (CV) de 33,6%. Este valor médio já excede a faixa ideal de 0,5% a 1,5% recomendada pela literatura técnica para garantir um bom desempenho na tecelagem (COTTONWORKS, 2017), com picos observados de até 3,36%, confirmando a necessidade urgente de otimização. A variável com a maior instabilidade foi a umidade de secagem final, que apresentou um CV de 74,9%, indicando um controle inadequado e inconsistente desta etapa crítica.

A análise de correlação de Pearson confirmou uma relação negativa, forte e estatisticamente significativa entre a temperatura de secagem final e o estiramento (r = -0,234, p < 0,001). Este resultado indica que temperaturas mais altas tendem a reduzir o alongamento, um fenômeno fisicamente explicado pela remoção mais rápida da umidade, que diminui a plasticidade da fibra de algodão e a torna menos suscetível à deformação sob tensão (Barrelwarmer, 2024). A temperatura de pré-secagem seguiu a mesma tendência, com uma correlação de r = -0,198, enquanto a umidade de pré-secagem mostrou uma correlação positiva (r = +0,122), sugerindo que fios mais úmidos na entrada dos secadores tendem a estirar mais. A etapa de modelagem preditiva confirmou a natureza predominantemente não-linear das interações no processo.

O modelo de Regressão Linear Múltipla, que assume relações aditivas e lineares, demonstrou uma capacidade explicativa bastante limitada, alcançando um coeficiente de determinação (R²) de apenas 0,0913. Em contrapartida, o modelo Random Forest, capaz de capturar interações complexas e não-lineares entre as variáveis, obteve um desempenho significativamente superior, com um R² de 0,2183. Isso significa que o Random Forest foi capaz de explicar 139% mais da variabilidade do estiramento em comparação com o modelo linear, validando a escolha de algoritmos mais sofisticados para este tipo de problema industrial (Breiman, 2001).

A análise de importância das variáveis (feature importance) extraída do modelo Random Forest estabeleceu uma hierarquia clara dos fatores de influência: a temperatura de secagem final foi, de longe, o fator mais importante, respondendo por 24,8% da capacidade preditiva do modelo. Em seguida, vieram a célula de carga na saída da goma (17,4%), a tensão no campo seco (15,4%) e a temperatura de pré-secagem (13,0%). É notável que o modelo não-linear identificou as variáveis de tensão como cruciais, apesar de suas correlações lineares fracas, evidenciando que seu impacto no estiramento se manifesta através de interações complexas com outras variáveis, como a temperatura e a umidade.

A Análise de Componentes Principais (PCA) permitiu condensar a complexidade do processo em três fatores latentes que, juntos, explicam 56,9% da variância total dos dados. O primeiro componente (PC1), responsável por 21,5% da variância, foi interpretado como “Controle Térmico e Tensional”, pois foi fortemente influenciado pelas temperaturas e tensões. O segundo (PC2, 19,2%) foi denominado “Dinâmica Operacional”, relacionado principalmente à velocidade da máquina. O terceiro (PC3, 16,2%) foi chamado de “Gestão de Umidade”, dominado pelas variáveis de umidade. Essa decomposição oferece uma visão estruturada do processo, sugerindo que uma estratégia de otimização integrada deve atuar simultaneamente nesses três eixos (Jolliffe, 2002). Complementarmente, a análise de clustering K-Means identificou três regimes operacionais distintos nos dados históricos. O cluster denominado “Regime de Excelência Operacional”, compreendendo 11,5% dos registros, apresentou o menor estiramento médio (1,667%) e foi caracterizado por altas temperaturas de secagem (média de 127,2°C na secagem final) e tensões bem controladas.

Em contraste, o “Regime de Controle Deficiente” (o maior cluster) exibiu o maior estiramento médio (2,109%), associado a temperaturas de secagem mais baixas e uma umidade final elevada e variável (média de 11,94%). A existência desses clusters demonstra que as condições ideais para um baixo estiramento são alcançáveis na prática, mas não eram mantidas de forma consistente. A tradução dos insights analíticos em recomendações práticas e acionáveis foi realizada por meio de uma análise de quartis das variáveis mais influentes.

Para a temperatura de secagem final, observou-se que o quartil superior de operação (valores entre 134,55°C e 142,59°C) estava associado ao menor estiramento médio, indicando que, na maior parte do tempo, o processo opera sistematicamente abaixo da faixa ótima de temperatura. De forma similar, tensões mais elevadas, localizadas nos quartis superiores das variáveis de tensão, também resultaram em melhor performance, possivelmente por garantir um transporte mais estável do fio.

A análise dos 10% melhores registros de produção (percentil 90), ou seja, aqueles com o menor estiramento, revelou um potencial de otimização impressionante: esses registros apresentaram um estiramento médio de apenas 0,44%. Este valor representa uma redução potencial de 74,7% em relação à média geral de 1,74%. Este resultado, fundamentado em dados históricos da própria operação, é de extrema relevância, pois demonstra que um controle dimensional excepcional não é uma meta teórica, mas sim uma condição viável e já alcançada esporadicamente, que precisa ser sistematizada. A convergência dos resultados de todas as análises aponta para uma interpretação técnica coerente e robusta. O domínio do controle térmico sobre o estiramento deve-se à sua capacidade de remover a água da fibra de forma rápida e eficiente.

A água atua como um plastificante para a celulose, tornando a fibra mais maleável; ao removê-la rapidamente com altas temperaturas, reduz-se o tempo em que a fibra de algodão permanece em um estado plástico e suscetível à deformação permanente sob tensão. A importância da umidade, por sua vez, reflete as propriedades higroscópicas intrínsecas da fibra (TEXTILE SCHOOL, 2023). As implicações diretas para a etapa de tecelagem são significativas: a redução da média e, principalmente, da variabilidade do estiramento, leva a um comportamento muito mais previsível e uniforme do fio no tear. Isso se traduz em uma diminuição drástica das quebras de fio, menos paradas de máquina, maior eficiência produtiva e uma melhoria substancial na qualidade e uniformidade do tecido final, resultando em ganhos de produtividade e redução de custos (Mathangadeera et al., 2020).

A aplicação de Data Science ao complexo processo de tingimento multicaixas permitiu identificar com precisão os parâmetros de processo que governam o estiramento dos fios de algodão. A temperatura de secagem final emergiu como o fator de maior influência, seguida pela temperatura de pré-secagem e pelo controle rigoroso da umidade. O modelo Random Forest demonstrou sua superioridade ao desvendar as relações não-lineares que caracterizam o processo, superando em muito a capacidade explicativa dos modelos lineares tradicionais. Com base nos resultados, os intervalos operacionais recomendados para minimizar o estiramento foram estabelecidos: operar com a temperatura de secagem final na faixa entre 134,55°C e 142,59°C, manter a umidade de pré-secagem em torno de 3,5% e garantir que a umidade de secagem final permaneça consistentemente na faixa de 4,0% a 6,0%.

A análise revelou um potencial de redução do estiramento em 74,7%, evidenciando a viabilidade de se alcançar um controle dimensional excepcional através da otimização baseada em dados. Este estudo consolidou uma metodologia robusta e replicável para a otimização de processos têxteis complexos, integrando o conhecimento técnico de processo com ferramentas avançadas de análise estatística e Machine Learning. As recomendações geradas são práticas e podem ser diretamente incorporadas aos procedimentos operacionais padrão (POPs) e aos sistemas de controle da máquina, gerando melhorias imediatas na qualidade do fio e, consequentemente, na eficiência da tecelagem. A abordagem utilizada validou a aplicabilidade e o valor da Data Science na indústria tradicional, oferecendo um roteiro claro para futuras iniciativas de transformação digital e otimização de processos.

Para os gestores, os resultados fornecem um arcabouço sólido para a tomada de decisão baseada em dados, permitindo a implementação de novos padrões de controle e o uso de modelos preditivos para realizar ajustes preventivos, migrando de uma cultura reativa para uma proativa.

Conclui-se que o objetivo foi atingido: demonstrou-se que a otimização sistemática dos parâmetros de processo, com especial atenção à temperatura de secagem final, permite uma redução significativa e controlada do estiramento dos fios de algodão, com impacto direto na produtividade e competitividade da empresa.

Referências:
ALMEIDA, R. (2022). Aplicações de Data Science na Indústria Têxtil. Revista Têxtil, 45(3), 78-85.
BARRELWARMER (2024). “Mastering the Indigo Dyeing Process: Why Temperature Control is Essential”. Disponível em: https://barrelwarmer. com/blogs/news/mastering-the-indigo-dyeing-process-why-temperature-control-is-essential
BREIMAN, L. (2001). “Random Forests”. Machine Learning, 45(1), 5-32.
CHAPMAN, P., CLINTON, J., KERBER, R., KHABAZA, T., REINARTZ, T., SHEARER, C., & WIRTH, R. (2000). “CRISP-DM 1.0: Step-by-step data mining guide”. SPSS Inc.
COHEN, J. (1988). Statistical Power Analysis for the Behavioral Sciences. 2nd ed. Hillsdale, NJ: Lawrence Erlbaum Associates, Publishers.
COTTONWORKS™ (2017). “Textile Yarns”. Technical Bulletin. Cotton Incorporated.
DENIMSANDJEANS. COM (2011). “Indigo Dyeing Methods – Engineering Color, Wash Fastness And Fashion Effects”. Disponível em: https://www. denimsandjeans. com/denim/manufacturing-process/indigo-dyeing-methods-engineering-color-wash-fastness-and-fashion-effects/3014
HASTIE, T., TIBSHIRANI, R., & FRIEDMAN, J. (2009). The Elements of Statistical Learning: Data Mining, Inference, and Prediction. 2nd Edition. Springer.
IEMI (2024). Relatório Setorial da Indústria Têxtil Brasileira 2024. Instituto de Estudos e Marketing Industrial.
INDIAN TEXTILE JOURNAL (2024). Yarn Quality Parameters and Their Impact on Fabric Properties. Monthly Technical Review, 34(8), 45-52.
INSPEÇÃO (2025). Análise Preditiva em Processos Industriais. Revista de Controle de Qualidade Industrial, 12(1), 23-31.
JAMES, G., WITTEN, D., HASTIE, T., & TIBSHIRANI, R. (2013). An Introduction to Statistical Learning with Applications in R. Springer.
JOLLIFFE, I. T. (2002). Principal Component Analysis. 2nd Edition. Springer.
MACQUEEN, J. (1967). “Some methods for classification and analysis of multivariate observations”. Proceedings of the Fifth Berkeley Symposium on Mathematical Statistics and Probability, 1, 281-297.
MATHANGADEERA, R. W., HEQUET, E. F., KELLY, B., DEVER, J. K., & KELLY, C. M. (2020). “Importance of cotton fiber elongation in fiber processing”. Industrial Crops and Products, 147, 112217.
MONTGOMERY, D. C. (2012). Introduction to Statistical Quality Control. 7th Edition. John Wiley & Sons.
NEOWAY (2025). Machine Learning Applications in Manufacturing Process Optimization. Industrial Analytics Quarterly, 7(2), 112-125.
PEDREGOSA, F., VAROQUAUX, G., GRAMFORT, A., ET AL. (2011). “Scikit-learn: Machine Learning in Python”. Journal of Machine Learning Research, 12, 2825-2830.
PROVOST, F. & FAWCETT, T. (2013). Data Science for Business: What You Need to Know about Data Mining and Data-Analytic Thinking. O’Reilly Media.
TEXTILE SCHOOL (2023). Fundamentals of Yarn Sizing and Preparation. Technical Publication Series, Vol. 15.
YILDIRIM, P., BIRANT, D., & ALPYILDIZ, T. (2018). “Data mining and machine learning in textile industry”. Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery.


Resumo executivo oriundo de Trabalho de Conclusão de Curso de Especialização em Data Science e Analytics do MBA USP/Esalq

Saiba mais sobre o curso; clique aqui:

Quem editou este artigo

Você também pode gostar

Quer ficar por dentro das nossas últimas publicações? Inscreva-se em nossa newsletter!

Receba conteúdos e fique sempre atualizado sobre as novidades em gestão, liderança e carreira com a Revista E&S.

Ao preencher o formulário você está ciente de que podemos enviar comunicações e conteúdos da Revista E&S. Confira nossa Política de Privacidade