Imagem Previsão de demanda para insumos químicos no tratamento de água com Big Data e Analytics

10 de dezembro de 2025

Previsão de demanda para insumos químicos no tratamento de água com Big Data e Analytics

Autora: Anna Clara Labes Gonçalves — Orientador: Daniel de Souza Valotto

Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.

Este estudo investigou como modelos preditivos, baseados em Big Data e Analytics, podem prever a demanda de insumos químicos no tratamento de água de uma empresa alimentícia. O objetivo foi desenvolver e validar modelos estatísticos para antecipar o consumo de coagulante, alcalinizante, biocida e polímero, correlacionando-o com variáveis ambientais e operacionais. A finalidade foi criar uma ferramenta de suporte à decisão para otimizar o planejamento, aumentar a eficiência, reduzir custos e minimizar riscos associados à variabilidade da qualidade da água bruta.

A análise de grandes volumes de dados é fundamental para a tomada de decisão estratégica, promovendo ambientes produtivos mais eficientes (Senna e Ribeiro, 2023). No tratamento de água, Big Data e Analytics auxiliam no monitoramento em tempo real da qualidade da água e na identificação de anomalias (Hayachi, 2023). Embora estudos anteriores tenham explorado a automação da dosagem de químicos com Machine Learning para otimizar custos (Gomes, 2021), persiste uma lacuna na literatura: muitas abordagens são genéricas e falham em capturar especificidades sazonais e as interações complexas entre a qualidade da água bruta e a demanda por insumos de forma preditiva (Fuck et al., 2024).

Um desafio para a implementação desses modelos é a disponibilidade de dados históricos estruturados, já que muitas operações dependem de sistemas manuais (Jesus, 2023; Neves, 2018). Nesse contexto, modelos preditivos, que analisam dados históricos para identificar correlações e prever comportamentos futuros, surgem como solução para a tomada de decisão baseada em dados (Eidelwein, 2021). Sua capacidade de processar múltiplas fontes de informação pode levar a uma gestão de recursos mais eficiente e à redução de custos, embora exija atenção à qualidade dos dados (James et al., 2013). A modernização tecnológica no setor é impulsionada por diretrizes como a agenda ESG e o Novo Marco Legal do Saneamento no Brasil, que incentivam investimentos em tecnologias como Inteligência Artificial para decisões mais assertivas (Baudon, 2022).

A aplicação de modelos preditivos na cadeia de suprimentos é relevante, pois a gestão de insumos é crucial para a vantagem competitiva (Mota, 2022; Silva, 2022). Insumos químicos representam uma parcela significativa dos custos, e o tratamento de água, etapa crítica em muitas indústrias, tem seu custo operacional atrelado à qualidade da água bruta, que dita a quantidade de produtos necessários (Schenknecht, 2018; Damico, 2021).

A Portaria n° 888/2021 (Brasil, 2021) exige um controle rigoroso dos padrões de potabilidade, o que causa variações no consumo. Os insumos químicos podem representar até 26% do custo total de operação de uma Estação de Tratamento de Água (ETA), sendo a segunda maior despesa (Santos, 2023). Uma previsão de demanda precisa otimiza custos operacionais e minimiza impactos ambientais ao reduzir o desperdício. Este estudo visa fortalecer a transformação digital no setor, incentivando tecnologias que antecipem demandas e apoiem decisões estratégicas, abrindo caminho para futuros sistemas de dosagem automatizada.

A pesquisa é descritiva, com abordagem quantitativa, utilizando técnicas estatísticas para modelar as interações entre as variáveis numéricas (Gil, 2008; Prodanov e Freitas, 2013). O método adotado foi o Estudo de Caso, que permite uma investigação aprofundada de um fenômeno em seu contexto real (Yin, 2001). A pesquisa foi estruturada em quatro etapas: coleta de dados, pré-processamento, análise e visualização dos resultados.

Os dados foram coletados em uma empresa do setor alimentício, denominada Empresa X, que possui uma estação de tratamento de água. Foram obtidos dados históricos mensais de três anos (2022-2024) sobre qualidade da água bruta (pH, turbidez, condutividade), vazão de captação e consumo dos insumos (coagulante, alcalinizante, biocida e polímero). Embora a série temporal seja limitada, o volume foi considerado suficiente para a análise. Dados de precipitação foram obtidos do Departamento de Águas e Energia Elétrica de São Paulo (DAEE). O acesso aos dados foi protegido por um termo de confidencialidade.

Na segunda etapa, os dados foram limpos e pré-processados. Realizou-se a verificação de consistência para corrigir ou remover valores atípicos de lançamentos manuais, garantindo a confiabilidade do banco de dados. As unidades de medida do consumo de insumos foram padronizadas para permitir uma análise correlacional coerente. Os dados foram agrupados em base mensal, calculando-se as médias para os parâmetros de qualidade da água e vazão, e a soma para os índices pluviométricos, preparando o dataset para a modelagem.

Na terceira etapa, a análise dos dados foi realizada com o software STATS Studio. Uma análise estatística descritiva resumiu as características das variáveis. Foi gerada uma matriz de correlação de Pearson para identificar as relações lineares entre elas (Junior, 2009). Em seguida, aplicaram-se algoritmos de Machine Learning, iniciando com a regressão linear múltipla para modelar a relação entre as variáveis preditoras e o consumo de cada insumo (Montgomery et al., 2012; Coelho-Barros et al., 2008). Devido à natureza sazonal e temporal dos dados, o modelo SARIMAX (Seasonal AutoRegressive Integrated Moving Average with eXogenous factors) foi selecionado como a principal ferramenta de previsão, por sua capacidade de incorporar padrões sazonais e a influência de variáveis externas (Mendes, 2024; Silva, 2022). Os resultados foram integrados a um dashboard em Power BI para visualização e suporte à decisão.

A análise descritiva revelou que a condutividade apresentou variação moderada, com potencial para a modelagem do consumo de biocida. O pH mostrou baixa variabilidade, indicando que provavelmente não seria um fator preditivo relevante. A turbidez exibiu alta variabilidade e uma distribuição fortemente assimétrica, com valores extremos que influenciam diretamente o consumo de coagulantes (Triola, 2017). A vazão de captação apresentou uma distribuição regular. Quanto aos insumos, o consumo de polímero e alcalinizante variou pouco, enquanto o coagulante e o biocida apresentaram picos de consumo associados a variações na qualidade da água. A precipitação também mostrou alta variabilidade, confirmando seu impacto sobre a turbidez.

A matriz de correlação de Pearson confirmou que a turbidez apresentou correlação positiva com o consumo de coagulante (0,543), volume de captação (0,502) e, principalmente, com a precipitação (0,633). Observou-se forte correlação positiva entre o uso de coagulante e polímero (0,802), indicando sua aplicação conjunta. Uma correlação similar foi encontrada entre polímero e biocida (0,791). A condutividade mostrou correlação moderada com o uso de biocida (0,472), enquanto o pH apresentou correlação negativa com o coagulante (-0,183) e o biocida (-0,390), sugerindo que águas mais ácidas demandam maiores dosagens.

A regressão linear múltipla serviu como análise exploratória. Para o consumo de coagulante, as variáveis captação e chuva foram significativas, resultando em um modelo com R² de 0,496. Para o biocida, condutividade e chuva foram as preditoras mais relevantes, com R² de 0,375. O consumo de alcalinizante foi explicado por captação, chuva e pH, com R² de 0,402. O modelo para o polímero apresentou um R² baixo (0,112), explicado apenas pela precipitação. Os coeficientes de determinação, entre 0,11 e 0,49, indicaram a capacidade preditiva limitada dos modelos lineares, justificando a transição para o SARIMAX.

A modelagem com SARIMAX, implementada em Python, demonstrou ser mais robusta. A seleção dos melhores parâmetros (p, d, q) foi automatizada usando o Critério de Informação de Akaike (AIC) (Weiss e Göker, 2011). Para o coagulante, o modelo final, com as variáveis turbidez, captação e chuva, apresentou um AIC de 155,67 e previu consumos de 23,25, 22,25 e 21,16 toneladas para os três meses seguintes. O modelo para o biocida, considerando apenas o volume de captação como variável exógena, obteve um AIC de 155,27, com previsões de 18,73, 19,86 e 19,19 toneladas.

O modelo para o alcalinizante, que incluiu condutividade e chuva, alcançou um bom ajuste com AIC de 83,08, prevendo consumos de 3,57, 3,63 e 3,82 toneladas. O modelo de melhor desempenho foi o do polímero, que, utilizando apenas o pH como variável exógena, resultou em um AIC negativo de -122,03, indicando excelente ajuste. As previsões para o polímero foram de 0,194, 0,174 e 0,161 toneladas. A variável de captação foi a mais frequentemente significativa. A principal limitação foi a frequência mensal dos dados, que pode mascarar flutuações de curto prazo.

Para visualizar os resultados, foi desenvolvido um dashboard no Power BI, permitindo que os gestores acompanhem o histórico de consumo e as previsões de forma intuitiva (Filho, 2025). O dashboard exibe gráficos de linha com dados históricos e projeções, além de KPIs como o consumo total e a previsão para o mês seguinte. A funcionalidade de filtragem por período facilita o planejamento operacional e a tomada de decisão estratégica.

A discussão dos resultados reforça a validade da abordagem. Os achados estão alinhados com os de Zhang et al. (2019), que demonstraram a importância de integrar dados de qualidade da água e parâmetros operacionais para aprimorar a precisão dos modelos preditivos. Este trabalho também evidenciou que a combinação de variáveis ambientais (chuva, turbidez) e operacionais (vazão) aumenta a robustez das previsões. Os resultados corroboram com os de Wang et al. (2022), que também identificaram variáveis hidrológicas e de qualidade da água como determinantes para o consumo de coagulantes. Este trabalho demonstrou que o modelo SARIMAX é uma alternativa eficaz, convergindo para a conclusão de que a incorporação de variáveis exógenas é essencial para a precisão preditiva no tratamento de água.

Em síntese, a aplicação de modelos preditivos, especialmente o SARIMAX, demonstrou grande potencial para otimizar a gestão de insumos químicos. A análise evidenciou a forte influência de variáveis ambientais, como precipitação, e operacionais, como o volume de captação, sobre o consumo de produtos como coagulante e biocida. A integração desses modelos em um dashboard proporciona aos gestores uma ferramenta para o planejamento estratégico, permitindo antecipar demandas e otimizar estoques. O estudo apresenta limitações, como a base de dados restrita a um histórico de três anos com frequência mensal e a análise focada em uma única empresa. Fatores externos não mensurados, como qualidade dos insumos e manutenções, também podem influenciar o consumo.

Para trabalhos futuros, recomenda-se a ampliação da base de dados para incluir séries históricas mais longas e com maior granularidade, preferencialmente diária, para aprimorar a sensibilidade dos modelos. A expansão da análise para outras empresas e setores contribuiria para a robustez dos resultados. Sugere-se também a investigação de variáveis adicionais e a aplicação de outras técnicas de aprendizado de máquina para comparar o desempenho com o SARIMAX. Conclui-se que o objetivo foi atingido: investigou-se e demonstrou-se como os modelos preditivos podem contribuir para a previsão de demanda de insumos químicos no tratamento de água, fornecendo uma ferramenta robusta para o planejamento estratégico e otimização de recursos.

Referências:
BAUDON, P. IA, Big Data e IoT puxam investimentos no saneamento para atender à agenda ESG e ao Novo Marco Legal. ABES, 2022. Disponível em: https://abes. com. br/ia-big-data-e-iot-puxam-investimentos-no-saneamento-para-atender-a-agenda-esg-e-ao-novo-marco-legal/. Acesso em: 02 mar. 2025.
BRASIL. Portaria nº 888, de 4 de fevereiro de 2021. Estabelece os procedimentos e responsabilidades relativos ao controle da qualidade da água para consumo humano e seu padrão de potabilidade. Diário Oficial da União, Brasília, DF, 5 fev. 2021. Seção 1, p. 56.
COELHO-BARROS, E. A.; SIMÕES, P. A.; ACHCAR, J. A.; MARTINEZ, E. Z.; SHIMANO, A. C. Métodos de estimação em regressão linear múltipla: aplicação a dados clínicos. Revista Colombiana de Estadística, [S. l.], v. 31, n. 1, p. 111-129, 1 jun. 2008. Disponível em: https://www. kurims. kyoto-u. ac. jp/EMIS/journals/RCE/body/v31n1a07CoelhoEtAl. pdf. Acesso em: 16 maio 2025.
DAEE – Departamento de Águas e Energia Elétrica do Estado de São Paulo. Sistema de Informações Hidrológicas. Disponível em: http://ph. daee. sp. gov. br/Pluviometricos. Acesso em: 24 maio 2025.
DAMICO, A. C. Otimização da aplicação combinada de coagulante e polímero no tratamento de água destinada ao processo industrial. 2021. 96 f. Dissertação (Programa de Pós-Graduação em Engenharia Sanitária e Ambiental – Mestrado / Associação Ampla com UEPG) – Universidade Estadual do Centro-Oeste, Irati – PR. Disponível em: https://tede. unicentro. br/jspui/handle/jspui/1840. Acesso em: 15 mar. 2025.
DIEHL, C. A.; SOUZA, M. A. de; DOMINGOS, L. E. C. O USO DA ESTATÍSTICA DESCRITIVA NA PESQUISA EM CUSTOS: ANÁLISE DO XIV CONGRESSO BRASILEIRO DE CUSTOS. ConTexto – Contabilidade em Texto, Porto Alegre, v. 7, n. 12, 2009. Disponível em: https://seer. ufrgs. br/index. php/ConTexto/article/view/11157. Acesso em: 25 maio. 2025.
EIDELWEIN, R. MODELOS PREDITIVOS E PREDIÇÃO DE CHURN: ANALYTICS ALIADO À ADMINISTRAÇÃO. 2023. Trabalho de Conclusão de Curso (Bacharel em Administração) – UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL, Porto Alegre – RS, 2023.
FILHO, F. E. R. INDICADORES DE DESEMPENHO ESCOLAR: UMA ABORDAGEM BASEADA EM VISUALIZAÇÃO DE DADOS. Sobral: Universidade Federal do Ceará, 2025. Disponível em: https://repositorio. ufc. br/handle/riufc/80326. Acesso em: 07 ago. 2025.
FUCK, J. V. R.; CECHINEL, M. A. P.; NEVES, J.; ANDRADE, R. C. de; TRISTÃO, R.; SPOGIS, N.; RIELLA, H. G.; SOARES, C.; PADOIN, N. Predicting effluent quality parameters for wastewater treatment plant: A machine learning-based methodology. ELSEVIER, [S. l.], v. 352, 26 fev. 2024. DOI https://doi. org/10.1016/j. chemosphere.2024.141472. Disponível em: https://www. sciencedirect. com/science/article/abs/pii/S0045653524003655? CMXID=&SISID=&dgcid=STMJ219742AUTHSERVPA&utmacid=285460576&utmcampaign=STMJ219742AUTHSERVPA&utmin=DM450477&utmmedium=email&utmsource=AC. Acesso em: 15 mar. 2025.
GIL, A. C. Métodos e técnicas de pesquisa social. 6 ed. São Paulo: Atlas, 2008. ISBN 978-85-224-5142-5.
GOMES, M. Uso do Machine Learning para gestão e avaliação do processo de tratamento de resíduos. 2021. Trabalho de Conclusão de Curso (Engenharia Química) – Faculdade Anhanguera, Jacareí – SP, 2021. Disponível em: https://repositorio. pgsscogna. com. br/handle/123456789/40177. Acesso em: 2 mar. 2025.
HAYACHI, V. Y. Utilização do Big Data para questões ambientais: uma análise de viabilidade. 2023. Trabalho de Conclusão de Curso (Engenharia Ambiental) – Universidade Estadual Paulista (UNESP), Sorocaba – SP, 2023. Disponível em: https://repositorio. unesp. br/entities/publication/f81c7891-33e9-491e-ae53-16532cf0fc60. Acesso em: 2 mar. 2025.
INMET, Instituto Nacional De Meteorologia. DADOS HISTÓRICOS ANUAIS. INMET, 2025. Disponível em: https://portal. inmet. gov. br/dadoshistoricos. Acesso em: 22 fev. 2025.
JAMES, G. et al. An Introduction to Statistical Learning. Springer, 2013.
JESUS, E. S. Modelos de aprendizagem de máquina para previsão da demanda de água da Região Metropolitana de Salvador, Bahia. 2023. Dissertação de Mestrado (Ciência da Computação) – Universidade Federal da Bahia, Salvador – BA, 2023. Disponível em: https://abes-dn. org. br/anaiseletronicos/21silubesadownload/912tema_i. pdf. Acesso em: 2 mar. 2025.
LUCAS, E. C.; Yoshikuni, A. C.; Agustini, C. A. D.; Silva, V. A. B. (2025). Ainda estou aqui para prever: uma comparação entre SARIMA e SARIMAX para vendas sazonais de aves no Brasil. Revista Gestão & Tecnologia, vol. 25, n⁰ 3, p:98-118
MALDONADO, A. L. O. et al. SIMULAÇÃO DE E-COMMERCE COM PREVISÃO DE VENDAS: UM ESTUDO DE REGRESSÃO LINEAR E VISUALIZAÇÃO DE DADOS. SANTANA DE PARNAÍBA – SP: UNIVERSIDADE PAULISTA INSTITUTO DE CIÊNCIAS EXATAS E TECNOLOGIA, 2024.
MENDES, A. C. P. Métodos de aprendizagem estatística aplicados ao processamento de dados atmosféricos. Orientador: Prof. Dr. Eduardo Landulfo. 2024. Tese (Doutor em Ciências na Área de Tecnologia Nuclear) – UNIVERSIDADE DE SÃO PAULO, São Paulo, 2024. Disponível em: https://www. teses. usp. br/teses/disponiveis/85/85134/tde-01112024-172523/pt-br. php. Acesso em: 24 maio 2025.
MONTGOMERY, D. C.; PECK, E. A.; VINING, G. G. Introduction to Linear Regression Analysis. 5 ed. Wiley, 2012. ISBN 978-0-470-54281-1.
MOTA, M. C. Gestão Logística do Fluxo de Suprimentos no Setor de Automação Bancária de uma Empresa no Polo Industrial de Manaus. 2022. Dissertação de Mestrado – Instituto de Tecnologia e Educação Galileo da Amazônia – ITEGAM, Manaus – AM, 2022. Disponível em: https://bdtd.


Resumo executivo oriundo de Trabalho de Conclusão de Curso de Especialização em Digital Business do MBA USP/Esalq

Saiba mais sobre o curso; clique aqui:

Quem editou este artigo

Você também pode gostar

Quer ficar por dentro das nossas últimas publicações? Inscreva-se em nossa newsletter!

Receba conteúdos e fique sempre atualizado sobre as novidades em gestão, liderança e carreira com a Revista E&S.

Ao preencher o formulário você está ciente de que podemos enviar comunicações e conteúdos da Revista E&S. Confira nossa Política de Privacidade