Resumo Executivo

21 de maio de 2026

Automação MLOps para Predição de Conforto Térmico

Marlon Resende Faria; Ariel da Silva Dias

Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.

O avanço exponencial da inteligência artificial transformou diversas áreas, desde a medicina até a engenharia, impulsionando a necessidade de abordagens mais eficientes para o desenvolvimento e a gestão de modelos de aprendizado de máquina. Nesse cenário, o Machine Learning Operations emerge como uma disciplina fundamental, integrando práticas de Development and Operations e Continuous Integration/Continuous Delivery para otimizar o ciclo de vida dos projetos de inteligência artificial (Kreuzberger, 2023). A integração dessas metodologias visa promover maior colaboração e agilidade entre equipes de desenvolvimento de software e operações de tecnologia da informação, garantindo que as alterações de código sejam testadas e implementadas de forma rápida e confiável (Kim, 2018). A aplicação desses princípios adapta a automação, a reprodutibilidade e a escalabilidade para o universo do aprendizado de máquina, abrangendo desde a coleta e preparação de dados até o treinamento, validação, implantação e monitoramento contínuo dos modelos em produção.

A relevância da automação no ciclo de vida de modelos preditivos torna-se evidente ao considerar a complexidade dos dados ambientais e biológicos. O estudo do conforto térmico em ambientes urbanos exige a análise de variáveis meteorológicas e subjetivas, coletadas por meio de instrumentação rigorosa e questionários aplicados à população. A gestão desses dados requer um processo minucioso de limpeza e balanceamento, garantindo que os modelos sejam treinados com informações representativas da realidade observada. A implementação de uma esteira automatizada permite que o fluxo de dados, desde a entrada bruta até a disponibilização de uma interface de programação de aplicações para inferência, ocorra de maneira estruturada e auditável.

A fundamentação teórica para a construção de sistemas de aprendizado de máquina robustos baseia-se na capacidade de rastreamento e versionamento. O ecossistema de ferramentas disponíveis para a linguagem Python oferece suporte para alcançar esses objetivos, facilitando a experimentação e o ajuste de hiperparâmetros (Ali, 2020). A utilização de plataformas para o gerenciamento centralizado de conjuntos de dados, fluxos de processamento e modelos assegura a governança necessária em projetos de larga escala (Zaharia et al., 2018). Assim, a justificativa para o desenvolvimento de uma infraestrutura de operações de aprendizado de máquina reside na necessidade de mitigar riscos operacionais e acelerar a entrega de valor por meio de modelos preditivos de alta fidelidade.

O desenvolvimento da infraestrutura operacional utilizou a linguagem Python 3, amplamente adotada devido à sua flexibilidade e vasta coleção de bibliotecas de código aberto. O controle de versão e o armazenamento dos dados ocorreram por meio do GitHub, garantindo a rastreabilidade necessária para a organização do projeto (GitHub Inc., 2024). Para o processamento e a análise exploratória, foram empregadas as bibliotecas Pandas e Scikit-learn, assegurando qualidade e consistência nas etapas de transformação dos dados (Pandas, 2020; Pedregosa et al., 2011). A orquestração do fluxo de treinamento foi implementada com o auxílio das ferramentas PyCaret e ClearML, que facilitaram a comparação de algoritmos e o versionamento dos artefatos gerados.

Os dados empregados foram coletados originalmente em Santa Maria, RS, em um local central e de grande fluxo, representativo do clima regional. A coleta ocorreu na Praça Saldanha Marinho durante três períodos sazonais: agosto de 2015, janeiro de 2016 e julho de 2016. A instrumentação meteorológica utilizou uma estação móvel Campbell CR-1000, equipada com sensores calibrados para registrar temperatura do ar, umidade relativa, velocidade e direção do vento, além de radiação solar global e temperatura de globo negro. Paralelamente, foram aplicados questionários baseados na norma ISO 10551, adaptada para o contexto local, envolvendo residentes com idade entre 18 e 60 anos (Monteiro, 2008). O questionário investigou a percepção térmica dos participantes em uma escala de sete pontos, variando de muito frio a muito quente.

O processamento dos dados envolveu a análise de 1720 linhas e 16 colunas, revelando a presença de valores ausentes em variáveis críticas como vestimenta, radiação solar e respostas subjetivas. Para lidar com as lacunas nas perguntas dos participantes, adotou-se a imputação com o último valor válido, assumindo que a proximidade temporal das coletas, realizadas em intervalos de 10 minutos, mantinha condições climáticas e percepções semelhantes. Para as variáveis de radiação solar média e total, utilizou-se uma combinação de média móvel e interpolação, técnica adequada para preencher dados que apresentam sazonalidade diária conforme a posição do sol (Gueymard, 2014). A variável de temperatura de bulbo úmido foi estimada por meio de uma equação que relaciona a temperatura do ar e a umidade relativa (Stull, 2011).

A preparação para a modelagem incluiu a transformação de variáveis categóricas, como o sexo dos entrevistados, utilizando a técnica de One-Hot Encoding para permitir a interpretação pelos algoritmos. A normalização e a padronização foram aplicadas para garantir que as variáveis estivessem na mesma escala, evitando que atributos com maiores magnitudes dominassem o treinamento, o que é crucial para algoritmos sensíveis como máquinas de vetores de suporte e redes neurais (Bishop, 2006; Han, Kamber & Pei, 2011). A seleção de características priorizou as médias climatológicas, descartando valores máximos e mínimos para reduzir a redundância. O desbalanceamento da variável alvo, referente ao conforto térmico, exigiu a aplicação da técnica SVM-SMOTE, que gera amostras sintéticas para as classes minoritárias, melhorando o desempenho dos modelos de classificação.

A esteira de integração e entrega contínua foi configurada utilizando o GitHub Actions, que dispara fluxos automatizados a cada alteração no repositório (Fowler & Foley, 2010). O controle de qualidade do código foi realizado por ferramentas de formatação e análise estática, como Black, isort e Flake8, enquanto a segurança foi verificada pelas bibliotecas Bandit e Audit. A cobertura de testes foi monitorada pelo Codecov, garantindo que as funções isoladas e as interações entre módulos fossem validadas. Para a execução em nuvem, utilizou-se o Docker para a criação de contêineres, permitindo que a aplicação fosse implantada no Google Cloud Run por meio de uma interface de programação de aplicações baseada no framework FastAPI (Ramírez, 2025).

A análise dos dados climatológicos revelou agrupamentos distintos, especialmente em relação à temperatura e umidade, que são as variáveis mais significativas para os modelos de conforto térmico. Observou-se um comportamento linear e inversamente correlacionado entre essas variáveis, com padrões bem definidos para cada período de coleta. Em contraste, as variáveis biológicas, como idade e peso, não apresentaram agrupamentos claros, sugerindo uma distribuição aleatória da população amostrada ao longo do tempo. O histograma da variável de percepção térmica evidenciou uma concentração de respostas na classe neutra, o que justifica a necessidade de técnicas de balanceamento para evitar que os modelos ignorem as sensações extremas de frio ou calor.

Nos modelos de regressão, os algoritmos lineares demonstraram estabilidade e erros reduzidos. A regressão linear alcançou um coeficiente de determinação de 0,556, com erro absoluto médio de 0,730 e tempo de treinamento de 0,138 s. Resultados semelhantes foram obtidos pelos modelos Ridge e Bayesian Ridge, ambos com coeficiente de determinação de 0,556. Algoritmos baseados em conjuntos, como o Gradient Boosting Regressor e o Random Forest Regressor, apresentaram coeficientes de determinação ligeiramente inferiores, situando-se em 0,507 e 0,499, respectivamente, apesar de reduzirem o erro quadrático médio para valores próximos a 0,950. O desempenho da regressão linear superou resultados de estudos anteriores na mesma área temática (Salata et al., 2016).

Para a tarefa de classificação, a avaliação inicial indicou uma acurácia geral baixa, inferior a 41%. O modelo de regressão logística obteve o melhor resultado inicial com 0,404 de acurácia, mas apresentou uma área sob a curva nula devido ao desbalanceamento severo dos dados. Após a aplicação da técnica SVM-SMOTE e a otimização de hiperparâmetros, o classificador Random Forest atingiu uma acurácia final de 0,44. O tempo de execução para todos os modelos de classificação manteve-se abaixo de 1,5 s, o que demonstra a viabilidade técnica para aplicações em tempo real. A utilização da matriz de confusão permitiu identificar que a maior dificuldade dos modelos reside na distinção entre classes adjacentes de percepção térmica, dada a subjetividade inerente às respostas humanas.

A implementação da plataforma ClearML permitiu o rastreamento completo dos experimentos, vinculando cada modelo aos seus respectivos conjuntos de dados e parâmetros de treinamento. A arquitetura da esteira foi organizada em entidades de conjuntos de dados, fluxos de processamento e projetos, facilitando a colaboração e a reprodutibilidade. No entanto, a maturidade da ferramenta apresentou desafios, como documentação incompleta e alterações frequentes na interface de programação de aplicações, o que exigiu ajustes constantes no código de integração. O uso de decoradores para converter funções Python em tarefas automatizadas mostrou-se eficiente, embora a associação entre diferentes componentes do fluxo não ocorra de forma automática, exigindo a gestão manual de identificadores únicos.

A infraestrutura de entrega contínua demonstrou ser uma solução eficaz para automatizar o ciclo de vida do projeto. A execução de testes de integração validou a comunicação entre os módulos de processamento de dados e o treinamento dos modelos, consolidando a confiabilidade do sistema. A adoção do Google Cloud Run como ambiente de produção ofereceu vantagens significativas, como a escalabilidade automática conforme a demanda de requisições e a redução de custos operacionais, uma vez que a cobrança é proporcional ao uso. A integração nativa com contêineres Docker facilitou a portabilidade do modelo, permitindo que a interface de programação de aplicações respondesse com baixo tempo de latência para aplicações externas.

As limitações encontradas no estudo referem-se principalmente ao forte desbalanceamento dos dados originais e à cobertura geográfica restrita à região de Santa Maria. A subjetividade das respostas nos questionários introduz um ruído que dificulta a obtenção de acurácias elevadas em modelos de classificação. Além disso, a configuração inicial dos fluxos de trabalho exigiu um cuidado rigoroso com arquivos de configuração, cuja sintaxe rígida aumentou a probabilidade de erros durante as fases iniciais de desenvolvimento. O uso de executores hospedados no GitHub também apresentou limitações de recursos computacionais, sugerindo que para treinamentos de maior porte seria mais vantajoso o uso de máquinas locais ou instâncias dedicadas na nuvem.

Apesar dos desafios, a esteira desenvolvida oferece uma base robusta para a reavaliação contínua dos modelos. A capacidade de versionar não apenas o código, mas também os dados e os modelos, garante que qualquer previsão possa ser auditada e reproduzida. A automação das etapas de limpeza e imputação reduz a incidência de erros manuais e acelera o ciclo de desenvolvimento. Para pesquisas futuras, recomenda-se a expansão do conjunto de dados com coletas em diferentes zonas climáticas e a exploração de técnicas de aprendizado profundo, que podem capturar nuances mais complexas nas variáveis ambientais. A integração de recursos de monitoramento de desvio de dados em produção também representaria um avanço importante para garantir a longevidade e a precisão das previsões de conforto térmico em ambientes urbanos dinâmicos.

Conclui-se que o objetivo foi atingido por meio da implementação bem-sucedida de uma esteira operacional que integra ciência de dados, engenharia de software e infraestrutura de nuvem para a automação do ciclo de vida de modelos de conforto térmico. A utilização de ferramentas como ClearML e GitHub Actions assegurou a reprodutibilidade e a escalabilidade do processo, permitindo que modelos de regressão linear atingissem um coeficiente de determinação de 0,556 e classificadores fossem otimizados para lidar com dados desbalanceados. O sistema desenvolvido representa um avanço na construção de fluxos de trabalho auditáveis e eficientes, proporcionando uma estrutura sólida para a gestão de modelos preditivos em ambientes de produção.

Referências Bibliográficas:

Ali, Moez. PyCaret: An open-source, low-code machine learning library in Python. 2020. Disponível em: https://PyCaret.org. Acesso em: 19 out. 2024.

Bishop, C. M. Pattern Recognition and Machine Learning. New York: Springer, 2006.

Fowler, Martin; FOLEY, Jez. Continuous Delivery: reliable software releases through build, test, and deployment automation. Addison-Wesley, 2010.

Github Inc. GitHub Documentation. 2024. Disponível em: https://docs.github.com. Acesso em: 19 out. 2024.

Gueymard, C. A. A review of validation methodologies and statistical performance indicators for modeled solar radiation data: Towards a better bankability of solar projects. Renewable and Sustainable Energy Reviews, 39, 1024-1034, 2014.

Han, J.; KAMBER, M.; Pei, J. Data Mining: Concepts and Techniques. 3. ed. Burlington: Morgan Kaufmann, 2011.

Kim, Gene et al. The Phoenix Project: A novel about IT, DevOps, and helping your business win. 3. ed. Portland: IT Revolution Press, 2018.

Kreuzberger, Dominik; KÜHL, Niklas; HIRSCHL, Sebastian. Machine Learning Operations (MLOps): Overview, Definition, and Architecture. IEEE Access, v. 11, 2023.

Monteiro, Leonardo Marques. Modelos preditivos de conforto térmico: quantificação de relações entre variáveis microclimáticas e de sensação térmica para avaliação e projeto de espaços abertos. 2008. Tese FAU-SUP, São Paulo, SP, Brasil.

Pandas Development Team. Pandas Documentation. Versão 1.0.0, 2020. Disponível em: https://pandas.pydata.org. Acesso em: 19 out. 2024.

Pedregosa, F. et al. Scikit-learn: Machine Learning in Python. Journal of Machine Learning Research, v. 12, p. 2825-2830, 2011. Disponível em: https://scikit-learn.org. Acesso em: 19 out. 2024.

Ramírez, Sebastián (Tiangolo). FastAPI: framework, high performance, easy to learn, fast to code, ready for production. Disponível em: https://fastapi.tiangolo.com/. Acesso em: 30 set. 2025.

Salata, F.; Golasi, I.; De Lieto, V. R.; De Lieto, V. A. Outdoor thermal comfort in the Mediterranean area: a transversal study in Rome, Italy. Building and Environment, v. 96, p. 46–61, 2016.

Stull, R. Wet-Bulb Temperature from Relative Humidity and Air Temperature. Journal of Applied Meteorology and Climatology, 50(11), 2267-2269, 2011 DOI: 10.1175/JAMC-D-11-0143.1.

Zaharia, M. et al. MLflow: A platform for managing the machine learning lifecycle. 2018. Disponível em: https://mlflow.org. Acesso em: 19 out. 2024.

Resumo executivo oriundo de Trabalho de Conclusão de Curso da Especialização em Engenharia de Software do MBA USP/Esalq

Para saber mais sobre o curso, clique aqui e acesse a plataforma MBX Academy

Quem editou este artigo

Mais recentes

Você também pode gostar

Quer ficar por dentro das nossas últimas publicações? Inscreva-se em nossa newsletter!

Receba conteúdos e fique sempre atualizado sobre as novidades em gestão, liderança e carreira com a Revista E&S.

Ao preencher o formulário você está ciente de que podemos enviar comunicações e conteúdos da Revista E&S. Confira nossa Política de Privacidade