
19 de fevereiro de 2026
Efetividade do modelo MQO na predição do tempo de atendimento bombeiro militar
Rogério Bubach; Gabrielle Maria Romeiro Lombardi
Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.
Este trabalho desenvolve um modelo preditivo com técnicas de aprendizado de máquina para estimar o tempo de atendimento, ou seja, o tempo de empenho de recursos operacionais do Corpo de Bombeiros Militar do Estado do Espírito Santo (CBMES). O estudo utiliza dados históricos de ocorrências registradas entre 2019 e 2023 na Região Metropolitana da Grande Vitória (RMGV). O modelo foi aplicado às categorias de maior incidência de chamados que envolveram o emprego de viaturas, visando fornecer uma ferramenta de apoio à decisão para aprimorar a alocação de recursos e a eficiência operacional.
O atendimento a emergências é uma atribuição crítica das organizações de segurança pública, exigindo gestão eficiente e decisões rápidas. O CBMES, por exemplo, realizou mais de 27 mil atendimentos em 2024, um número que ilustra a complexidade das operações. Os chamados abrangem incidentes como incêndios, colisões de trânsito, desastres naturais e emergências médicas, incluindo cenários como a pandemia de COVID-19 (Sharma et al., 2024). As centrais de operações coordenam o despacho de recursos distribuídos estrategicamente para garantir a proximidade com os locais de maior probabilidade de incidentes.
A gestão de recursos em emergências é desafiadora devido à sua finitude, uma realidade reforçada pela pandemia de COVID-19, que evidenciou a necessidade de otimização. Tradicionalmente, a gestão operacional se baseia em dois parâmetros: o tempo-resposta (intervalo entre o chamado e a chegada do recurso) e o tempo de atendimento (duração total do empenho do recurso). O tempo-resposta é o indicador mais utilizado, especialmente em ocorrências com risco à vida, pois uma chegada rápida aumenta as chances de sobrevivência. Contudo, a redução do tempo-resposta frequentemente exige investimentos significativos em infraestrutura, como a construção de novas unidades, o que nem sempre é viável (Jaldell et al., 2014).
Indicadores tradicionais como o tempo-resposta são reativos e insuficientes para apoiar decisões estratégicas de longo prazo. Atualmente, o CBMES não dispõe de modelos preditivos baseados em seu histórico de ocorrências para estimar o tempo de atendimento, o que dificulta a alocação eficiente de recursos. A questão central da pesquisa é: como predizer o tempo de empenho de recursos a partir das informações disponíveis no momento do chamado, utilizando dados históricos e aprendizado de máquina? A literatura indica que eventos emergenciais são condicionados por fatores geográficos, temporais e ambientais, permitindo a identificação de padrões para predizer sua duração (Mukhopadhyay et al., 2022).
Iniciativas internacionais aplicam aprendizado de máquina para a predição de incêndios (Walia et al., 2018; Ye et al., 2022) e acidentes de trânsito (Sharma et al., 2024), mas estudos focados na predição do tempo de atendimento para uma gama ampla de incidentes são escassos, especialmente no Brasil. O uso de modelos preditivos em segurança tem demonstrado resultados promissores na preservação de vidas e redução de custos (Yuan e Wylie, 2024). No contexto brasileiro, a aplicação de ciência de dados em atendimentos emergenciais é incipiente, com trabalhos focados em estatísticas descritivas ou análises espaciais (Bohm, 2022; Boaretto et al., 2017; Berti, 2017). Este estudo preenche essa lacuna, empregando algoritmos de aprendizado de máquina para prever o tempo de empenho, contribuindo para o avanço da ciência de dados no setor público e para o aprimoramento do processo decisório no CBMES. A abordagem de aprendizado de máquina oferece vantagens como a facilidade de construção de modelos e a capacidade de aprender com os dados para identificar padrões (Géron, 2021; Grus, 2021).
A metodologia seguiu o Processo Padrão Interindústrias para Mineração de Dados (CRISP-DM), um modelo de seis fases sequenciais e iterativas: Entendimento do Negócio, Entendimento dos Dados, Preparação dos Dados, Modelagem, Avaliação e Implementação (Shearer, 2000). Na fase de Entendimento do Negócio, o desafio foi otimizar o uso de recursos operacionais limitados do CBMES. A previsão do tempo de atendimento foi definida como ponto-chave para apoiar a gestão da disponibilidade das equipes. Os objetivos específicos foram verificar a viabilidade de um modelo preditivo, identificar as variáveis mais influentes e comparar o modelo com alternativas.
Os dados foram fornecidos pela Diretoria de Operações do CBMES, com um conjunto inicial de 213.044 registros de atendimentos entre 2017 e 2024. O estudo foi delimitado temporalmente (1º de janeiro de 2019 a 31 de dezembro de 2023) e geograficamente (Região Metropolitana da Grande Vitória – RMGV) para evitar distorções causadas por longos deslocamentos. Após pré-processamento, engenharia de variáveis e controle de valores extremos, o conjunto de dados final foi consolidado em 19.764 registros válidos de cinco unidades operacionais da RMGV. As variáveis selecionadas incluem informações operacionais (tempos, distâncias), geográficas (coordenadas), temporais (ano, mês, dia da semana) e categóricas (tipo de incidente, modalidade de guarnição).
A preparação dos dados, executada em Python no ambiente Anaconda Navigator, envolveu a importação e renomeação de colunas, aplicação de filtros, remoção de valores nulos e duplicados, e exclusão de registros inconsistentes. Foi realizada a engenharia de variáveis para derivar atributos como dia da semana e período do dia. Para lidar com a assimetria das distribuições numéricas, foram aplicadas transformações estatísticas. A redução de cardinalidade de variáveis categóricas foi conduzida com validação cruzada (KFold) para mitigar o sobreajuste, e a codificação One-Hot Encoding foi usada para variáveis de baixa cardinalidade. As variáveis numéricas foram padronizadas com StandardScaler para otimizar o desempenho do modelo. O tratamento de valores extremos (outliers) foi realizado por inspeção visual e remoção direta, uma abordagem prática para dados operacionais (Fávero e Belfiore, 2019).
A seleção das variáveis preditoras partiu de uma análise exploratória, incluindo visualização de histogramas, boxplots e cálculo de correlações de Pearson e Spearman. Para a seleção final, foi aplicado o procedimento passo-a-passo (stepwise), que adiciona ou remove variáveis com base em critérios de significância estatística para construir um modelo parcimonioso (Fávero e Belfiore, 2024). O modelo base foi o de Mínimos Quadrados Ordinários (OLS), que estima os parâmetros de uma regressão linear minimizando a soma dos quadrados dos resíduos (Andrade e Tiryaki, 2017). A validade do modelo OLS depende do atendimento a hipóteses como linearidade, homocedasticidade, normalidade e independência dos resíduos, cruciais para garantir que os estimadores sejam os melhores estimadores lineares não viesados (BLUE).
A análise descritiva dos dados revelou que os Atendimentos Pré-Hospitalares (APH) representam o maior volume, com redução gradual a partir de 2021. Incidentes de incêndio exibiram picos de oscilação, e os de salvamento mantiveram tendência estável. Em relação ao tempo médio de atendimento, os incidentes de salvamento demandaram mais tempo, superando três horas, indicando maior complexidade. Os atendimentos de APH foram os mais rápidos. Observou-se uma leve redução nos tempos médios de atendimento a partir de 2022 para todas as categorias, um indicativo de melhoria na eficiência operacional.
A análise exploratória das variáveis numéricas identificou distribuições com assimetria positiva acentuada, especialmente para tempoatendimento e temporesposta, violando a hipótese de normalidade. A transformação de Box-Cox apresentou o melhor desempenho para corrigir essa assimetria. A análise de correlação pós-transformação foi fundamental. A matriz de correlação de Pearson revelou uma correlação linear positiva muito forte (r = 0.95) entre o tempo de resposta e o tempo total de atendimento. A matriz de Spearman confirmou essa tendência (ρ = 0.67) e revelou outras associações, como o impacto da distância percorrida nos tempos operacionais.
Após a seleção de variáveis pelo procedimento stepwise, foi ajustado um modelo de regressão linear múltipla (OLS). O modelo inicial, com 13 variáveis, demonstrou um poder explicativo elevado, com R² ajustado de 0.923. O tempo de resposta normalizado emergiu como o preditor mais influente (β = 0.9358), seguido pela distância total percorrida. No entanto, testes diagnósticos indicaram forte assimetria na distribuição dos resíduos. Um modelo simplificado, com menos variáveis, manteve alta acurácia, reforçando a importância de fatores logísticos (tempo de resposta, distância) e contextuais (tipo de incidente, período do dia).
Para garantir a robustez, o modelo OLS foi comparado com a regressão robusta (RLM) e modelos não lineares como Random Forest e XGBoost. O modelo OLS superou as alternativas, apresentando o maior R² (0.930) e os menores erros de predição (MAE e RMSE). Esse resultado reforça a adequação do modelo linear para este problema, oferecendo a vantagem da interpretabilidade, crucial para a gestão pública, pois permite que gestores compreendam o impacto de cada variável.
A validação do modelo OLS exigiu a verificação de seus pressupostos. A análise do gráfico de resíduos versus valores ajustados revelou um padrão em forma de funil, indicando heterocedasticidade (variância não constante dos erros), confirmada pelo teste de Breusch-Pagan. A violação desse pressuposto compromete a confiabilidade dos testes de significância. Para corrigir o problema, foram utilizados erros-padrão robustos à heterocedasticidade (HC3), que ajustam a inferência estatística sem alterar os coeficientes. Adicionalmente, 814 observações altamente influentes, detectadas pela distância de Cook, foram removidas para aprimorar o ajuste.
O modelo final, ajustado com erros-padrão robustos (HC3) e após a remoção de outliers influentes, apresentou um R² de 0.967. Os resultados confirmaram que o tempo de resposta (β = 0.9321) é o fator de maior impacto, seguido pela distância total percorrida (β = 0.1185). Variáveis como modalidade de guarnição e tipo de ocorrência (salvamentos) também se mostraram estatisticamente significativas. O teste de Fator de Inflação da Variância (VIF) indicou ausência de multicolinearidade relevante. Embora a análise final dos resíduos ainda mostrasse desvio da normalidade, o uso de erros-padrão robustos assegura a validade inferencial do modelo.
A forma funcional do modelo preditivo final para o tempo de atendimento normalizado (tempoatendimentonorm) foi estabelecida como: tempoatendimentonorm = -0,2931 + 0,9321 temporespostanorm + 0,1185 kmtotalnorm + 0,0471 periododiamanha + 0,0441 periododiatarde + 0,0290 classeincidSALVAMENTO – 0,0079 classeincidINCÊNDIO + 0,0965 modalguarnicaote. Esta equação quantifica como cada variável contribui para a estimativa do tempo de empenho, fornecendo uma base para o planejamento de emergências.
O estudo demonstrou a alta capacidade preditiva do modelo OLS para estimar o tempo de atendimento do CBMES. Fatores logísticos, como tempo de resposta e distância, são os principais determinantes da duração do empenho. O modelo final, ajustado com erros-padrão robustos (HC3), apresentou excelente predição (R² = 0.967) e se mostrou estatisticamente confiável, apesar da violação de alguns pressupostos. As variáveis temporespostanorm, kmtotalnorm, período do dia, classe de incidente e modalidade de guarnição foram as mais relevantes. A superioridade do OLS sobre alternativas como Random Forest e XGBoost ressalta sua adequação, combinando desempenho com transparência.
A implementação deste modelo oferece ao CBMES uma ferramenta quantitativa para otimizar a alocação de recursos e melhorar o planejamento operacional. Embora o modelo seja robusto, a heterocedasticidade residual sugere que pesquisas futuras poderiam explorar alternativas como Mínimos Quadrados Ponderados (WLS) ou Modelos Lineares Generalizados (GLM). Conclui-se que o objetivo foi atingido: demonstrou-se que o modelo de Mínimos Quadrados Ordinários, com as devidas correções para heterocedasticidade, é eficaz para predizer o tempo de atendimento do CBMES, identificando as variáveis preditoras mais relevantes para a gestão de recursos.
Referências:
Andrade, C. S. M.; Tiryaki, G. F. 2017. Econometria na prática. Alta Books, Rio de Janeiro, RJ, Brasil.
Berti, C. B. 2017. Modelo preditivo de situações como apoio à consciência situacional e ao processo decisório em sistemas de resposta à emergência. Tese de Doutorado em Ciência da Computação. Universidade Federal de São Carlos, São Carlos, SP, Brasil.
Boaretto, M. A. R.; Busatto, R.; Dos Santos Coelho, L. 2017. Abordagens de aprendizado de máquina aplicados aplicadas na classificação da ocorrência de incêndios. Disponível em: http://www. din. uem. br/~ademir/sbpo/sbpo2017/pdf/168131. pdf. Acesso em: 10 set. 2024.
Bohm, I. G. K. 2022. Antecipação de emergências utilizando técnicas baseadas em séries temporais e aprendizado de máquina. Trabalho de Conclusão de Curso em Sistemas de Informação. Universidade Federal de Santa Catarina, Florianópolis, SC, Brasil. Disponível em: https://repositorio. ufsc. br/handle/123456789/237958. Acesso em: 20 set. 2024.
Corpo de Bombeiros do Espírito Santo [CB – ES]. Unidades. Disponível em: https://cb. es. gov. br/unidades. Acesso em: 15 jan. 2025.
Espírito Santo. 1989. Constituição do estado do Espírito Santo. Assembleia Legislativa do Estado do Espírito Santo, Vitória, ES, Brasil. Disponível em: https://www3. al. es. gov. br/legislacao/norma. aspx? id=33122. Acesso em: 20 set. 2024.
Fávero, L. P.; Belfiore, P. 2024. Manual de análise de dados: Estatística e machine learning com Excel®, SPSS®, Stata®, R® E Python®. 2ed. LTC, Rio de Janeiro, RJ, Brasil.
Fávero, L. P. L.; Belfiore, P. P. 2019. Data science for business and decision making. Elsevier, Cambridge, USA.
Géron, A. 2021. Mãos À Obra: Aprendizado de máquina com Scikit-Learn, Keras & TensorFlow: Conceitos, ferramentas e técnicas para a construção de sistemas inteligentes. 2ed. Alta Books, Rio de Janeiro, RJ, Brasil.
Grus, J. 2021. Data Science Do Zero: Noções fundamentais com python. 2ed. Alta Books, Rio de Janeiro, RJ, Brasil.
Jaldell, H.; Lebnak, P.; Amornpetchsathaporn, A. 2014. Time is money, but how much? the monetary value of response time for thai ambulance emergency services. Value In Health 17(5): 555-560. Disponível em: https://doi. org/10.1016/j. jval.2014.05.006. Acesso em: 02 out. 2024.
Klosterman, S. 2020. Projetos de ciência de dados com python: Abordagem de estudo de caso para a criação de projetos de ciência de dados bem-sucedidos usando python, pandas e scikit-learn. Novatec, São Paulo, SP, Brasil.
Marquesone, R. 2017. Big Data: Técnicas e tecnologias para extração de valor dos dados. Disponível em: https://
Resumo executivo oriundo de Trabalho de Conclusão de Curso de Especialização em Data Science e Analytics do MBA USP/Esalq
Saiba mais sobre o curso; clique aqui:






































