Resumo Executivo

22 de abril de 2026

IA na Análise de Indicadores Elétricos: Caso Bragança Paulista

Eduardo Geike de Andrade; Marcelo Shaidmann Junqueira

Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.

A qualidade no fornecimento de energia elétrica constitui uma das principais preocupações estratégicas no cenário brasileiro, dada a dependência estrutural da sociedade e da economia em relação a esse insumo. A Agência Nacional de Energia Elétrica (ANEEL) desempenha um papel fundamental na regulação e supervisão do setor, estabelecendo parâmetros rigorosos para monitorar o desempenho das distribuidoras. Entre os principais indicadores regulatórios destacam-se a Duração Equivalente de Interrupção por Unidade Consumidora (DEC) e a Frequência Equivalente de Interrupção por Unidade Consumidora (FEC), que mensuram, respectivamente, o tempo médio e a quantidade de vezes que os consumidores enfrentam interrupções no fornecimento (Agência Nacional de Energia Elétrica [ANEEL], 2022). A interpretação precisa desses dados é vital para que as empresas identifiquem falhas operacionais, cumpram normas vigentes e evitem penalidades financeiras severas. Dados recentes indicam que a média de interrupção para o consumidor brasileiro atingiu 10,24 horas no ano de 2024, o que reforça a necessidade de métodos de gestão mais ágeis e inteligentes (Portal Solar, 2024).

A complexidade inerente ao setor elétrico, aliada ao volume massivo de dados gerados diariamente pelas redes de distribuição, impõe desafios significativos para a análise manual tradicional. Nesse contexto, a Inteligência Artificial (IA) surge como uma tecnologia capaz de potencializar a eficiência operacional e a sustentabilidade do sistema (Justino et al., 2020). A trajetória da IA como campo científico consolidado remonta à década de 1950, fundamentada nos trabalhos pioneiros de Alan Turing e John McCarthy, evoluindo significativamente com o advento do aprendizado de máquina (machine learning), do aprendizado profundo (deep learning) e do processamento de linguagem natural (PLN) (Russell e Norvig, 2021). Tais avanços transformaram a IA em uma ferramenta acessível para setores de missão crítica, permitindo a emulação de capacidades humanas para interpretar e agir sobre conjuntos de dados complexos (Keswani, 2013).

A integração da IA nas estratégias de inovação das distribuidoras visa modernizar processos e aumentar a confiabilidade das operações. No segmento de comercialização, por exemplo, algoritmos de aprendizado de máquina já são empregados para projetar variáveis críticas, como o preço horário de liquidação das diferenças, permitindo decisões comerciais mais assertivas (Santos et al., 2022). A habilidade de converter grandes volumes de dados em percepções acionáveis tornou-se um diferencial competitivo essencial em ambientes de alta complexidade (Baesens, 2014). A ciência de dados aplicada aos negócios fundamenta-se em análises estatísticas robustas e evidências empíricas, onde tecnologias de PLN e machine learning ocupam papel central na construção de sistemas de apoio à decisão (Fávero e Belfiore, 2019; Sharda, Delen e Turban, 2018). Organizações que estruturam seus processos em torno de análises automatizadas e integradas ao fluxo de trabalho são classificadas como orientadas por dados, obtendo ganhos expressivos em assertividade (Watson, 2012).

Recentemente, a emergência da IA generativa, exemplificada por modelos de linguagem de grande escala, impulsionou uma nova onda de inovação ao permitir que profissionais de áreas não técnicas interajam com sistemas analíticos complexos por meio da linguagem natural. Esse fenômeno, associado ao conceito de vibe coding, representa o uso colaborativo e iterativo de ferramentas de IA por indivíduos sem formação profunda em programação tradicional (Google Cloud, 2024). Diante desse panorama, torna-se relevante investigar como o PLN pode ser aplicado na análise de indicadores de continuidade do fornecimento de energia elétrica, especificamente no município de Bragança Paulista, São Paulo, visando fornecer constatações claras e reprodutíveis a partir de dados históricos.

A fundamentação metodológica deste estudo baseia-se em uma pesquisa aplicada, com abordagem quantitativa e exploratória, estruturada sob a forma de um estudo de caso. Essa escolha justifica-se pela necessidade de investigar fenômenos contemporâneos dentro de seu contexto operacional real, permitindo uma análise profunda e contextualizada da distribuição de energia (Yin, 2015; Gil, 2022). O foco da investigação recai sobre o conjunto elétrico 16142, operado pela concessionária Energisa Sul-Sudeste no município de Bragança Paulista, abrangendo o período entre os anos 2022 e 2023. Os dados utilizados são de natureza pública, obtidos diretamente no Portal de Dados Abertos da ANEEL, incluindo as bases de indicadores de continuidade, interrupções de energia e limites regulatórios anuais (Agência Nacional de Energia Elétrica [ANEEL], 2024).

O processo operacional de tratamento dos dados enfrentou o desafio do volume excessivo das bases originais, que frequentemente ultrapassam 3 GB em formato CSV, dificultando o manuseio por ferramentas convencionais. Para superar essa barreira, utilizou-se a IA generativa para a criação de scripts automatizados em linguagem Python. O desenvolvimento desses scripts ocorreu por meio de prompts iterativos no modelo GPT-4, seguindo princípios de refinamento de instruções para garantir a precisão do código gerado (OpenAI, 2023). O script de filtragem foi configurado para operar em ambiente Python 3.11.3, utilizando bibliotecas como pandas 2.0.3 para manipulação de dados, o módulo csv para leitura eficiente e a biblioteca chardet 5.2.0 para detecção automática de codificação de caracteres, garantindo compatibilidade com formatos UTF-8 e Latin1.

A lógica do script de filtragem envolveu quatro etapas fundamentais: a leitura dos arquivos pesados com tolerância a erros de codificação, a detecção da coluna de identificação do conjunto consumidor, a aplicação de um filtro lógico específico para o código 16142 e a escrita dos resultados em novos arquivos menores e legíveis. Após a obtenção dos dados filtrados, procedeu-se à investigação estatística organizada em quatro frentes analíticas: exploração temporal do DEC e FEC, comparação entre anos, avaliação da conformidade regulatória e estudo das causas operacionais. Para cada uma dessas frentes, solicitou-se à IA a geração de códigos específicos que integrassem bibliotecas científicas reconhecidas, como matplotlib 3.7.1 e seaborn 0.12.2 para visualização, scipy 1.11.1 para testes de hipóteses e statsmodels 0.14.0 para modelagem econométrica.

A análise descritiva univariada foi a etapa inicial para estabelecer um panorama geral do comportamento dos indicadores e detectar padrões sazonais ou valores atípicos. Cálculos de média, desvio-padrão e valores extremos foram realizados para visualizar a dispersão e a tendência central, conforme recomendado para estudos aplicados (Montgomery e Runger, 2019). A representação visual, por meio de gráficos de linha, histogramas e barras empilhadas, facilitou a interpretação da evolução mensal e da distribuição de frequências, auxiliando na descoberta de padrões e identificação de desvios (Few, 2012). Para a comparação entre as médias mensais dos anos 2022 e 2023, aplicou-se o teste t de Welch, técnica indicada quando as variâncias dos grupos são heterogêneas ou os tamanhos amostrais são desiguais.

A relação entre a frequência das interrupções e sua duração total foi mensurada por meio da correlação linear de Pearson. Essa técnica é essencial para avaliar se as variáveis técnicas se correlacionam operacionalmente, permitindo verificar a força e a direção de uma relação linear (Hair et al., 2018). Paralelamente, realizou-se o cruzamento dos dados com os limites regulatórios estipulados no Módulo 8 do PRODIST, onde os limites para o conjunto analisado foram definidos em DEC inferior ou igual a 9 horas anuais e FEC inferior ou igual a 10 interrupções anuais. Essa verificação é crucial para mensurar o risco regulatório e a possibilidade de penalidades tarifárias.

A classificação das causas de interrupção exigiu um processamento de linguagem natural para transformar dados qualitativos em categorias mensuráveis. Extraíram-se as descrições das ocorrências emergenciais, que foram categorizadas em cinco grupos temáticos: Vento, Vegetação, Defeito, Manutenção e Outros, seguindo princípios de análise de conteúdo (Bardin, 2016). Com os dados categorizados, aplicou-se a análise de variância (ANOVA) de fator único para testar se a causa dominante em cada mês influenciava significativamente as médias de DEC. Segundo a teoria estatística, a ANOVA é apropriada para comparar três ou mais grupos categóricos (Field, 2013). Por fim, construiu-se um modelo de regressão linear múltipla para quantificar o impacto individual de cada causa sobre o indicador de duração, permitindo estimar o efeito marginal de cada variável explicativa enquanto se controla os demais fatores (Wooldridge, 2019). Todo o processo foi acompanhado de revisão manual e validação humana para garantir a integridade dos achados.

Os resultados obtidos para o conjunto 16142 em Bragança Paulista revelaram que o DEC mensal variou entre 0,32 h e 1,12 h ao longo do biênio analisado. As médias anuais registradas foram de 0,641 h em 2022 e 0,625 h em 2023, demonstrando uma ligeira melhoria na duração média das interrupções. No que tange ao FEC, as oscilações mensais situaram-se entre 0,16 e 0,79 interrupções por mês, com médias anuais de 0,344 em 2022 e 0,351 em 2023. É fundamental destacar que ambos os indicadores permaneceram consistentemente abaixo dos limites regulatórios anuais estabelecidos pela ANEEL. O desempenho técnico da concessionária, portanto, apresentou estabilidade e conformidade com as exigências do órgão regulador durante todo o período de estudo.

A análise da evolução temporal permitiu identificar picos específicos nos indicadores em janeiro de 2022, dezembro de 2022 e novembro de 2023. Esses períodos coincidem com a temporada de verão chuvoso na região Sudeste, caracterizada por eventos meteorológicos intensos. Em fevereiro de 2023, por exemplo, registros meteorológicos na região indicaram rajadas de vento de até 77 km/h e volumes de chuva significativamente acima da média histórica (INMET, 2023). Tais evidências reforçam a influência direta de fenômenos climáticos sobre a continuidade do serviço. A aplicação do teste t de Welch confirmou essa percepção de estabilidade, resultando em valores de p iguais a 0,8649 para o DEC e 0,9137 para o FEC, o que indica a ausência de diferenças estatisticamente significativas entre os anos de 2022 e 2023.

A correlação de Pearson revelou uma forte associação positiva entre o DEC e o FEC mensais, com um coeficiente r de 0,77 e significância estatística elevada (p < 0,001). Esse resultado demonstra que o aumento na frequência das interrupções está intrinsecamente ligado ao aumento na duração total da indisponibilidade. Esse comportamento é corroborado por estudos empíricos que utilizam dados reais de redes de distribuição, indicando que frequências e durações tendem a evoluir de forma conjunta, especialmente em sistemas que apresentam vulnerabilidades estruturais (Lawanson et al., 2021; Eto et al., 2012). Sob a ótica regulatória, a verificação mensal apontou 0% de excedentes em relação aos limites da ANEEL, uma condição favorável que reflete boas práticas de gestão e manutenção por parte da distribuidora local.

O detalhamento das causas das ocorrências emergenciais trouxe percepções valiosas sobre a operação. A aplicação da ANOVA de fator único resultou em um valor F de 7,04 com p igual a 0,0145, evidenciando que a causa dominante influencia de maneira estatisticamente significativa o DEC mensal. Complementarmente, o modelo de regressão linear múltipla apresentou um coeficiente de determinação R² de 0,575, indicando que aproximadamente 57% da variação do DEC pode ser explicada pelas causas analisadas. Entre todas as variáveis inseridas no modelo, o fator vento foi o único a apresentar significância estatística individual, com um coeficiente beta de aproximadamente 0,0045 h por ocorrência e p igual a 0,009. Esse achado isola o efeito do vento como o principal determinante marginal para o aumento do tempo de interrupção no conjunto avaliado.

A interdependência entre a frequência de falhas e a sensibilidade climática do sistema é um tema recorrente na literatura técnica. Estudos apontam que a gestão adequada da vegetação e a poda preventiva podem reduzir significativamente as falhas durante eventos de tempestade, embora os efeitos variem conforme a severidade do evento e as características da rede (Taylor et al., 2022). A evidência local observada em Bragança Paulista é consistente com esses estudos, justificando a necessidade de análises estratificadas por tipologia de evento para orientar investimentos em resiliência climática. A utilização da IA para processar essas informações demonstrou ser compatível com o que a literatura descreve sobre o uso de modelos de linguagem como copilotos para acelerar a exploração de dados, sem substituir a necessidade de validação técnica humana (Miranda e Campelo, 2024).

A eficácia operacional demonstrada pela distribuidora local em Bragança Paulista, mantendo os indicadores DEC e FEC abaixo dos limites regulatórios em todos os 24 meses avaliados, destaca-se positivamente em um cenário nacional onde muitas regiões ainda enfrentam desafios severos de continuidade. A forte correlação entre o número de interrupções e a duração total reforça a importância de estratégias preventivas que foquem na redução da frequência de falhas. Ao identificar o vento como o fator de maior impacto estatístico, o estudo aponta para oportunidades concretas de melhoria, como o reforço estrutural de trechos críticos da rede e a adoção de tecnologias mais resilientes a instabilidades atmosféricas.

A aplicação da inteligência artificial neste contexto provou ser altamente eficiente. A geração de códigos via ChatGPT permitiu a criação de rotinas complexas de pré-processamento e análise estatística com um ganho de tempo expressivo em comparação aos métodos de programação manual. Essa experiência valida o conceito de vibe coding, onde a redução de barreiras técnicas permite que profissionais foquem na interpretação estratégica dos resultados. No entanto, é imperativo reconhecer que, embora os modelos de linguagem auxiliem na estruturação e codificação, a validação rigorosa dos scripts e a conferência dos resultados com os dados brutos permanecem como etapas indispensáveis para garantir a confiabilidade das inferências (Miranda e Campelo, 2024).

Apesar dos resultados robustos, a pesquisa apresenta limitações que sugerem caminhos para investigações futuras. O recorte temporal de dois anos e a análise de apenas um conjunto elétrico limitam a generalização dos achados para outras regiões ou períodos mais extensos. A expansão da série histórica e a inclusão de outros conjuntos consumidores permitiriam identificar tendências de longo prazo e avaliar a resiliência do sistema frente a mudanças climáticas mais severas. Uma perspectiva promissora reside na construção de modelos preditivos que utilizem a evolução histórica dos indicadores para estimar riscos de ultrapassagem de limites regulatórios com antecedência, permitindo uma gestão proativa e baseada em dados.

Conclui-se que o objetivo foi atingido, uma vez que a aplicação da inteligência artificial permitiu uma análise profunda e automatizada dos indicadores de continuidade do setor elétrico em Bragança Paulista, revelando conformidade regulatória e identificando o vento como o principal fator de impacto sobre a duração das interrupções. O uso de ferramentas de processamento de linguagem natural e scripts automatizados demonstrou elevada eficiência técnica, reduzindo o tempo de processamento de grandes volumes de dados e proporcionando percepções estatísticas precisas que fundamentam decisões operacionais e estratégicas mais assertivas para a melhoria da qualidade do fornecimento de energia.

Referências Bibliográficas:

Agência Nacional de Energia Elétrica (ANEEL). 2022. Regras e Procedimentos de Distribuição (Prodist). Disponível em: <https://www.gov.br/aneel/pt-br/centrais-de-conteudos/procedimentos-regulatorios/prodist>. Acesso em: 03 mai. 2025.

Agência Nacional de Energia Elétrica (ANEEL). 2024. Portal de Dados Abertos – Conjunto de dados da ANEEL. Disponível em:<https://dadosabertos.aneel.gov.br/organization/agencia-nacional-de-energia-eletrica>. Acesso em: 03 mai. 2025.

Baesens, B. 2014. Analytics in a Big Data World: the essential guide to data science and its applications. John Wiley & Sons, New Jersey, USA.

Bardin, L. 2016. Análise de conteúdo. 1ed. Edições 70, São Paulo, Brasil.

Eto, J. H.; LaCommare K H.; Larsen P.; Todd A.; Fisher E. 2012. Distribution-level electricity reliability: Temporal trends, performance metrics, and benchmarks. Energy Policy, 45, 515–526.

Few, S. 2012. Show me the numbers: Designing tables and graphs to enlighten. 1ed. Analytics Press, Oakland, Estados Unidos.

Field, A. 2013.Descobrindo a estatística usando o SPSS. 4ed. Artmed, Porto Alegre, Brasil.

Fávero, L. P.; Belfiore, P. 2019. Data Science for Business and Decision Making. 1ed. Academic Press(Elsevier), Cambridge, United Kingdom.

Gil, A. C. 2002. Como elaborar projetos de pesquisa. 4ed. Editora Atlas S.A, São Paulo, SP, Brasil.

Google Cloud. 2024. What is vibe coding?. Disponível em: <https://cloud.google.com/discover/what-is-vibe-coding>. Acesso em: 05 out. 2025.

Hair, J. F.; Wolfinbarger, M.; Money, A. H.; Samouel, P.; Page, M. J. 2018. Fundamentos de métodos de pesquisa em administração. 2ed. Bookman, Porto Alegre, Brasil.

INMET. 2023. Verão 2022/2023: São Paulo (SP) teve chuvas acima da média e temperaturas próximas da média durante a estação. Boletim publicado em 21 de março de 2023. Disponível em: <https://portal.inmet.gov.br/noticias/ver%C3%A3o-2022-2023-s%C3%A3o-paulo-sp-teve-chuvas-acima-e-temperaturas-pr%C3%B3ximo-da-m%C3%A9dia-durante-esta%C3%A7%C3%A3o> Acesso em: 05 out. 2025.

Justino, M. P.; Silva, F. S.; Rabelo, O. S. 2020. Perspectiva de uso da inteligência artificial para a eficiência energética em prédios públicos. Cadernos de Prospecção, 13(3), 769-782. Disponível em: <https://www.researchgate.net/publication/346429796_Perspectiva_de_Uso_da_Inteligencia_Artificial_IA_para_a_Eficiencia_Energetica_em_Predios_Publicos >. Acesso em: 05 mai. 2025.

Keswani, G. G. 2013. Artificial Intelligence – Is Our Future Bright or Bleak. International Journal of Engineering and Advanced Technology. 2(4), p.348. Disponível em: <https://www.ijeat.org/wp-content/uploads/papers/v2i4/D1443042413.pdf>. Acesso em: 05 mai. 2025.

Lawanson T.; Sharma V.; Cecchi V.; Hong T. 2021. Analysis of Outage Frequency and Duration in Distribution Network Outage Data. Disponível em:<https://par.nsf.gov/servlets/purl/10296696?>. Acesso em: 05 mai. 2025.

Miranda B. A.; Campelo C E. C. 2024. How effective is an LLM-based Data Analysis Automation Tool? A Case Study with ChatGPT’s Data Analyst. Disponível em: <https://sol.sbc.org.br/index.php/sbbd/article/download/30700/30503>. Acesso em: 05 mai. 2025.

Montgomery, D. C.; Runger, G. C. 2019. Estatística aplicada e probabilidade para engenheiros. 7ed. LTC, Rio de Janeiro, Brasil.

OpenAI. 2023. GPT best practices: how to write effective prompts. San Francisco: OpenAI. Disponível em: <https://platform.openai.com/docs/guides/gpt-best-practices>. Acesso em: 10 jun. 2025.

Portal Solar. 2024. Consumidores brasileiros ficaram em média 10,24 horas sem energia em 2024. Disponível em: <https://www.portalsolar.com.br/noticias/mercado/consumidor/consumidores-brasileiros-ficaram-em-media-10-24-horas-sem-energia-em-2024>. Acesso em: 05 mai. 2025.

Russell, S.; Norvig, P. 2021 Artificial Intelligence: A Modern Approach. 4ed. Pearson Education, Harlow, Inglaterra.

Santos, C. R. R.; Silva, L. C. P.; Castro, R.; Marques, R. F. 2022. Aplicação de aprendizado de máquina para projeção do preço horário de liquidação das diferenças como suporte às estratégias de comercialização de energia elétrica. Revista Brasileira de Energia, 28(1). Disponível em: <https://sbpe.org.br/index.php/rbe/article/view/671>. Acesso em: 05 mai. 2025.

Sharda, R.; Delen, D.; Turban E. 2018. Business Intelligence, Analytics, and Data Science: A Managerial Perspective. 4ed. Pearson, United Kingdom.

Taylor, W. O.; Watson P. L.; Cerrai D.; Anagnostou E. 2022. A Statistical Framework for Evaluating the Effectiveness of Vegetation Management in Reducing Power Outages Caused during Storms in Distribution Networks. Sustainability. 14(2). Disponível em <https://www.mdpi.com/2071-1050/14/2/904?>. Acesso em: 05 mai. 2025.

Watson, H. 2012. The requirements for being an analytics-based organization. Business Intelligence Journal, 17(2), 42–44. Disponível em: <https://www.academia.edu/30234695/The_Requirements_for_Being_an_Analytics_Based_Organization>. Acesso em: 05 mai. 2025.

Wooldridge, J. M. 2019. Introdução à econometria: uma abordagem moderna. 3ed. Cengage Learning, São Paulo, Brasil.

Yin, R. K. 2015. Estudo de caso: planejamento e métodos. 5ed. Editora Bookman, Porto Alegre, Brasil.


Resumo executivo oriundo de Trabalho de Conclusão de Curso da Especialização em Gestão de Negócios do MBA USP/Esalq

Para saber mais sobre o curso, clique aqui e acesse a plataforma MBX Academy

Quem editou este artigo

Mais recentes

Você também pode gostar

Quer ficar por dentro das nossas últimas publicações? Inscreva-se em nossa newsletter!

Receba conteúdos e fique sempre atualizado sobre as novidades em gestão, liderança e carreira com a Revista E&S.

Ao preencher o formulário você está ciente de que podemos enviar comunicações e conteúdos da Revista E&S. Confira nossa Política de Privacidade