
30 de março de 2026
Dashboard para Análise e Modelagem do PLD
André Luiz Nani Venturelli; Lucas José de Souza
Resumo elaborado pela ferramenta ResumeAI, solução de inteligência artificial desenvolvida pelo Instituto Pecege voltada à síntese e redação.
O Preço de Liquidação das Diferenças constitui um elemento central na estrutura do setor elétrico brasileiro, representando os valores financeiros associados à energia elétrica produzida que não foi objeto de contratação prévia pelos agentes de mercado. A determinação desse preço ocorre por meio de cálculos realizados pela Câmara de Comercialização de Energia Elétrica, fundamentados no Custo Marginal de Operação, o qual reflete o custo de produção da última unidade de energia necessária para atender à demanda do sistema. A dinâmica de formação desse indicador é complexa e sofre influência direta de múltiplas variáveis, incluindo a disponibilidade de fontes de geração, os níveis de armazenamento nos reservatórios das usinas hidrelétricas, as condições climáticas sazonais e a variação da carga em diferentes períodos. A volatilidade inerente a esses fatores reforça a necessidade de ferramentas analíticas que permitam o acompanhamento e a compreensão da dinâmica de preços de maneira clara e fundamentada em dados (CCEE, 2024).
A crescente disponibilidade de grandes volumes de dados no setor elétrico nacional exige a adoção de instrumentos que possibilitem a análise e a visualização de informações de forma eficiente, promovendo a extração de conhecimentos relevantes para o suporte à tomada de decisões estratégicas. Nesse cenário, a linguagem de programação R destaca-se pela robustez em análises estatísticas e pela versatilidade em aplicações gráficas, especialmente quando integrada ao ambiente de desenvolvimento RStudio e ao pacote Shiny. Tais recursos viabilizam a criação de interfaces web interativas que facilitam a exploração de dados complexos, sendo amplamente empregados em áreas que demandam monitoramento contínuo e modelagem preditiva, como o mercado financeiro e estudos climáticos (Grolemund e Wickham, 2017).
A implementação de painéis interativos, conhecidos como dashboards, revela-se uma solução eficaz para a visualização intuitiva de indicadores do setor elétrico. Essas ferramentas permitem que gestores e consumidores monitorem variáveis críticas, como a previsão de carga, os níveis de armazenamento de energia e a geração proveniente de fontes renováveis e convencionais. A análise detalhada dessas métricas facilita a adoção de decisões voltadas à otimização de custos e à escolha de alternativas de contratação no mercado livre de energia. O desenvolvimento de uma interface interativa voltada à análise e modelagem do Preço de Liquidação das Diferenças busca integrar, em um ambiente único, recursos de visualização dinâmica e modelagem estatística, promovendo uma compreensão profunda do comportamento do mercado e apoiando os processos decisórios no setor energético.
A fundamentação teórica que sustenta a análise do mercado elétrico baseia-se na compreensão de que o preço da energia é um reflexo da escassez ou abundância de recursos hídricos e da eficiência das fontes complementares. A literatura técnica indica que a demanda máxima e a geração de usinas hidrelétricas, termelétricas, eólicas e solares são os pilares que sustentam a oferta nacional (Mayo, 2012). Além disso, a energia natural afluente e o volume de água nos reservatórios determinam a capacidade de resposta do sistema frente a variações de consumo. A integração desses conceitos em um modelo matemático permite identificar como cada variável contribui para a formação do preço final, fornecendo uma base sólida para a gestão de riscos e o planejamento operacional (Oliveira, 2020).
A metodologia adotada para a condução deste estudo caracteriza-se como uma pesquisa aplicada com abordagem quantitativa, focada na análise de dados abertos disponibilizados pelo Operador Nacional do Sistema e pela Câmara de Comercialização de Energia Elétrica. O recorte temporal abrange o período de 01 de janeiro de 2016 a 31 de dezembro de 2024, utilizando uma escala semanal para a coleta de informações. As variáveis selecionadas para compor a base de dados incluem a demanda máxima, medida em MWh/h, que reflete a carga atendida pelas usinas supervisionadas, e a geração de energia de fontes hidrelétricas, termelétricas, eólicas e solares, mensuradas em MWmed. Adicionalmente, foram coletados dados sobre a energia armazenada e a energia natural afluente, ambas em MWmed, além do nível de montante dos reservatórios em metros e o custo marginal da operação em R$/MWh (ONS, 2024).
O processo operacional foi estruturado em quatro etapas fundamentais: coleta e tratamento de dados, modelagem estatística, desenvolvimento de aplicações visuais e construção do painel interativo. Na fase inicial, os dados foram importados para o ambiente RStudio utilizando a biblioteca readr. Grande parte dos arquivos em formato csv foi obtida diretamente de repositórios em nuvem da Amazon Web Services, cujos endereços são divulgados pelo Operador Nacional do Sistema. Nos casos em que as informações não estavam disponíveis de forma automatizada, realizou-se o download manual do histórico de operação para posterior leitura. A organização dos dados envolveu a criação de estruturas denominadas dataframes, segmentadas pelas regiões Norte, Nordeste, Sudeste/Centro-Oeste e Sul, respeitando as subdivisões operacionais do sistema elétrico brasileiro.
Para a estruturação adequada do conjunto de dados, que contém múltiplas variáveis, adotou-se o formato longo, onde as variáveis são organizadas em uma única coluna com seus valores correspondentes dispostos em outra. Essa transformação foi executada por meio da função pivot_longer, facilitando a manipulação estatística e a geração de gráficos. A padronização da escala temporal foi um passo crítico, visto que o Preço de Liquidação das Diferenças é definido semanalmente. Assim, as variáveis originalmente diárias foram transformadas para a escala semanal utilizando os pacotes dplyr e lubridate. A função floor_date permitiu agrupar os dados pelo início de cada semana, enquanto a função sum consolidou os valores temporais, garantindo a integridade da análise na nova escala.
A modelagem do preço foi realizada por meio da técnica de regressão linear múltipla, que permite investigar a relação entre variáveis explicativas lineares e uma variável dependente quantitativa. O modelo matemático busca definir o preço em função de um intercepto somado aos coeficientes angulares multiplicados pelas variáveis independentes, acrescido de um termo de erro que representa a diferença entre o valor real e o previsto (Fávero e Belfiore, 2017). No RStudio, a implementação ocorreu através da função lm, definindo a variável de interesse em função de todos os componentes do conjunto de dados. A validação do modelo exigiu a verificação de pressupostos rigorosos, incluindo a normalidade dos resíduos, a ausência de multicolinearidade, a homocedasticidade e a independência dos resíduos.
Para testar a normalidade, aplicou-se o teste de Shapiro-Francia, enquanto a multicolinearidade foi avaliada por meio da matriz de correlação simples e do Fator de Inflação da Variância. A heterocedasticidade foi verificada pelos testes de Breusch-Pagan e Cook-Weisberg, e a autocorrelação dos resíduos para modelos temporais foi analisada pelo teste de Breusch-Godfrey. Eventuais falhas de especificação do modelo, decorrentes da omissão de variáveis relevantes ou da forma funcional inadequada, foram detectadas pelo teste RESET. O desenvolvimento das aplicações visuais utilizou a biblioteca Plotly, que permite a criação de gráficos dinâmicos com recursos de zoom e seleção de intervalos, integrando-se à estrutura multicamadas do pacote ggplot2 (Wickham, 2016).
As técnicas de estatística descritiva foram empregadas para identificar padrões, ciclos e eventos extremos no comportamento do preço. A média móvel foi utilizada como método de suavização de séries temporais, substituindo valores individuais pela média aritmética de janelas de 3, 6 e 12 meses. O desvio padrão móvel e o coeficiente de variação permitiram medir a dispersão e a volatilidade relativa dos dados ao longo do tempo. Para a detecção de valores atípicos, utilizou-se o método da amplitude interquartil, estabelecendo limites para outliers moderados e extremos com base no primeiro e terceiro quartis. Essa abordagem garantiu que a análise não fosse distorcida por flutuações anômalas, proporcionando uma visão fidedigna da dinâmica do setor (Fávero e Belfiore, 2017).
A construção do dashboard no Shiny Web Application foi dividida entre a interface do usuário e a lógica do servidor. A interface definiu o layout do painel, incluindo cabeçalho, barra lateral e o corpo principal, utilizando funções para exibição de gráficos interativos, tabelas dinâmicas e caixas de indicadores resumidos. O servidor concentrou a lógica reativa, processando os dados conforme os filtros de ano e subsistema selecionados pelo usuário. A integração direta do Shiny com o RStudio eliminou a necessidade de desenvolvimento em linguagens web tradicionais, tornando o processo de criação mais acessível para analistas de dados (Toledo et al., 2023).
Os resultados obtidos na modelagem para a região Sudeste/Centro-Oeste revelaram que o intercepto apresentou um valor-P de 0,006164, indicando significância estatística. Entre as variáveis independentes, o custo marginal de operação demonstrou a maior relevância, com valor-P inferior a 2e-16. Outras variáveis que apresentaram alta significância para a formação do preço foram a energia armazenada, com valor-P de 0,002509, a energia natural afluente, com 0,000191, e a geração por usinas hidrelétricas e eólicas, com valores de 9,36e-05 e 1,39e-05, respectivamente. Variáveis como a demanda de energia e a vazão turbinada da usina de Itaipu não apresentaram significância estatística direta no modelo linear proposto, com valores-P de 0,833209 e 0,767041.
O coeficiente de determinação ajustado do modelo foi de 0,678, o que significa que aproximadamente 68% da variação do Preço de Liquidação das Diferenças pode ser explicada pelas variáveis independentes selecionadas. O erro padrão residual foi calculado em 90,01 R$/MWh, refletindo a magnitude média do erro nas previsões. Embora o modelo tenha se mostrado estatisticamente significativo de forma global, com um F-statistic de 96,21, os testes de validação indicaram violações nos pressupostos de normalidade, homocedasticidade e autocorrelação, todos com valores-P inferiores a 2,2e-16. Tais resultados sugerem que a estrutura linear possui limitações para capturar a complexidade total do mercado, especialmente em momentos de picos extremos de preços.
A análise visual do desempenho do modelo confirmou que as estimativas acompanham as tendências e ciclos sazonais, mas apresentam discrepâncias em períodos de volatilidade acentuada. Observou-se uma tendência de superestimação em preços médios e subestimação em valores elevados, evidenciando que o comportamento do preço é mais complexo do que uma estrutura linear simples pode representar. O histograma dos dados revelou uma distribuição assimétrica, com predominância de concentrações em patamares inferiores a 150 R$/MWh. Valores elevados, embora menos frequentes, exercem influência desproporcional na dispersão geral, o que justifica a presença recorrente de outliers identificados pelo método da amplitude interquartil, especialmente nos anos de 2017, 2018, 2021 e 2022.
A aplicação de médias móveis em diferentes horizontes temporais permitiu filtrar a volatilidade de curto prazo. A média de 3 meses refletiu com sensibilidade os choques de preços, enquanto a de 12 meses destacou tendências estruturais, como o crescimento gradual até 2018 e a elevação abrupta durante a crise hídrica de 2021-2022. O uso do desvio padrão móvel e do coeficiente de variação confirmou períodos de alta instabilidade, onde as métricas de dispersão se elevaram consideravelmente, contrastando com fases de maior previsibilidade e redução da variabilidade relativa. Essas ferramentas estatísticas, integradas ao painel, fornecem uma base sólida para a interpretação do fenômeno.
A exploração das variáveis explicativas no dashboard demonstrou a relação direta entre as condições hidrológicas e o custo da energia. O custo marginal de operação atua como um reflexo imediato da escassez hídrica; quando os níveis de energia armazenada nos reservatórios diminuem, especialmente no subsistema Sudeste/Centro-Oeste, ocorre a necessidade de despacho de usinas termelétricas, que possuem custos operacionais significativamente mais elevados. A análise da energia natural afluente reforçou essa percepção, mostrando que períodos de baixa afluência comprometem a geração hidrelétrica e impulsionam o preço para cima. A vazão de Itaipu também se mostrou relevante na regulação da oferta, com aumentos de vazão associados ao alívio nos custos marginais.
A evolução da matriz de geração brasileira entre 2016 e 2024 revelou transformações profundas. Em 2016, a predominância hidrelétrica era de 75,8%, com participação quase nula da fonte solar. Em 2024, embora a hidreletricidade ainda represente a maior fatia com 56,3%, houve uma diversificação considerável, com a fonte eólica atingindo 18,3% e a solar chegando a 12,4%. Essa transição para fontes renováveis complementares contribui para reduzir a vulnerabilidade do sistema em crises hídricas e pode mitigar a volatilidade dos preços a longo prazo. O dashboard permitiu visualizar essa mudança estrutural de forma clara, correlacionando a expansão de novas fontes com a dinâmica de preços observada no período.
O painel interativo foi organizado em abas estratégicas para facilitar a navegação. A aba inicial apresenta um resumo executivo com indicadores como média de 183 R$/MWh, mediana de 118 R$/MWh e um coeficiente de variação de 85,5%, evidenciando a alta volatilidade. A aba de variáveis permite a exploração individual de cada fator influenciador, enquanto a aba de modelagem consolida os resultados da regressão e os testes de validação. Por fim, a aba de análises aprofunda o estudo estatístico com histogramas e boxplots anuais. Essa estrutura não apenas facilita a visualização, mas funciona como um instrumento metodológico para a identificação de caminhos para o aprimoramento de modelos preditivos futuros.
A integração de dados quantitativos e ferramentas visuais no ambiente R Shiny consolidou uma plataforma robusta para o setor elétrico. A capacidade de filtrar informações por subsistema e período permite que o usuário realize análises customizadas, identificando padrões sazonais específicos de cada região. A detecção de outliers e a análise de resíduos fornecem alertas sobre a confiabilidade das previsões em cenários de estresse hídrico ou picos de demanda. O estudo demonstra que, apesar das limitações do modelo linear, a combinação de estatística descritiva e modelagem oferece subsídios valiosos para a gestão de riscos e o planejamento energético nacional.
Conclui-se que o objetivo foi atingido por meio do desenvolvimento de um dashboard interativo capaz de integrar a coleta, o tratamento e a modelagem estatística do Preço de Liquidação das Diferenças em um ambiente único e acessível. A análise demonstrou que variáveis como o custo marginal de operação, a energia armazenada e a geração eólica são determinantes fundamentais na formação do preço, embora a estrutura linear do modelo de regressão tenha apresentado limitações para capturar a volatilidade extrema e os picos de preços observados no histórico. A ferramenta desenvolvida provou ser eficaz para a visualização de tendências e para a compreensão da transição da matriz energética brasileira, fornecendo suporte relevante para a tomada de decisão e sugerindo que futuras pesquisas explorem modelos não lineares ou técnicas de séries temporais mais avançadas para aumentar a precisão das previsões no setor elétrico.
Referências Bibliográficas:
Câmera de Comercialização de Energia Elétrica [CCEE]. 2024. Conceito de Preços. Disponível em: < https://www.ccee.org.br/web/guest/precos/conceitos-precos >. Acesso em: 02 out. 2024.
Fávero, L. P.; Belfiore, P. 2017. Manual de Análise de dados. 1ed. Elsevier, Rio de Janeiro, RJ, Brasil
Grolemund, G., & Wickham, H. (2017). R for data science. O’Reilly Media.
Mayo, Roberto. 2012. Mercados de Eletricidade. 2ed. Synergia, Rio de Janeiro, RJ, Brasil.
Oliveira, F.J.A. 2020. O Planejamento da Operação Energética no Sistema Interligado Nacional. 1ed. Artliber, São Paulo, SP, Brasil.
Operador Nacional do Sistema Elétrico [ONS]. 2024. Resultados da Operação. Disponível em: <https://www.ons.org.br/paginas/resultados-da-operacao/historico-da-operacao/dados-gerais>. Acesso em: 21 out.2024.
Toledo, A.; Delgado, K.; Montenegro, D. 2023. Development of Web Apllication with Shiny/R to Promote the Teaching-Learning of Statistics. Journal of Engineering Research 3(26): 71-85.
Wickham, H. (2016). ggplot2: Elegant Graphics for Data Analysis. 2ed. Springer.
Resumo executivo oriundo de Trabalho de Conclusão de Curso da Especialização em Engenharia de Software do MBA USP/Esalq
Saiba mais sobre o curso, clique aqui






































