Resumo Executivo

Imagem Predicción del Consumo de Energía con Prophet, ARIMA y LSTM en Lima

24 de março de 2026

Predicción del Consumo de Energía con Prophet, ARIMA y LSTM en Lima

Javier Oswaldo De La Torre Palomino; Gabrielle Maria Romeiro Lombardi

Resumen elaborado por la herramienta ResumeAI, una solución de inteligencia artificial desarrollada por el Instituto Pecege orientada a la síntesis y redacción.

El objetivo de esta investigación fue desarrollar un modelo predictivo robusto, comparando sistemáticamente los enfoques Prophet, ARIMA y LSTM. La investigación utilizó una base de datos de consumo mensual de 2020 a 2025 para predecir la demanda de energía eléctrica de clientes de baja tensión (potencia contratada hasta 20kW) en el departamento de Lima, Perú. El estudio parte de la necesidad de mejorar la planificación de redes eléctricas en contextos urbanos densos; la variabilidad del consumo impacta parámetros como la tensión y la carga de los transformadores, influyendo en las decisiones de inversión. La predicción precisa de la demanda es fundamental para optimizar inversiones, prevenir sobrecargas, reducir fallos y garantizar la calidad del servicio. Las proyecciones imprecisas, en cambio, pueden llevar a apagones, pérdidas financieras e inversiones reactivas que no acompañan el crecimiento de la demanda.

El escenario de Lima, capital de Perú, ejemplifica estos desafíos. La ciudad concentra la mayor parte de la actividad económica y demográfica del país, presionando el sistema de distribución de energía. Las concesionarias Luz del Sur y Pluz Energía operan en zonas con dinámicas distintas, lo que resulta en patrones de consumo heterogéneos. Actualmente, las metodologías de planificación se basan en métodos tradicionales, como el análisis de históricos y promedios generales, que no capturan tendencias complejas, estacionalidades o anomalías. Este enfoque conduce a inversiones reactivas y dificulta la anticipación de áreas con mayor requerimiento energético, comprometiendo la continuidad del suministro y el cumplimiento de las normas técnicas de calidad. La transición hacia modelos predictivos sofisticados es, por lo tanto, una necesidad estratégica para la sostenibilidad del sistema eléctrico.

Ante este panorama, la aplicación de técnicas avanzadas de predicción es fundamental. Las redes neuronales capturan relaciones no lineales complejas, mientras que los modelos de series temporales analizan la evolución histórica de una variable en componentes de tendencia, estacionalidad y ruido (Hyndman & Athanasopoulos, 2018). Modelos como LSTM (Long Short-Term Memory), una arquitectura de red neuronal recurrente (Hochreiter & Schmidhuber, 1997), y Prophet, desarrollado por Facebook (Taylor & Letham, 2018), han demostrado potencial para la predicción de series temporales energéticas. Sin embargo, la mayoría de las investigaciones existentes se han desarrollado en contextos internacionales, dejando un vacío en la validación de estas metodologías para realidades locales específicas, como la peruana, con sus particularidades socioeconómicas y de infraestructura.

Este estudio tiene como objetivo llenar este vacío al aplicar y comparar rigurosamente los modelos Prophet, ARIMA y LSTM a datos reales de consumo mensual de clientes residenciales en Lima. El propósito es evaluar qué modelo ofrece el mejor equilibrio entre precisión predictiva y fiabilidad de los intervalos de confianza, para apoyar la planificación de la expansión de la red en contextos con información limitada. En Lima, la mayoría de los medidores de energía todavía son electromecánicos, con la implementación de medidores inteligentes (smart meters) en fase inicial. Esta limitación de datos de alta granularidad refuerza la necesidad de modelos que funcionen bien con datos mensuales. La contribución esperada es técnica, al validar metodologías robustas para las distribuidoras peruanas, y social, al promover un suministro de energía más fiable y sostenible.

La investigación busca responder qué enfoque, entre un modelo estadístico clásico (ARIMA), un modelo aditivo flexible (Prophet) y una red neuronal profunda (LSTM), se adapta mejor a las series de consumo de Lima, considerando tendencias, patrones estacionales y eventos atípicos como la pandemia de COVID-19. El análisis comparativo incluirá múltiples métricas de error y una evaluación de la robustez de los modelos en distritos con perfiles de consumo distintos, desde áreas urbanas consolidadas hasta zonas de veraneo con picos estacionales. El resultado proporcionará una guía práctica para ingenieros y planificadores del sector eléctrico sobre la selección de la herramienta de predicción más adecuada, equilibrando complejidad, interpretabilidad y precisión.

La metodología adoptada fue una investigación aplicada con un enfoque cuantitativo. El proceso se estructuró en la recopilación y preprocesamiento de datos, el análisis exploratorio y el modelado predictivo con ARIMA, Prophet y LSTM. La base de datos consistió en registros históricos de consumo de energía de la empresa Luz del Sur en Lima, centrándose en la categoría tarifaria BT5B (usuarios de baja tensión, hasta 20 kW), que representa la mayor parte de los suministros residenciales. Los datos mensuales se agruparon por distrito y por tres rangos de potencia contratada: ≤1 kW, entre 1 kW y 10 kW, y entre 10 kW y 20 kW. La unidad de análisis fue el consumo energético mensual agregado por grupo, en kilovatios-hora (kWh).

El preprocesamiento de los datos, realizado en Python, incluyó la depuración de valores faltantes y duplicados, la homogeneización de formatos de fecha, la normalización de los consumos a un promedio mensual por distrito y la aplicación de winsorización para mitigar el impacto de valores atípicos (outliers). Los datos se dividieron en un conjunto de entrenamiento (80% inicial del período) y uno de prueba (20% final) para una validación robusta (backtesting). La principal limitación identificada fue la ausencia de medición inteligente y de variables exógenas fiables a nivel distrital, como datos de temperatura, lo que restringió el análisis a los patrones endógenos de las series de consumo.

Para el modelado, el modelo ARIMA y su extensión estacional SARIMA se implementaron siguiendo la metodología de Box-Jenkins (Box et al., 2016), con parámetros (p,d,q)(P,D,Q) identificados mediante el análisis de ACF y PACF y optimizados por el criterio AICc. El modelo Prophet se adoptó por su flexibilidad para capturar cambios de tendencia y múltiples estacionalidades (Taylor & Letham, 2018); su calibración implicó el ajuste de hiperparámetros como changepoint_prior_scale y la incorporación de regresores para días festivos. La red neuronal LSTM se implementó para capturar dependencias no lineales a largo plazo (Hochreiter & Schmidhuber, 1997), con una arquitectura de una capa LSTM de 32 unidades, regularización por dropout, optimizador Adam y parada temprana (early stopping) para evitar el sobreajuste.

La evaluación comparativa del desempeño de los modelos utilizó métricas cuantitativas estandarizadas. El Error Porcentual Absoluto Ponderado (WAPE) midió la precisión general, dando más peso a los períodos de mayor consumo. El Error Absoluto Medio Escalado (MASE) comparó el desempeño de cada modelo contra un benchmark Naive estacional; un MASE < 1 indica un modelo superior (Hyndman & Athanasopoulos, 2018). Adicionalmente, la calidad de los intervalos de predicción se evaluó mediante la métrica de Cobertura, que midió el porcentaje de observaciones reales que cayeron dentro de los intervalos de confianza del 80% y 95%. Una cobertura empírica cercana al nivel nominal indica una cuantificación fiable de la incertidumbre de la predicción.

El análisis de los resultados indicó que el modelo Prophet presentó el mejor equilibrio general entre precisión y fiabilidad. Su desempeño superior fue consistente en la mayoría de los distritos y rangos de potencia, consolidándolo como la herramienta más adecuada para el contexto del estudio. Prophet demostró una notable capacidad para capturar patrones estacionales complejos, como picos de consumo de verano en distritos como Ásia y Punta Hermosa, y tendencias de crecimiento estables en áreas como Miraflores. La flexibilidad del modelo para ajustarse a puntos de cambio (changepoints) en la tendencia fue ventajosa, permitiéndole adaptarse a alteraciones estructurales que ARIMA tuvo dificultad en capturar. Además, sus intervalos de confianza estuvieron mejor calibrados, con una cobertura empírica cercana a los niveles nominales del 80% y 95%.

En comparación, el modelo ARIMA/SARIMA, aunque es un sólido benchmark estadístico, se mostró más limitado en horizontes de predicción a mediano y largo plazo. Su naturaleza lineal lo hizo menos apto para modelar dinámicas no lineales y cambios abruptos, lo que resultó en errores mayores. En distritos con mayor volatilidad, los intervalos de predicción de ARIMA se volvieron excesivamente amplios, reduciendo su utilidad práctica. El rendimiento de LSTM, por su parte, se vio perjudicado por la cantidad limitada de datos mensuales, lo que dificultó el aprendizaje de dependencias a largo plazo y resultó en proyecciones con mayor variabilidad, sugiriendo una falta de convergencia hacia un patrón claro.

La discusión de los resultados refuerza que no existe un modelo de predicción universalmente superior; la elección depende de las características de los datos y de los requisitos de la aplicación. Para la predicción del consumo mensual de energía en Lima con datos históricos limitados, Prophet emergió como la solución más pragmática. Su arquitectura, que combina un modelo aditivo descomponible con componentes flexibles de tendencia y estacionalidad, demostró ser ideal para la dinámica del consumo eléctrico urbano (Taylor & Letham, 2018). El modelo ofrece un término medio ventajoso entre la interpretabilidad de ARIMA y la capacidad de modelado complejo de las redes neuronales, sin exigir la misma cantidad de datos que estas.

Los hallazgos tienen implicaciones prácticas directas para las distribuidoras de energía. La implementación de Prophet puede mejorar la planificación de la expansión de la red, permitiendo un dimensionamiento más eficiente de transformadores, subestaciones y líneas de distribución. Esto evita tanto el sobredimensionamiento, que genera costos innecesarios, como el infradimensionamiento, que conlleva riesgo de sobrecargas. La capacidad de generar predicciones fiables a nivel de distrito y rango de potencia permite una planificación granular y proactiva, dirigiendo inversiones hacia áreas de mayor crecimiento y mejorando la resiliencia del sistema. La superioridad de Prophet, medida por WAPE y MASE, fue estadísticamente consistente, superando al benchmark Naive estacional por un margen mayor que los otros modelos.

La contribución principal de este trabajo reside en la validación empírica de que, para la predicción del consumo de energía con datos mensuales en un entorno con información limitada, un enfoque flexible como el de Prophet supera tanto a los modelos estadísticos lineales tradicionales como a las redes neuronales profundas. Este resultado proporciona una orientación valiosa para los profesionales del sector, demostrando que la adopción de herramientas de modelado modernas, adaptadas a la realidad de los datos disponibles, puede generar ganancias en eficiencia operacional y planificación estratégica. La investigación abre el camino para futuras investigaciones que podrían incorporar variables exógenas, a medida que estén disponibles, o explorar modelos híbridos que combinen las fortalezas de diferentes enfoques (Contreras et al., 2003).

En conclusión, el análisis comparativo de los modelos ARIMA, Prophet y LSTM para la predicción del consumo eléctrico mensual de clientes de la categoría BT5B en Lima reveló que el modelo Prophet demostró el mejor desempeño promedio, alcanzando un equilibrio superior entre precisión y estabilidad. Los resultados estuvieron condicionados por la disponibilidad de datos en frecuencia mensual y por la ausencia de variables exógenas, factores que, de estar disponibles, podrían refinar la capacidad predictiva. A pesar de estas limitaciones, los modelos implementados constituyen una herramienta de aplicación práctica inmediata para apoyar la planificación estratégica y la gestión de redes eléctricas urbanas. La superioridad de Prophet en este contexto puede atribuirse a su arquitectura flexible, que se adapta bien a series temporales con fuertes patrones estacionales y tendencias variables. Se concluye que el objetivo de desarrollar un modelo predictivo comparando Prophet, ARIMA y LSTM fue plenamente alcanzado, demostrándose que el modelo Prophet ofrece el mejor equilibrio entre precisión y fiabilidad para la predicción del consumo de energía en clientes de baja tensión en Lima.

Referencias:
Box, G. E. P.; Jenkins, G. M.; Reinsel, G. C.; Ljung, G. M. 2016. Análisis de Series Temporales: Pronóstico y Control. 5.ª ed. John Wiley & Sons, Hoboken, NJ, EE. UU.
Contreras, J.; Espínola, R.; Nogales, F. J.; Conejo, A. J. 2003. ARIMA models to predict next-day electricity prices. IEEE Transactions on Power Systems 18(3): 1014-1020.
Hochreiter, S.; Schmidhuber, J. 1997. Long short-term memory. Neural Computation 9(8): 1735-1780.
Hong, T.; Pinson, P.; Fan, S. 2016. Global energy forecasting competition 2012. International Journal of Forecasting 32(3): 896-913.
Hyndman, R. J.; Athanasopoulos, G. 2018. Forecasting: Principles and Practice. 2.ª ed. OTexts, Melbourne, VIC, Australia.
Lago, J.; De Ridder, F.; De Schutter, B. 2018. Forecasting spot electricity prices: Deep learning approaches and empirical comparison of traditional algorithms. Applied Energy 221: 386-405.
Marino, D. L.; Amarasinghe, K.; Manic, M. 2016. Building energy load forecasting using deep neural networks. Actas de la 42.ª Conferencia Anual de la IEEE Industrial Electronics Society (IECON): 7046-7051.
Taylor, S. J.; Letham, B. 2018. Forecasting at scale. The American Statistician 72(1): 37-45.
Torres, J. F.; Abdel-Aal, R.; Troncoso, A.; Riquelme, J. C.; Martínez-Álvarez, F. 2021. Big data renewable electricity time series forecasting with long short-term memory recurrent neural networks. Energies 14(3): 734.
Zhang, G. P. 2003. Time series forecasting using a hybrid ARIMA and neural network model. Neurocomputing 50: 159-175.

Resumen ejecutivo derivado de un Trabajo de Conclusión de Curso de Especialización en Data Science y Analytics del MBA USP/Esalq.

Conozca más sobre el curso; haga clic aquí

Quem editou este artigo

Você também pode gostar

Quer ficar por dentro das nossas últimas publicações? Inscreva-se em nossa newsletter!

Receba conteúdos e fique sempre atualizado sobre as novidades em gestão, liderança e carreira com a Revista E&S.

Ao preencher o formulário você está ciente de que podemos enviar comunicações e conteúdos da Revista E&S. Confira nossa Política de Privacidade