Применение ансамблей деревьев решений и линейной регрессии для оперативного прогнозирования нагрузки

Page 1

Page 2

ЭНЕРГО

СНАБЖЕНИЕ

Применение ансамблей

деревьев решений и линейной

регрессии для оперативного

прогнозирования нагрузки

УДК 621.311: 004.855

Прогнозирование

графиков

нагрузки

является

наиважнейшей

задачей

электроэнерге

–

тике

от

качества

реализации

которой

напрямую

зависят

надежность

экономичность

энергоснабжения

управление

нормальными

послеаварийными

режимами

учетом

интересов

субъектов

электроэнергетического

рынка

работе

рассмотрен

вопрос

про

–

гнозирования

нагрузки

на

оперативном

горизонте

управления

методами

машинного

обучения

Расчеты

показывают

что

алгоритмы

прогнозирования

графиков

нагрузок

адаптирующиеся

оперативным

изменениям

структуры

режима

потребления

энергии

позволяют

повысить

качество

оперативного

управления

энергосистемой

Черемных

аспирант кафедры
Электрических станций НГТУ

Сидорова

аспирант кафедры
Электрических станций НГТУ

Танфильев

к.т.н., доцент кафедры
Электрических станций НГТУ

Русина

д.т.н., доцент, заведующий
кафедрой Электрических
станций, декан факультета
энергетики НГТУ

Ключевые

слова

оперативное прогнозирование,
машинное обучение,
автоматизация расчетов,
расчетная модель

рогнозирование графиков нагрузки всегда играло важную роль
в планировании режимов электроэнергетических систем (ЭЭС), по-
скольку от него зависит качество управления энергетическими объ-
ектами. Сложившийся в двадцатом веке подход к ЭЭС базировался

на создании крупных генерирующих объектов, что позволяло прогнозиро-
вать электропотребление нагрузок укрупненно, группируя их в энергорайо-
ны различных масштабов. Прогнозирование в данном случае проводилось
без «сбалансированности» структуры потребления, так как прогноз спроса
нужен был не сам по себе, а как исходная точка последующего расчета ре-
жимов электропотребления (максимума нагрузки энергосистем) на перспек-
тиву. В случае ввода особо крупных промышленных потребителей, а также
реконструкции генерирующих и сетевых мощностей метод укрупненного про-
гнозирования приводил к высоким погрешностям графиков нагрузки (средне-
суточные погрешности составляли 10–20%).

С появлением перспективной концепции «одноранговой сети» (с англ.

peer-to-peer, P2P — равный к равному) существующие подходы к прогно-
зированию графиков нагрузки и планированию режимов требуют пересмо-
тра, так как перспективная концепция P2P представляет собой вариант ар-
хитектуры системы, в основе которой лежит сеть равноправных узлов [1].
Так, например, компьютерные сети типа P2P основаны на принципе равно-
правия участников и характеризуются тем, что их элементы могут связы-
ваться между собой в отличие от традиционной архитектуры, когда только
через серверы можно передавать данные. Одним из возможных направле-
ний  применения  такого  подхода  в  настоящее  время  является  «Интернет
энергии»  —  тип  децентрализованной  энергетической  системы,  когда  она
становится мультивекторной, все участники энергетического рынка предо-
ставляют  полный  спектр  услуг,  как  например:  производство  электроэнер-
гии,  поддержка  частоты  за  счет  предоставления  оборудования  в  «вирту-
альную» аренду, обеспечение резерва мощности и т.д.

Переход к сети P2P неразрывно связан с учетом влияния отдельных

нагрузок на локальные режимы электроэнергетической системы, а разви-
тие технологий, появление новых типов электроприемников дополнитель-
но приводят к невозможности использования типовых графиков нагрузки,
спрогнозированных традиционными методами. В связи с вышеизложен-
ным, наиболее актуальной становится задача совершенствования моделей
прогнозирования графиков нагрузки, позволяющая учитывать изменения
в структуре и характере нагрузки электроэнергетической системы, а также

Page 3

эффективно управлять ее режимами, причем управ-
ление должно производиться оперативно с поддер-
жанием оптимальных режимных параметров.

Прогнозирование графиков нагрузки широко ис-

пользуется при планировании и управлении нормаль-
ными режимами работы энергосистемы. Существует
общепринятая типология прогнозов, в разрезе кото-
рой в зависимости от масштаба прогнозирования,
времени упреждения, характера объекта и функции
прогноза прогнозирование подразделяется на:

– оперативное (минуты, часы);

– краткосрочное (дни);

– среднесрочное (в пределах года);

– долгосрочное (несколько лет).

В зависимости от горизонта прогнозирования

и цели применяются различные представления вре-
менных рядов (дискретность ряда) и соответственно
методы  прогнозирования.  В  рамках  данной  работы
рассматривается  задача  оперативного  планирова-
ния  графика  нагрузки  для  решения  задачи  управ-
ления  установившимися  режимами  в  реальном
времени  с  поддержанием  оптимальных  режимных
параметров режима по напряжению.

Для прогнозирования графиков нагрузок в на-

стоящий  момент  применяется  множество  методов:
классические модели временных рядов, сверточные
и рекуррентные нейросети [2–4], модели авторегрес-
сии — скользящего среднего различных модифика-
ций  (ARMA, ARIMA,  SARIMA, ARMAX  и  др.),  Холта-
Винтерса [5], методы на базе преобразования Фурье
[6],  регрессии  машин  опорных  векторов  (Support
Vector  Regression  —  SVR)  и  роевых  методов  [7],
регрессия  случайного  леса  и  градиентный  бустинг
над  деревьями  решений  [8].  Помимо  этих  методов,
широко  исследуются  и  их  сочетания:  нейросетевые
модели  с  предобработкой  данных  вейвлет-преоб-
разованием  (Wavelet  Neural  Network  —  WNN)  [9],
нейросети  с  вейвлет-предобработкой  данных  и  оп-
тимизацией  методом  роя  частиц  [10],  комбиниро-
вание  алгоритма  случайного  леса  и  многослойного
перцептрона [11], нейро-нечеткая нейросеть с посто-
бработкой данных методом ARIMA и адаптивного бу-
стинга [12]. Все перечисленные методы имеют свои
особенности, в том числе разный горизонт расчета,
точность полученных результатов, а также скорость
вычисления, которая очень важна для оперативного
прогнозирования. Прямое сравнение существующих
методов по точности и скорости расчета произвести
невозможно,  так  как  авторами  в  вышеупомянутых
работах используются собственные уникальные на-
боры тестовых данных, а также аппаратное обеспе-
чение, используемое при моделировании.

Авторами настоящей работы была выбрана та-

кая  модель  машинного  обучения,  как  случайный
лес (RF). Выбор был обусловлен универсальностью
алгоритма,  суть  которого  состоит  в  использовании
ансамбля решающих деревьев. Само по себе реша-
ющее дерево предоставляет крайне невысокое каче-
ство  классификации,  но  из-за  большого  их  количе-
ства результат значительно улучшается.

В настоящей работе с помощью метода случайно-

го леса проводилась оценка его производительности

для  прогнозирования  графика  нагрузки  в  энергоуз-
ле  с  целью  оперативного  планирования  и  управле-
ния режимами. В рамках данной работы было также
обучено  несколько  вариантов  моделей  прогнозиро-
вания на базе линейной авторегрессии и нелинейной
авторегрессии случайного леса. Корректность функ-
ционирования полученных моделей проводилась на
данных тестовых и реальных объектов.

МАТЕРИАЛЫ

МЕТОДЫ

Исходные данные.

В качестве исходных данных ис-

пользовались графики активной мощности нагрузок
из  базы  данных  проекта  SimBench,  заданные  в  от-
носительных  единицах.  Набор  эталонных  данных
SimBench предназначен для решений в области ана-
лиза  параметров  режимов,  планирования  и  управ-
ления  электрической  сетью.  Использование  обоб-
щенных  типовых  данных  позволяет  обеспечивать
сопоставимость и прозрачность различных разрабо-
ток в области прогнозирования графиков нагрузки.

Набор данных содержит параметры для модели-

рования электрических сетей и охватывает уровни
напряжения от низкого до сверхвысокого напряже-
ния.  В  узлы  нагрузки  интегрированы  временные
ряды  с  периодом  ретроспективы  в  1  год  и  15-ми-
нутной дискретностью. Полный обзор набора дан-
ных  представлен  в  статье  [13].  Графики  нагрузки
использовались  в  качестве  коэффициентов  мас-
штабирования  для  моделирования  нагрузок  энер-
госистемы  и  последующего  квазидинамического
расчета режимов.

Для проверки работоспособности и корректности

модель была опробована при прогнозировании гра-
фиков нагрузок для энергосистемы Памира, в состав
которой входит три малых ГЭС и 37 узлов нагрузки
с суточными графиками, связанных распределитель-
ной сетью напряжением 35 кВ.

Методы.

Существуют две основные постановки

задачи  прогнозирования  на  основе  набора  ретро-
спективных  данных.  Теория  статистического  про-
гнозирования  предполагает,  что  наблюдаемая  по-
следовательность является конкретной реализацией
случайного  процесса  при  множестве  независимых
степеней  свободы,  которые  линейно  взаимодей-
ствуют.  В  теории  динамических  систем  существует
другая точка зрения, согласно которой внешне слу-
чайное поведение может быть порождено детерми-
нированными хаотическими системами с небольшим
числом  степеней  свободы,  взаимодействующих  не-
линейно [14].

В рамках данного подхода состояние рассмат-

риваемой системы в момент времени

можно по-

лучить из конечного отрезка временного ряда
{

(

– 1), …,

(

– (

– 1))} — вектора-вложения

(embedding vector). Данный вектор позволяет рекон-
струировать текущее состояние системы в координа-
тах пространства состояний системы. Такой подход
основан на применении теоремы Такенса [15], кото-
рая утверждает, что для широкого класса детермини-
рованных систем существует отображение:

(

– 1),

(

– 2), …,

(

–

+ 1)),

(1)

№

6 (69) 2021

Page 4

где

— текущее состояние системы в пространстве

состояний;

(

– 1),

(

– 2), …,

(

–

+ 1) — предыду-

щие состояния;

— порядок вектора;

— функция

отображения. Поскольку функция отображения силь-
но нелинейна, в реальных задачах используют ее ап-
проксимацию. При этом точность отображения зави-
сит от выбранного способа аппроксимации

и длины

вектора вложения.

Применение данного подхода к прогнозирова-

нию  фактически  представляет  собой  переход  от
задачи  прогнозирования  к  задаче  табличной  ре-
грессии.  При  данном  подходе  исходный  времен-
ной  ряд  разделяется  на  конечные  отрезки  с  по-
мощью скользящего окна [16], а затем собирается
в таблицу Х, строки которой фактически являются
векторами вложения, описывающими часть траек-
тории  системы  в  пространстве  состояний.  Такой
формат представления данных (2) называется ди-
намическими  панельными  данными  и  позволяет
применить к задаче прогнозирования любой алго-
ритм регрессии:



(

– 1)

(

– 2)



(

–

+ 1





(2)

(

– 1)

(

– 2)



(1)

На следующем шаге необходимо определить

функцию зависимости будущего состояния от теку-
щего:

+ 1

(

(3)

где

— текущее состояние системы в пространстве

состояний,

+ 1

— будущее состояние системы в про-

странстве состояний,

— аппроксимация функции

отображения.

Поскольку нелинейные системы сильно зависят

от начальных условий, использование глобальной
функции аппроксимации

приведет к накоплению

ошибки, так как глобальные аппроксимации хоро-
шо работают только для гладких функций. В связи
с этим имеет смысл использование метода локаль-
ного обучения [17]: на каждом временном шаге пе-
реобучать

на поступающих данных временного

ряда, что позволит снизить влияние начальных ус-
ловий на точность аппроксимации. После обучения
алгоритм используется для прогнозирования на
один шаг вперед.

В данной статье рассматривается применение

алгоритмов машинного обучения в рамках метода
локального обучения для создания модели опера-
тивного прогнозирования нагрузки в энергоузле. Для
решения данной задачи были рассмотрены алгорит-
мы линейной регрессии и ансамбли алгоритмов ре-
грессии.

Алгоритм линейной регрессии представляет

собой  модель,  которая  определяет  значение  ис-
комой  переменной  как  линейную  комбинацию  не-
зависимых  переменных  (факторов,  регрессоров).
В  упрощенном  виде  принцип  работы  алгоритма
можно отнести к задаче определения «линии наи-
лучшего  соответствия»  через  определенный  на-
бор точек с данными, что графически представле-
но на рисунке 1.

В свою очередь, основной идеей в методе «ан-

самбли моделей» является использование большого
набора простых моделей, каждая из которых сама по
себе обладает относительно большой ошибкой, но
за счет большого количества моделей и применения
различных подходов к компенсации ошибок, суммар-
ная ошибка стремится к ее наименьшему значению.
Существует несколько типов ансамблей, часто при-
меняемые из них — это бэггинг и бустинг.

Бэггинг

(англ. Bootstrap Aggregating — бут-

стрэп-агрегирование).  Суть  метода  заключается
в  параллельном  обучении  нескольких  моделей  ма-
шинного обучения на разных выборках с последую-
щим  усред нением  их  прогноза.  Генерация  выборок
в данном методе осуществляется методом бутстрэп
на  базе  исходной  выборки.  Этот  метод  позволяет
уменьшить  дисперсию  ансамбля  за  счет  создания
случайных искажений в выборках, часть из которых
компенсируется  при  усреднении  прогнозов  простых
моделей.  Метод  впервые  был  предложен  в  работе
Бреймана  [18].  Дальнейшим  улучшением  бэггинга
деревьев решений является метод случайного леса
(англ. Random Forest). Данный алгоритм машинного
обучения предложен Брейманом [19] и представляет
собой  сочетание  метода  бэггинга  и  метода  случай-
ных  подпространств,  последний  из  которых  в  алго-
ритме применяется для поиска пороговых значений,
которые  обеспечивают  наиболее  точное  разветвле-
ние  дерева  решений.  Важно  отметить,  что  в  этом
случае поиск производится не по всей выборке для
конкретного дерева, а только по ее части. У метода
случайного леса существует также его модификация,
которая получила название алгоритма экстремально
случайных  деревьев  (англ.  Extremely  Randomized
Trees), в котором определение порогового значения
разветвления происходит случайным образом.

Бустинг

(англ. boosting — усиление). Суть мето-

да заключается в последовательном обучении не-
скольких моделей машинного обучения на разных
выборках с последующим усреднением их прогноза.
Генерация выборок в данном методе осуществляет-
ся путем взвешивания исходной выборки на каждой
итерации; при этом величина веса обратно пропор-
циональна величине ошибки уже обученных слабых
моделей. У бустинга есть два подвида: адаптивный

ЭНЕРГО

СНАБЖЕНИЕ

Рис

. 1.

Графическое

представление

алгоритма

линей

–

ной

регрессии

Page 5

бустинг (англ. Adaptive Boosting) и градиентный бус-
тинг (англ. Gradient Boosting). Эти два алгоритма от-
личаются тем, как они создают и объединяют объек-
ты в ходе итерации. Адаптивный бустинг обновляет
выборку, прикрепленную к каждому из объектов об-
учающего датасета, в то время как градиентный бус-
тинг обновляет значения этих объектов. Эта разница
исходит из того, что оба метода пытаются решить за-
дачу оптимизации, заключающуюся в поиске наилуч-
шей модели, которая может быть записана в виде
взвешенной суммы слабых выборок.

В данной работе расчет произведен с помощью

AdaBoost, Bagging, ExtraTrees, Gradient Boosting,
Random Forest — ансамблей деревьев решений. По-
ведение ансамблей протестировано на малой обуча-
ющей выборке.

Создание

модели

Рассмотрим задачу получения

прогноза  графика  нагрузки  в  конкретном  энергоуз-
ле с перспективой на 1 час вперед. Для реализации
такой модели требуются исходные данные дискрет-
ностью  не  более  1  часа.  Исходные  данные  в  набо-
ре  SimBench  представлены  с  15  минутной  дискрет-
ностью.  В  дальнейшем  при  использовании  модели
данные  будут  поступать  в  расчет  в  режиме  реаль-
ного времени с дискретностью порядка 1 секунды от
систем SCADA.

Для проверки и оценки результатов прогнозиро-

вания  предлагаемой  модели  необходимо  задаться
требованиями  к  точности.  Желаемая  ошибка  про-
гнозирования,  установленная  Системным  операто-
ром  Единой  энергосистемы  России,  в  зависимости
от рассматриваемого региона, в котором находится
система, варьируется от 2 до 7%.

Перед началом прогнозирования выполняется

сглаживание  входных  величин  (данные  временных
рядов  нагрузки).  Необходимость  такого  представ-
ления  входных  данных  объясняется  наличием  слу-
чайного  шума  в  исходных  данных  на  интервале  до
1 часа. На рисунке 2 приведена схема модели фор-
мирования  прогноза  величины  нагрузки,  которая
реализована  с  помощью  языка  программирования
Python  3.7  с  использованием  библиотек  sktime  [20]
и  scikit-learn  [21].  Для  каждого  узла  генерируется
свой экземпляр модели.

Алгоритм функционирования модели начинается

с того, что на вход модели поступает ретроспектив-
ная  информация  о  нагрузке  узла  P(t)  с  дискретно-
стью  15  минут,  затем  на  интервале  1  часа  прово-
дится  скользящее  среднее  усреднение,  после  чего
модель обновляется (при первом запуске обучается)
и  формирует  прогноз.  Подбор  гиперпараметров  ал-

горитмов (ширины окна и количества деревьев) для
алгоритма  случайного  леса  проводится  с  помощью
поиска  по  сетке  параметров  и  последующей  кросс-
валидацией, то есть с помощью стандартной функ-
ции  библиотеки  машинного  обучения  (ML).  Данная
функция  позволяет  сделать  полный  перебор  гипер-
параметров  алгоритма  из  заданного  списка  и  при-
своить  модели  наилучшие  гиперпараметры.  На-
пример,  если  строить  авторегрессионную  модель,
то  гиперпараметром  будет  длина  окна  (какое  коли-
чество  предшествующих  значений  мы  учитываем
в модели). Далее для заданных длин окна строятся
отдельные модели (каждая со своим набором пара-
метров — коэффициентов при предшествующих зна-
чениях), затем эти модели сравниваются по ошибке
на части тренировочной выборки и на выходе полу-
чается модель с наименьшей ошибкой.

На выходе модели получаем прогноз для нагруз-

ки на интервалах 15, 30, 45, 60 и 75 минут вперед.
Прогнозирование  на  интервалах  от  30–75  минут
вперед реализуется с помощью рекуррентной стра-
тегии, подробно описанной в [17]. Данная стратегия
чаще  всего  применяется  при  оперативном  про-
гнозировании  и  решении  задач,  связанных  с  вре-
менными  рядами.  Рекуррентная  стратегия  шаг  за
шагом  обрабатывает  временную  последователь-
ность данных, перебирая ее элементы и сохраняя
внутреннее  состояние,  полученное  при  обработке
предыдущих элементов. Таким образом, при обнов-
лении модели прогнозы на поступивших данных за-
мера на интервалах

+ 2, …,

+ 5 уточняются и пе-

резаписываются.

Исходные данные и разработанные модели

прогнозирования  являются  частью  единой  систе-
мы  имитации  режима  энергосистемы  с  оптимиза-
цией  основных  параметров.  Исходя  из  этого  мы
можем смоделировать и описать функционирова-
ние энергосистемы структурно. Графическое пред-
ставление  разработанной  системы  приведено  на
рисунке 3.

В данной системе реализована конвертация ис-

ходных данных с конфигурацией сети и параметров
режима ее работы из ПВК RastrWin3 в формат данных
библиотеки  PandaPower.  Библиотека  PandaPower
[22]  представляет  собой  программный  модуль  для
языка  программирования  Python  3,  позволяющий
проводить  имитационные  расчеты  установившихся
режимов энергосистемы как в мгновенной постанов-
ке,  так  и  в  квазидинамической  (с  использованием
внешних  временных  рядов).  Таким  образом,  спрог-
нозировав нагрузку на следующий такт времени, мы

Рис

. 2.

Схема

формирования

прогноза

величины

нагрузки

Усреднение

почасовым

скользящим

средним

Усреднение

почасовым

скользящим

средним

Исходный

временной

ряд величины

нагрузки

Обучение

модели

Обновление

модели

Прогнозирование

Результат

прогнозирования

на 15 минут

вперед

Измерения

величины

нагрузки

(0), …,

(

)

(3), …,

(

)

(

– 2), …,

(

– 1)

(

+ 1)

№

6 (69) 2021

Page 6

добавляем к ним плановую загрузку генерации, а за-
тем от этих параметров производим расчет режима.

АНАЛИЗ

РЕЗУЛЬТАТОВ

РАБОТЫ

АЛГОРИТМОВ

Проверка  выбранных  5  вариантов  ансамблевых
методов  (AdaBoost,  Bagging,  ExtraTrees,  Gradient-
Boosting  и  Random  Forest)  осуществлялась  на
уменьшенной  выборке  длиной  1  неделя  с  длиной
скользящего окна 96±2 измерений (один раз в сут-
ки).  Выборка  была  разделена  на  тренировочную
часть длиной 5 дней и тестовую часть длиной 2 дня.
Число простых моделей при обучении каждого ан-
самбля  варьировалось  в  диапазоне  19–30  дере-
вьев  решений.  Усредненная  погрешность  прогно-
зирования нагрузки на интервале 15 минут вперед
для каждой модели приведена в таблице 1.

По результатам данного те-

стирования алгоритм случайно-
го леса (Random Forest) имеет
самый низкий показатель сред-
ней ошибки в модели прогнози-
рования, поэтому для дальней-
шего исследования выберем
именно этот алгоритм.

В качестве обучающей вы-

борки возьмем набор данных
нагрузок с ретроспективой
1 месяц и длиной тестовой вы-
борки 6 дней. Тесты для 4 ва-
риантов моделей проведены:

– с периодом ретроспективы

30 дней и длиной сколь-
зящего окна 96±2 измере-
ния (1 сутки);

– с периодом ретроспективы

15 дней и длиной сколь-
зящего окна 96±2 измере-
ния (1 сутки);

– с периодом ретроспективы

30 дней и длиной сколь-
зящего окна 48±2 измере-
ния (0,5 суток);

– с периодом ретроспективы

15  дней  и  длиной  сколь-
зящего  окна  48±2  измере-
ния (0,5 суток).
Графическое  представле-

ние результатов расчета для

рассматриваемых моделей в рамках проведения
первого теста приведено на рисунке 4.

Каждый цвет кривой на графиках соответствует

нагрузке в конкретном узле тестовой энергосистемы.
На верхнем графике отображено прогнозное значе-
ние нагрузки на интервале

+ 1 (15 минут вперед),

средний  график  демонстрирует  фактическую  на-
грузку, сглаженную почасовым скользящим средним
(усреднение  4-х  последовательных  значений),  а  на
нижнем графике отображена разность спрогнозиро-
ванного и фактического значений нагрузки. Большую
часть  тестового  периода  модуль  погрешности  не
превышает  5%,  при  этом  наблюдаются  эпизодиче-
ские  увеличения  погрешности  до  10%  и  единичные
экстремумы порядка 20%.

Для каждого типа модели были рассчитаны пока-

затели средней ошибки прогноза потребления актив-

ЭНЕРГО

СНАБЖЕНИЕ

Рис

. 3.

Структурная

схема

разработанной

системы

Схема ЭЭС

в RastrWin

Схема ЭЭС

в PandaPower

Расчетный

модуль

в PandaPower

Прогноз

параметров

режима

Прогноз

мощности

нагрузок

Временные

ряды генерации

и нагрузкок из

SimBench в о.е.

Временные

ряды

нагрузкок

в МВт

Временные

ряды генерации

в МВт

Модуль

прогнозирования

нагрузкок на базе

sktime

Экспорт схемы

в формате csv

Временные ряды

нагрузок в о.е.

Номинальные

мощности

нагрузок

Временные ряды

генерации в о.е.

Номинальные

мощности

генерации

Табл. 1. Показатели средней ошибки ансамблевых моделей прогнозирования

Наименование

ансамбля

AdaBoost

Bagging

ExtraTrees

Gradient

Boosting

Random

Forest

Средняя ошибка, %

0,96

1,05

2,57

0,88

0,76

Рис

. 4.

Алгоритм

Random Forest,

тест

№

График

прогноза

нагрузки

реаль

–

ный

график

нагрузки

со

сглаживанием

ошибка

прогнозирования

Page 7

ной мощности для горизонтов прогно-
зирования на интервале от

+ 1 до

+ 5

включительно.  Усредненные  ошибки
прогноза  для  каждого  теста  и  рассмо-
тренных  алгоритмов  случайного  леса
(СЛ) и линейной регрессии (ЛР) приве-
дены в таб лице 2.

Помимо средней ошибки были рас-

считаны  такие  показатели,  как  симме-
тричная MAPE (англ. Symmetric MAPE,
SMAPE) — коэффициент, не имеющий
размерности,  значение  которого  чис-
ленно  равно  ошибке  в  процентах  от
фактических значений:

100%

–

SMAPE = —



—,

(4)

= 1

| + |

|)/2

где

— фактическое значение, а

— прогнозное

значение.

Также была рассчитана средняя абсолютная мас-

штабированная ошибка (англ. Mean absolute scaled
error, MASE):



–

| /

MASE = ——,

(5)





= 2

–

– 1

| / (

– 1)

где  числитель  —  это  средняя  аб-
солютная  ошибка  прогноза  для  те-
стового  периода  (где

— горизонт

прогнозирования),  а  знаменатель  —
средняя  абсолютная  ошибка  одно-
шагового  метода  наивного  прогноза
на  обучающем  наборе  (где

— го-

ризонт  прогнозирования),  в  котором
в  качестве  прогноза  используется
фактическое  значение  за  предыду-
щий  период.  Он  был  предложен  как
«измерение  точности  прогноза  без
проблем,  наблюдаемых  в  других  ме-
триках» [23], и поэтому рекомендует-
ся  для  определения  сравнительной
точности прогнозов [24].

Пример распределения метрик качества прогно-

за SMAPE и MASE для отдельных узлов нагрузки
на горизонте прогнозирования

+ 1 приведен на ри-

сунке 5.

Пример работы модели для прогнозирования на-

грузки узла 41 с отображением фактической величи-
ны нагрузки, прогноза и ошибки прогноза приведен
на рисунке 6.

На основании проведенных расчетов и согласно

регламенту [25], средняя величина ошибки прогно-
за потребления активной мощности, то есть раз-

Табл. 2. Показатели средней ошибки

моделей прогнозирования в проведенных тестах, %

Горизонт

прогнозиро-

вания

Тест № 1

Тест № 2

Тест № 3

Тест № 4

СЛ

ЛР

СЛ

ЛР

СЛ

ЛР

СЛ

ЛР

+ 1

0,65

0,17

0,67

0,30

0,66

0,18

0,92

0,29

+ 2

1,00

0,42

1,05

0,77

0,98

0,45

1,47

0,78

+ 3

1,30

0,71

1,43

1,39

1,28

0,81

2,08

1,44

+ 4

1,65

1,09

1,96

2,15

1,66

1,22

2,61

2,20

+ 5

2,06

1,37

2,48

2,79

2,15

1,54

3,12

2,83

Рис

. 5.

Распределение

метрик

качества

прогнозирования

для

горизонта

прогнозирования

t+1:

) SMAPE;

) MASE

а)

б)

Рис

. 6.

Пример

работы

модели

для

прогнозирования

нагрузки

узла

(

фактическая

нагрузка

приведена

без

сглаживания

)

№

6 (69) 2021

Page 8

ности между прогнозным значением потребления
и  фактическим  значением  потребления,  рассчи-
тываемая за период не менее месяца, не должна
превышать  5%  для  региональной  электроэнерге-
тической системы. Усредненная величина ошибки
прогнозирования  для  рассмотренных  горизонтов
прогнозирования составила от 0,18% до 3,12%, что
позволяет сделать вывод о достаточной точности
данного подхода.

Модели прогнозирования строятся отдельно

для каждого узла, поэтому можно говорить о проб-
леме масштабируемости только в рамках конкрет-
ной аппаратной реализации (например, размеще-
ние ПО для прогнозирования величин нагрузки на
одном сервере в ЦУС). При этом есть возможность
проведения обучения на высокопроизводительной
рабочей станции с переносом готовых моделей на
автоматизированное рабочее место оперативного
персонала.  Обучение  алгоритмов  ансамблей  за-
нимает  значительно  больше  времени  по  сравне-
нию с линейной регрессией, однако после обуче-
ния при работе в режиме постоянного до обучения
на  новых  данных  временные  затраты  всех  алго-
ритмов  отличаются  незначительно.  На  данных
дискретностью 15 минут этот временной интервал
не критичен.

ВЫВОДЫ

1. Рассмотренные алгоритмы прогнозирования

позволяют повысить качество оперативного
управления электрической сетью за счет более
точного учета изменения нагрузки в энергоузле.

Максимальная ошибка прогноза для отдельных
узлов  сети  при  прогнозировании  на  интервале
15  минут  вперед  не  превышает  нормирован-
ную  ошибку  для  региональных  энергосистем,
что  говорит  об  удовлетворительном  качестве
использованного  подхода  к  построению  моде-
лей  прогнозирования.  Подходы,  основанные
на  принципе  локального  обучения,  позволяют
достаточно точно прогнозировать величину на-
грузки  с  частотой  дискретизации,  приемлемой
для  оперативно-диспетчерского  управления.
В рамках данной работы подход продемонстри-
ровал способность к адаптации под особенно-
сти отдельных нагрузок.

2. Использование исходных данных с большей ча-

стотой  дискретизации  (усредненных  на  интер-
валах  менее  15  минут)  может  привести  к  уве-
личению  числа  хаотичных  выбросов  в  наборе
данных и, как следствие, к увеличению ошибки
прогнозирования.  Для  применения  в  задачах
оперативного  управления  (например,  управ-
ление  устройствами  компенсации  реактивной
мощности)  это  может  привести  к  излишне  ча-
стому изменению режима работы устройств.

3. Изменение периода ретроспективы и ширины

скользящего  окна  приводит  к  снижению  вели-
чины  ошибки  прогноза  у  части  моделей,  что
говорит  о  необходимости  разработки  метода
предварительного  анализа  временного  ряда
нагрузки  в  конкретном  энергоузле  с  целью  на-
хождения оптимальных параметров модели без
использования поиска по сетке параметров.

ЛИТЕРАТУРА / REFERENCES
1. Инновационная энергетика: Hi-

tech в энергетике. ДТЭК. URL:
https://dtek.com/ru/media-center/
news/innovatsionnaya-energetika-
hi-tech-v-energetike/.

Innovative energy: Hi-tech in pow-
er industry. DTEK. URL: https://
dtek.com/ru/media-center/news/
innovatsionnaya-energetika-hi-tech-
v-energetike/.

2. Kang T., Lim D.Y., et al. Forecast-

ing of Power Demands Using Deep
Learning. URL: https://www.mdpi.
com/2076-3417/10/20/7241.

3. Xuan Y., Si W., et al. Multi-model

fusion  short-term  load  forecast-
ing  based  on  random  forest  feature
selection  and  hybrid  neural  net-
work.  IEEE  Access.,  2021,  vol.  9,
pp. 69002-69009.

4. Guo X., Chao Q., et al. A short-term

load forecasting model of multi-scale
CNN-LSTM hybrid neural network
considering the real-time electricity
price. Energy Reports, 2020, vol. 6,
pp. 1046-1053.

5. Taylor J.W., McSharry P.E. Short-

Term  Load  Forecasting  Methods:
An  Evaluation  Based  on  European
Data.  IEEE  Transactions  on  Pow-
er  Systems,  2007,  vol.  22,  no.  4,
pp. 2213-2219.

6. Eljazzar M.M., Hemayed E. Enhanc-

ing  electric  load  forecasting  of ARI-
MA and ANN using adaptive Fourier
series.  IEEE  7th  Annual  Comput-
ing  and  Communication  Workshop
and Conference 2017. URL: https://
www.researchgate.net/publica-
tion/314203437.

7. Sarhani M., El Aﬁ a A. Electric load

forecasting  using  hybrid  machine
learning approach incorporating fea-
ture selection. Proceedings of the In-
ternational  Conference  on  Big  Data
Cloud  and  Applications,  Tetuan,
Morocco, 2015. URL: http://ceur-ws.
org/Vol-1580/id16.pdf.

8. Papadopoulos S., Karakatsanis I.

Short-term electricity load forecast-
ing using time series and ensemble
learning methods. URL: https://

www.researchgate.net/publication/
282939702.

9. Che G., Luh P.B., et al. Very Short-

Term  Load  Forecasting:  Wavelet
Neural  Networks  With  Data  Pre-
Filtering.  IEEE  Transactions  on
Power Systems, 2013, vol. 28, no. 1,
pp. 30-41.

10. López C., Zhong W., Zheng M.

Short-term Electric Load Forecasting
Based  on  Wavelet  Neural  Network,
Particle  Swarm  Optimization  and
Ensemble  Empirical  Mode  Decom-
position.  Energy  Procedia,  2017,
vol. 105, pp. 3677-3682.

11. Moon J., Kim Y., et al. Hybrid Short-

Term  Load  Forecasting  Scheme
Using  Random  Forest  and  Mul-
tilayer  Perceptron.  URL:  https://
www.researchgate.net/publica-
tion/329187909.

12. Barak S., Sadegh S.S. Forecasting

energy consumption using ensemble
ARIMA-ANFIS hybrid algorithm. In-
ternational Journal of Electrical Pow-

ЭНЕРГО

СНАБЖЕНИЕ

Page 9

er & Energy Systems, 2016, vol. 28,
pp. 92-104.

13. Spalthoﬀ Ch., Kittl Ch., et al. Sim-

Bench:  Open  source  time  series
of  power  load,  storage  and  gen-
eration  for  the  simulation  of  electri-
cal  distribution  grids.  URL:  https://
www.researchgate.net/publication/
333903713.

14. Farmer J.D., Sidorowich J.J. Pre-

dicting chaotic time series. Physical
Review Letters, 1987, vol. 59, no. 8,
pp. 845-848.

15. Takens F. Detecting strange attrac-

tors in turbulence. Dynamical Sys-
tems and Turbulence, 1980. URL:
https://www.crcv.ucf.edu/gauss/info/
Takens.pdf.

16. Беляев Е.А., Тюрликов А.М. Оцен-

ка вероятности появления сим-
вола при адаптивном двоичном
арифметическом

кодировании

в задачах сжатия видеоинформа-
ции // Цифровая Обработка Сигна-
лов, 2007, № 3. С. 20–24.

Belyayev E.A., Tyurlikov A.M. Es-
timated probability of symbol ap-

pearance in adaptive binary arith-
metic coding in video compression
challenges // Digital Signal Pro-
cessing, 2007, no. 3, pp. 20–24. (In
Russian)

17. Gianluca B., Ben Taieb S., Le Bor-

gne  Ya.-A.  Machine  Learning  Strat-
egies  for  Time  Series  Forecasting.
URL:  https://www.researchgate.net/
publication/236941795.

18. Breiman L. Bagging predictors. Ma-

chine Learning, 1996, vol. 24,
pp. 123-140.

19. Breiman L. Random Forests. Ma-

chine Learning, 2001, vol. 45,
pp. 5-32.

20. Löning M., Bagnall A., et al. sktime:

A Uniﬁ ed Interface for Machine Lear-
ning with Time Serie. URL: https://
www.researchgate.net/publication/
335880554.

21. Pedregosa F., Varoquaux G., et al.

Scikit-learn: Machine Learning in
Python. URL: https://www.research-
gate.net/publication/305386496.

22. Thurner L., Scheidler A., et al. Pan-

dapower – An Open Source Py-

thon  Tool  for  Convenient  Modeling,
Analysis  and  Optimization  of  Elec-
tric  Power  Systems.  URL:  https://
www.researchgate.net/publication/
319953117.

23. Hyndman R.J., Koehler A.B. Another

look at measures of forecast accura-
cy. URL: https://www.researchgate.
net/publication/222665190.

24. Franses P.H. A note on the Mean

Absolute Scaled Error. Interna-
tional Journal of Forecasting, 2016,
vol. 32, no. 1, pp. 20–22.

25. Регламент оперативного диспет-

черского управления электроэнер-
гетическим  режимом  объектов
управления  ЕЭС  России,  прило-
жение № 9 к Договору о присоеди-
нении к торговой системе оптового
рынка.  URL:  https://docs.cntd.ru/
document/1200120232.

Schedule  of  operational  dispatch
control  of  electrical  power  mode  of
control  facilities  of  UES  of  Russia,
annex  no.  9  to  Agreement  on  join-
ing the wholesale market trade sys-
tem. URL: https://docs.cntd.ru/docu-
ment/1200120232.

Хренников А.Ю., Любарский Ю.Я.

Использование

элементов

искусственного

интеллекта

компьютерная

поддержка

оперативных

решений

интеллектуальных

электрических

сетях

Книгу

можно

приобрести

интернет

–

магазине

электронных

книг

ЛитРес

разделе

Электроэнергетика

Учебно-методическое пособие. ЛИТРЕС, 2021. 140 стр., 30 ил.

Для

умных

электрических

сетей

рассмотрены

интеллектуальные

про

–

граммные

средства

выполняющие

новые

функции

повышающие

уро

–

вень

компьютерной

поддержки

диспетчерских

решений

Одна

из

целей

построения

умных

сетей

—

обеспечение

восстановления

после

аварий

основное

внимание

уделяется

проблемам

диагностики

нештатных

ситу

–

аций

интеллектуальному

мониторингу

состояний

электрических

сетей

планированию

послеаварийного

восстановления

электроснабжения

Подробно

рассмотрен

новый

вид

программного

тренажера

для

диспет

–

черов

электрических

сетей

—

тренажер

анализа

нештатных

ситуаций

Изложение

книге

сопровождается

множеством

примеров

форме

про

–

токолов

работы

реальных

интеллектуальных

систем

Книга

предназна

–

чена

для

руководителей

специалистов

оперативных

служб

предпри

–

ятий

энергетических

систем

электрических

распределительных

сетей

электрических

станций

филиалов

ПАО

Россети

»,

ПАО

ФСК

ЕЭС

»,

слушателей

курсов

повышения

квалификации

также

для

аспирантов

магистрантов

студентов

электроэнергетических

специальностей

№

6 (69) 2021

Оригинал статьи: Применение ансамблей деревьев решений и линейной регрессии для оперативного прогнозирования нагрузки

Ключевые слова: оперативное прогнозирование, машинное обучение, автоматизация расчетов, расчетная модель

Читать онлайн

Прогнозирование графиков нагрузки является наиважнейшей задачей в электроэнергетике, от качества реализации которой напрямую зависят надежность и экономичность энергоснабжения, управление нормальными и послеаварийными режимами с учетом интересов субъектов электроэнергетического рынка. В работе рассмотрен вопрос прогнозирования нагрузки на оперативном горизонте управления методами машинного обучения. Расчеты показывают, что алгоритмы прогнозирования графиков нагрузок, адаптирующиеся к оперативным изменениям структуры и режима потребления энергии, позволяют повысить качество оперативного управления энергосистемой.