

44
э
н
е
р
г
о
э
ф
ф
е
к
т
и
в
н
о
с
т
ь
энергоэффективность
Прогнозирование
потребления
электроэнергии.
Практика применения
УДК
621.31
Современные
тенденции
развития
рынка
электроэнер
-
гетики
в
Российской
Федерации
характеризуются
по
-
стоянным
ростом
цен
на
ресурсы
,
которые
необходимы
топливно
-
энергетическому
комплексу
для
непрерывного
производства
электроэнергии
,
удорожанием
процесса
возведения
новых
электростанций
и
энергосетей
для
транспортировки
энергии
и
повсеместным
ростом
не
-
платежеспособности
предприятий
-
потребителей
электро
-
энергии
.
Реформирование
РАО
«
ЕЭС
России
»
в
2008
году
привело
всех
участников
образовавшегося
оптового
рынка
электроэнергии
и
мощности
к
необходимости
вы
-
рабатывать
свои
уникальные
стратегии
и
инструменты
использования
энергоресурсов
с
целью
обеспечения
баланса
между
вырабатываемой
и
потребляемой
энерги
-
ей
.
В
данной
статье
производится
сравнение
различных
способов
прогнозирования
потребления
электроэнер
-
гии
с
использованием
алгоритмов
машинного
обучения
и
статистических
методов
на
примере
прогноза
потреб
-
ления
электроэнергии
на
собственные
нужды
ПС
500
кВ
«
Челябинская
»
ПАО
«
ФСК
ЕЭС
».
Мигранов
М
.
М
.,
инженер
1
категории
ОИС
службы
ИС
и
СС
филиала
ПАО
«
ФСК
ЕЭС
» —
МЭС
Урала
,
магистрант
ЧелГУ
Устинов
А
.
А
.,
магистрант
ЧелГУ
Мельников
А
.
В
.,
д
.
т
.
н
.,
профессор
ЧелГУ
Ключевые
слова
:
машинное
обучение
,
электро
-
энергетика
,
прогнозирование
временных
рядов
,
прогнозиро
-
вание
потребления
электро
-
энергии
Keywords:
machine learning, electric
power, time series forecasting,
forecasting of electricity
consumption
ВВЕДЕНИЕ
На
сегодняшний
день
оптовый
рынок
электроэнергии
и
мощности
Россий
-
ской
Федерации
представляет
собой
двухуровневую
систему
—
оптовый
и
розничный
рынки
.
Участниками
дан
-
ного
рынка
являются
генерирующие
компании
(
продавцы
электроэнергии
и
мощности
),
сбытовые
компании
,
сетевые
компании
,
крупные
потре
-
бители
(
покупатели
электроэнергии
и
мощности
).
На
оптовом
рынке
элек
-
троэнергии
функционирует
несколько
секторов
,
различаются
они
условиями
заключения
сделок
и
сроками
постав
-
ки
:
сектор
регулируемых
договоров
,
сектор
свободных
договоров
,
рынок
на
сутки
вперед
(
РСВ
),
балансирую
-
щий
рынок
(
БР
).
Основной
объем
производимой
электроэнергии
продается
в
одном
секторе
,
который
и
формирует
пла
-
новое
потребление
, —
рынок
на
сутки
вперед
(
РСВ
).
На
РСВ
коммерческий
оператор
ОАО
«
АТС
»
проводит
кон
-
курентный
отбор
ценовых
заявок
по
-
ставщиков
и
покупателей
за
сутки
до

45
реальной
поставки
электроэнергии
с
определением
цен
и
объемов
поставки
на
каждый
час
суток
.
Однако
фактическое
потребление
неизбежно
отличается
от
планового
,
и
именно
поэтому
был
создан
баланси
-
рующий
рынок
.
На
БР
осуществляется
торговля
от
-
клонениями
от
планового
производства
/
потребления
в
режиме
реального
времени
.
В
сложившихся
рыночных
условиях
ценообразо
-
вывающим
фактором
электроэнергии
при
расчете
конечной
цены
отпуска
ее
потребителям
для
энер
-
госбытовой
компании
является
ее
стоимость
приоб
-
ретения
на
РСВ
.
При
данном
факторе
использова
-
ние
актуальных
методов
прогнозирования
,
а
также
современного
программного
обеспечения
совместно
с
системами
автоматизированного
контроля
учета
электроэнергии
(
АСКУЭ
)
представляет
стратегиче
-
ский
и
экономический
интересы
.
Отличие
цен
элек
-
троэнергии
на
БР
от
РСВ
в
Российской
Федерации
составляет
15–40%.
Постоянно
изменяющиеся
условия
рынка
,
объемы
покупаемой
энергии
и
объемы
энергии
для
транспор
-
тировки
создают
необходимость
сетевым
организаци
-
ям
в
прогнозировании
:
количества
энергии
,
которую
необходимо
поставить
потребителям
;
нагрузки
на
се
-
тевые
мощности
организации
;
вероятности
возникно
-
вения
поломок
на
линиях
передачи
;
количества
энер
-
гозатрат
на
собственные
нужды
для
поддержания
основной
хозяйственной
деятельности
.
Из
перечисленного
выше
следует
,
что
получение
максимально
возможной
точности
построения
про
-
гнозов
с
помощью
используемых
прогностических
моделей
энергопотребления
представляет
экономи
-
ческий
интерес
как
для
сетевых
,
так
и
для
сбытовых
компаний
.
Актуальность
задачи
прогнозирования
потре
-
бления
электроэнергии
для
отечественной
электро
-
энергетики
подтверждается
и
обширным
списком
научных
работ
,
проведенных
российскими
иссле
-
дователями
.
Следует
отметить
следующие
работы
,
опубликованные
за
последние
годы
:
Грицай
А
.
С
.
«
Гиб
ридный
метод
краткосрочного
прогнозирования
потребления
электрической
энергии
для
энергос
-
бытового
предприятия
с
учетов
метеофкаторов
»,
2017
г
.;
Абдурахманов
А
.
М
. «
Методы
прогнозиро
-
вания
электропотребления
в
распределительных
сетях
», 2016
г
.;
Соломахо
К
.
Л
«
Применение
метода
главных
компонент
для
прогнозирования
объемов
электропотребления
энергосбытового
предпри
-
ятия
», 2015
г
.;
Хуссейн
А
.
З
. «
Повышение
точности
краткосрочного
прогнозирования
электрической
на
-
грузки
потребителей
региона
с
учетом
метеофакто
-
ров
на
основе
метода
опорных
векторов
», 2015
г
.;
Кошарная
Ю
.
В
. «
Разработка
методики
анализа
па
-
раметров
электропотребления
для
их
нормирова
-
ния
и
оценки
объемов
энергосбережения
при
про
-
ведении
энергоаудита
предприятий
и
организаций
»,
2015
г
.;
Гарифуллин
Ш
.
Р
. «
Прогнозирование
потре
-
бления
электроэнергии
с
помощью
методов
машин
-
ного
обучения
», 2015
г
.;
Гофман
А
.
В
. «
Моделиро
-
вание
электропотребления
многономенклатурного
предприятия
для
краткосрочного
прогнозирования
»,
2013
г
.;
Белов
К
.
И
. «
Автоматизированная
система
прогнозирования
потребления
электрической
энер
-
гии
предприятием
», 2012
г
.;
Валь
П
.
В
. «
Краткосроч
-
ное
прогнозирование
электропотребления
горного
предприятия
в
условиях
оптового
рынка
электро
-
энергии
и
мощности
», 2012
г
.;
Бажинов
А
.
Н
. «
Метод
прогнозирования
объемов
потребления
электро
-
энергии
предприятием
черной
металургии
на
основе
нейро
-
нечетких
алгоритмов
», 2011
г
.;
Анушина
Е
.
С
.
«
Система
краткосрочного
прогнозирования
электри
-
ческой
нагрузки
», 2009
г
.;
Гордеев
А
.
С
. «
Прогнозиро
-
вание
электропотребления
объектов
с
применением
искусственных
нейронных
сетей
», 2008
г
.
ЗАДАЧА
Объект
исследования
—
объекты
электросетевого
хозяйства
ПАО
«
ФСК
ЕЭС
».
Предмет
исследования
—
потребление
электро
-
энергии
на
собственные
нужды
субъектами
электро
-
сетевого
хозяйства
предприятия
,
модели
и
методы
краткосрочного
прогнозирования
потребления
элек
-
троэнергии
.
Цель
исследования
—
сравнение
методов
кратко
-
срочного
прогнозирования
потребления
электро
-
энергии
для
объектов
электросетевого
хозяйства
ПАО
«
ФСК
ЕЭС
».
Задачи
исследования
:
1)
провести
обзор
методов
прогнозирования
вре
-
менных
рядов
;
2)
провести
отбор
алгоритмов
для
построения
моде
-
лей
прогнозирования
потребления
электроэнергии
;
3)
подготовить
данные
для
составления
краткосроч
-
ного
прогноза
потребления
электроэнергии
;
4)
подготовить
прогнозные
модели
;
5)
провести
сравнение
результатов
прогнозных
мо
-
делей
.
В
качестве
опорных
данных
будут
использованы
данные
потребления
,
взятые
из
АИИС
КУЭ
четы
-
рех
ТСН
0,4
кВ
ПС
500
кВ
«
Челябинская
»
за
период
с
01.01.2014
по
06.11.2017.
Для
хранения
и
предо
-
бработки
расчетных
данных
используются
библиоте
-
ки
pandas, numpy, autocleaner,
для
расчетов
исполь
-
зуются
библиотеки
машинного
обучения
xgboost,
scikit-learn, statsmodels, seasonals.
Визуализация
выполнена
при
помощи
библиотек
matplotlib.pyplot,
seaborn, plotly.
1.
Обзор
методов
прогнозирования
временных
рядов
Для
начала
необходимо
ввести
определение
вре
-
менного
ряда
.
Временной
ряд
—
это
последовательность
зна
-
чений
,
описывающих
протекающий
во
времени
про
-
цесс
,
измеренных
в
последовательные
моменты
времени
,
обычно
через
равные
промежутки
[1].
Используемые
для
целей
и
задач
прогнозирова
-
ния
временные
ряды
экономических
показателей
об
-
ладают
рядом
особенностей
.
Так
как
временной
ряд
является
последовательностью
значений
,
в
котором
каждое
следующее
значение
содержит
в
себе
про
-
шлое
для
последующих
,
то
любая
попытка
прогнози
-
ровать
будущее
без
исследования
временных
рядов
прошлого
является
ненаучной
и
ошибочной
.
Поэто
-
му
для
получения
достаточно
точных
и
надежных
прогнозов
необходимо
подробно
изучить
настоящее
№
2 (47) 2018

46
состояние
явления
или
процесса
.
Например
,
раз
-
ложить
ряд
на
составные
компоненты
и
устранить
влияние
систематических
компонент
на
изменение
случайных
,
проверить
ряд
на
наличие
основной
тен
-
денции
и
при
наличии
таковой
провести
ее
выде
-
ление
,
выявить
тренд
и
его
направление
(
критерий
Аббе
-
Линника
,
критерий
Кокса
-
Стюарта
,
критерий
Фостера
-
Стюарта
),
определить
сезонность
(
мульти
-
пликативная
или
аддитивная
),
избавить
ряд
от
не
-
стационарности
(
взятие
разностей
,
преобразование
Бокса
-
Кокса
).
Выявление
указанных
параметров
временного
ряда
очень
важно
для
выбора
после
-
дующей
модели
прогнозирования
и
без
проведения
предварительного
анализа
невозможно
построить
качественную
модель
.
Метод
средних
Воспользуемся
наивным
предположением
,
что
«
завтра
будет
,
как
вчера
»,
однако
примем
утверждение
,
что
будущее
потре
-
бление
зависит
от
среднего
n
его
предыдущих
значений
,
а
значит
,
воспользуемся
скользящей
сред
-
ней
[2].
Сделать
такой
прогноз
долго
-
срочным
не
удастся
—
для
полу
-
чения
прогноза
на
период
вперед
необходимо
,
чтобы
предыдущий
период
был
фактически
наблю
-
даемым
.
Однако
скользящую
среднюю
можно
использовать
и
для
другой
цели
—
сглаживания
исходного
ряда
для
выявления
тренда
.
Чем
больше
будет
ширина
,
тем
более
сглаженным
будет
тренд
.
В
на
-
шем
случае
тренды
очевидны
,
и
сглаживание
по
неделям
и
ме
-
сяцам
лишь
сгладит
общий
гра
-
фик
потребления
(
рисунки
1
и
2).
Модификацией
простой
скользящей
средней
является
так
называемая
взвешенная
средняя
,
внутри
которой
наблю
-
дениям
придаются
различные
веса
,
в
сумме
дающие
едини
-
цу
,
при
этом
обычно
последним
наблюдениям
присваивается
больший
вес
.
Подобная
модель
обладает
возможностью
на
-
стройки
в
сравнении
с
простой
моделью
скользящей
средней
.
Экспоненциальные
сглаживания
Взвесим
все
доступные
на
-
блюдения
,
экспоненциально
уменьшая
веса
по
мере
углубле
-
ния
в
исторические
данные
.
Для
этого
воспользуемся
формулой
простого
экспоненциального
сгла
-
живания
[3]:
t
=
yt
+ (1
–
)
t
– 1.
Здесь
значение
прогноза
представляет
собой
средневзвешенную
между
текущим
истинным
и
пре
-
дыдущим
модельным
значениями
.
—
сглажива
-
ющий
фактор
.
С
его
помощью
определяется
,
как
быстро
будет
«
забываться
»
последнее
доступное
на
-
блюдение
.
Чем
меньше
сглаживающий
фактор
,
тем
больше
влияния
оказывают
предыдущие
модельные
значения
,
и
тем
сильнее
сглаживается
ряд
.
В
данном
случае
экспоненциальность
модели
в
ее
рекурсивности
—
каждый
раз
мы
умножаем
(1 –
)
на
предыдущее
модельное
значение
,
которое
также
со
-
держало
в
себе
(1 –
),
и
так
до
начала
наблюдений
(
рисунок
3).
Изменяя
вес
,
мы
можем
добиться
приемлемого
качества
прогноза
,
однако
,
как
и
модель
скользящей
Рис
. 1.
Суточный
тренд
Рис
. 2.
Недельный
тренд
Дата
По
тре
бление
,
кВ
/
ч
2014-01
1000
800
600
400
200
0
2014-07
2015-01
2015-06
2016-01
2016-07
2017-01
2017-07
2018-01
Реальное
потребление
Скользящая
средняя
тренда
Дата
По
тре
бление
,
кВ
/
ч
2014-01
1000
800
600
400
200
0
2014-07
2015-01
2015-06
2016-01
2016-07
2017-01
2017-07
2018-01
Реальное
потребление
Скользящая
средняя
тренда
Рис
. 3.
Экспоненциальное
сглаживание
Наблюдения
По
тре
бление
,
кВ
/
ч
0
5000
1000
800
600
400
200
0
10000
15000
20000
25000
30000
35000
Реальное
потребление
= 0,3
= 0,05
ЭНЕРГО-
ЭФФЕКТИВНОСТЬ

47
и
взвешенной
средней
,
такая
мо
-
дель
позволяет
делать
прогноз
лишь
на
одну
точку
вперед
,
что
явно
недостаточно
для
решения
задачи
прогнозирования
потре
-
бления
электроэнергии
.
Разобьем
ряд
на
две
составля
-
ющие
—
уровень
l
и
тренд
.
Уро
-
вень
(
ожидаемое
значение
ряда
)
мы
предсказывали
с
помощью
вышеописанных
моделей
,
теперь
же
применим
экспоненциальное
сглаживание
к
тренду
,
полагая
,
что
будущее
направление
изме
-
нения
ряда
зависит
от
взвешен
-
ных
предыдущих
изменений
[3]:
l
x
=
y
x
+ (1 –
) (
l
x
– 1
+
b
x
– 1
);
b
x
=
(
l
x
–
l
x
– 1
) + (1 –
)
b
x
– 1
;
x
+ 1
=
l
x
+
b
x
.
Результатом
такого
разбиения
является
набор
функций
.
Первая
из
них
описывает
уровень
,
завися
-
щий
,
как
и
прежде
,
от
текущего
значения
ряда
,
а
вто
-
рое
слагаемое
разбивается
на
предыдущее
значение
уровня
и
тренда
.
Вторая
функция
отвечает
за
тренд
,
зависящий
от
изменения
уровня
на
текущем
шаге
и
от
предыдущего
значения
тренда
.
Финальный
про
-
гноз
является
суммой
модельных
значений
уровня
и
тренда
(
рисунок
4).
Сочетание
параметров
и
позволяет
тонко
на
-
строить
модель
двойного
экспоненциального
сглажи
-
вания
.
Первый
отвечает
за
сглаживание
ряда
трен
-
да
,
второй
—
за
сглаживание
самого
тренда
.
Чем
выше
значения
,
тем
больший
вес
будет
у
последних
наблюдений
,
и
тем
менее
будет
сглаживаться
мо
-
дельный
ряд
.
Модель
двойного
экспоненциального
сглаживания
позволяет
делать
прогноз
сразу
на
два
периода
вперед
.
Теперь
добавим
третью
компоненту
—
сезон
-
ность
.
Стоит
оговориться
,
что
данный
метод
при
-
меним
лишь
в
случае
,
когда
исходный
ряд
обладает
сезонностью
,
что
справедливо
для
исходных
данных
эксперимента
.
Данная
компонента
объяснит
повто
-
ряющие
колебания
вокруг
уровня
и
тренда
,
а
харак
-
теризуется
она
длиной
сезона
—
периодом
,
после
которого
начинаются
повторения
колебаний
.
Для
каждого
наблюдения
в
сезоне
формируется
своя
компонента
,
например
,
если
длина
сезона
составля
-
ет
7 (
к
примеру
,
сезонная
компонента
),
то
получим
7
сезонных
компонент
.
Получим
новую
систему
:
l
x
=
(
y
x
–
s
x
–
L
) + (1 –
) (
l
x
– 1
+
b
x
– 1
);
b
x
=
(
l
x
–
l
x
– 1
) + (1 –
)
b
x
– 1
;
s
x
=
(
y
x
–
l
x
) + (1 –
)
s
x
–
L
;
x
+
m
=
l
x
+
m
b
x
+
s
x
–
L
+ 1 + (
m
– 1)
mod
L
.
Уровень
теперь
зависит
от
текущего
значения
ряда
за
вычетом
соответствующей
сезонной
компоненты
,
тренд
остается
без
изменений
,
а
сезонная
компонен
-
та
зависит
от
текущего
значения
ряда
за
вычетом
уровня
и
от
предыдущего
значения
компоненты
.
При
этом
компоненты
сглаживаются
через
все
доступные
Рис
. 4.
Двойное
экспоненциальное
сглаживание
Наблюдения
По
тре
бление
,
кВ
/
ч
0
5000
1500
1250
1000
750
500
250
0
-250
10000
15000
20000
25000
30000
35000
Реальное
потребление
= 0,9,
= 0,9
= 0,9,
= 0,02
= 0,02,
= 0,9
= 0,02,
= 0,02
Рис
. 5.
Сравнение
стационарных
и
нестационарных
рядов
Стационарные
ряды
Нестационарные
ряды
сезоны
,
например
,
если
это
компонента
,
отвечающая
за
понедельник
,
то
и
усредняться
она
будет
только
с
другими
понедельниками
.
Теперь
,
имея
сезонную
компоненту
,
появляется
возможность
делать
прогноз
на
произвольное
количество
(
m
)
шагов
.
Получившаяся
модель
называется
моделью
трой
-
ного
экспоненционального
сглаживания
или
моде
-
лью
Хольта
-
Винтерса
[4].
Следует
отметить
,
что
качество
моделей
,
осно
-
ванных
на
экспоненциальном
сглаживании
,
сильно
зависит
от
подбора
коэффициентов
,
размерности
исходных
данных
,
зашумленности
данных
,
сезонно
-
сти
и
т
.
д
.
Эконометрический
подход
Перед
тем
как
перейти
к
использованию
экономе
-
трического
подхода
,
определим
понятие
стационар
-
ности
.
Под
стационарностью
понимают
свойство
про
-
цесса
не
менять
своих
статистических
характеристик
с
течением
времени
(
постоянство
математического
ожидания
,
гомоскедастичность
)
и
независимость
ко
-
вариационной
функции
от
времени
(
рисунок
5) [5].
№
2 (47) 2018

48
В
чем
заключается
важность
стационарности
?
Большинство
моделей
временных
рядов
модели
-
руют
математическое
ожидание
либо
дисперсию
,
и
в
случае
нестационарности
ряда
предсказания
бу
-
дут
неверными
.
Определим
понятие
ARIMA.
ARIMA (
англ
. autoregressive integrated moving
average,
иногда
модель
Бокса
-
Дженкинса
,
методо
-
логия
Бокса
-
Дженкинса
) —
интегрированная
модель
авторегрессии
—
скользящего
среднего
—
модель
и
методология
анализа
временных
рядов
.
Является
расширением
моделей
ARMA
для
нестационарных
временных
рядов
,
которые
можно
сделать
стацио
-
нарными
взятием
разностей
некоторого
порядка
от
исходного
временного
ряда
(
так
называемые
инте
-
грированные
или
разностно
-
стационарные
времен
-
ные
ряды
) [6].
SARIMA
является
модификацией
модели
ARIMA
(
так
называемая
Seasonal ARIMA).
Общий
вид
мо
-
дели
ARIMA(
p,d,q
)(
P,D,Q
)
.
В
этой
модели
параметры
обозначают
следующее
:
p
—
порядок
модели
AR(
p
);
d
—
порядок
интегрирования
исходных
данных
;
q
—
порядок
модели
MA(
q
);
P
—
порядок
сезонной
составляющей
SAR(
P
);
D
—
порядок
интегрирования
сезонной
составляющей
;
Q
—
порядок
сезонной
составляющей
SMA(
Q
);
s
—
размерность
сезонности
(
месяц
,
квартал
и
т
.
д
.).
Регрессионные
модели
Регрессионные
алгоритмы
являются
моделью
обучения
с
учителем
,
когда
на
вход
алгоритма
пода
-
ется
обучающая
выборка
,
содержащая
ряд
призна
-
ков
и
переменную
,
соответствующую
этому
ряду
.
В
ходе
обучения
модель
подбирает
коэффициенты
формулы
регрессии
и
в
дальнейшем
может
строить
прогноз
на
произвольное
количество
шагов
.
Однако
сама
логика
временного
ряда
состоит
в
том
,
чтобы
мы
опирались
на
предыдущее
значение
,
прогнози
-
руя
текущее
.
Таким
образом
,
одним
из
ключевых
признаков
для
обучения
прогнозных
моделей
с
ис
-
пользованием
регрессионных
алгоритмов
является
разница
между
текущим
и
предыдущим
значением
или
лаг
.
Используемая
в
статистике
регрессионная
модель
зависимости
одной
(
объясняемой
,
зави
-
симой
)
переменной
y
от
другой
или
нескольких
других
переменных
(
факторов
,
регрессоров
,
неза
-
висимых
переменных
)
x
с
линейной
функцией
за
-
висимости
.
Модель
линейной
регрессии
является
часто
используемой
и
наиболее
изученной
в
эко
-
нометрике
.
А
именно
изучены
свойства
оценок
параметров
,
получаемых
различными
методами
при
предположениях
о
вероятностных
характе
-
ристиках
факторов
,
и
случайных
ошибок
модели
.
Предельные
(
асимптотические
)
свойства
оценок
нелинейных
моделей
также
выводятся
исходя
из
аппроксимации
последних
линейными
моделями
.
Необходимо
отметить
,
что
с
эконометрической
точки
зрения
более
важное
значение
имеет
ли
-
нейность
по
параметрам
,
чем
линейность
по
фак
-
торам
модели
[10].
Однако
линейная
регрессия
очень
чувствительна
к
выбросам
,
которые
сильно
искажают
ее
результаты
.
Робастные
методы
представляют
собой
форму
регрессионного
анализа
,
разработанную
для
пре
-
одоления
некоторых
ограничений
традиционных
параметрических
и
непараметрических
методов
.
На
практике
наличие
в
выборках
даже
небольшого
числа
резко
выделяющихся
наблюдений
(
выбро
-
сов
)
способно
сильно
повлиять
на
результат
иссле
-
дования
,
например
,
метод
наименьших
квадратов
и
метод
максимального
правдоподобия
подверже
-
ны
такого
рода
искажениям
,
и
значения
,
получае
-
мые
в
результате
исследования
,
могут
перестать
нести
в
себе
какой
-
либо
смысл
.
Для
исключения
влияния
таких
помех
используются
различные
под
-
ходы
для
снижения
влияния
«
плохих
»
наблюдений
(
выбросов
),
либо
полного
их
исключения
.
Основ
-
ная
задача
робастных
методов
—
отличить
«
пло
-
хое
»
наблюдение
от
«
хорошего
» [11].
Широкое
распространение
получили
методы
,
основанные
на
алгоритмах
решающих
деревьев
.
Структура
дерева
представляет
собой
«
листья
»
и
«
ветки
».
На
ребрах
(«
ветках
»)
дерева
решения
записаны
атрибуты
,
от
которых
зависит
целевая
функция
,
в
«
листьях
»
записаны
значения
целевой
функции
,
а
в
остальных
узлах
—
атрибуты
,
по
кото
-
рым
различаются
случаи
.
Чтобы
классифицировать
новый
случай
,
надо
спуститься
по
дереву
до
листа
и
выдать
соответствующее
значение
.
Подобные
де
-
ревья
решений
широко
используются
в
интеллекту
-
альном
анализе
данных
.
Цель
состоит
в
том
,
чтобы
создать
модель
,
которая
предсказывает
значение
целевой
переменной
на
основе
нескольких
перемен
-
ных
на
входе
[12].
Также
часто
используются
так
называемые
ан
-
самблевые
методы
,
суть
которых
в
построении
сильного
ансамбля
из
простых
моделей
.
Напри
-
мер
,
решающий
лес
на
основе
решающих
деревьев
либо
алгоритмы
на
основе
бустинга
,
в
основе
ко
-
торого
процедура
последовательного
построения
композиции
алгоритмов
машинного
обучения
,
когда
каждый
следующий
алгоритм
стремится
компенси
-
ровать
недостатки
композиции
всех
предыдущих
алгоритмов
[13].
Для
исследования
были
отобраны
регрессион
-
ные
алгоритмы
из
состава
открытой
библиотеки
sklearn (Bayesian Ridge, Elastic Net CV, Huber Re-
gressor, Lasso Lars CV, Orthogonal Matching Pursuit
CV, Linear Regression, DecisionTreeRegressor, Extra-
TreesRegressor, RandomForestRegressor)
и
библио
-
теки
xgboost (XGBRegressor).
2.
Подготовка
данных
для
прогнозирования
потребления
электроэнергии
при
помощи
модели
ARIMA
Главным
условием
использования
модели
ARIMA
является
стационарность
временного
ряда
.
Для
про
-
верки
ряда
на
стационарность
воспользуемся
рас
-
ширенным
тестом
Дики
-
Фуллера
[14].
Результаты
проверки
приведены
на
рисунке
6.
Критерий
Дики
-
Фуллера
для
исходного