Прогнозирование потребления электроэнергии. Практика применения

Page 1
background image

Page 2
background image

44

э

н

е

р

г

о

э

ф

ф

е

к

т

и

в

н

о

с

т

ь

энергоэффективность

Прогнозирование 
потребления 
электроэнергии.
Практика применения

УДК

 621.31

Современные

 

тенденции

 

развития

 

рынка

 

электроэнер

-

гетики

 

в

 

Российской

 

Федерации

 

характеризуются

 

по

-

стоянным

 

ростом

 

цен

 

на

 

ресурсы

которые

 

необходимы

 

топливно

-

энергетическому

 

комплексу

 

для

 

непрерывного

 

производства

 

электроэнергии

удорожанием

 

процесса

 

возведения

 

новых

 

электростанций

 

и

 

энергосетей

 

для

 

транспортировки

 

энергии

 

и

 

повсеместным

 

ростом

 

не

-

платежеспособности

 

предприятий

-

потребителей

 

электро

-

энергии

Реформирование

 

РАО

 «

ЕЭС

 

России

» 

в

 2008 

году

 

привело

 

всех

 

участников

 

образовавшегося

 

оптового

 

рынка

 

электроэнергии

 

и

 

мощности

 

к

 

необходимости

 

вы

-

рабатывать

 

свои

 

уникальные

 

стратегии

 

и

 

инструменты

 

использования

 

энергоресурсов

 

с

 

целью

 

обеспечения

 

баланса

 

между

 

вырабатываемой

 

и

 

потребляемой

 

энерги

-

ей

В

 

данной

 

статье

 

производится

 

сравнение

 

различных

 

способов

 

прогнозирования

 

потребления

 

электроэнер

-

гии

 

с

 

использованием

 

алгоритмов

 

машинного

 

обучения

 

и

 

статистических

 

методов

 

на

 

примере

 

прогноза

 

потреб

-

ления

 

электроэнергии

 

на

 

собственные

 

нужды

ПС

 500 

кВ

 «

Челябинская

» 

ПАО

 «

ФСК

 

ЕЭС

».

Мигранов

 

М

.

М

.,

инженер

 1 

категории

 

ОИС

службы

 

ИС

 

и

 

СС

 

филиала

ПАО

 «

ФСК

 

ЕЭС

» — 

МЭС

 

Урала

магистрант

 

ЧелГУ

Устинов

 

А

.

А

.,

магистрант

 

ЧелГУ

Мельников

 

А

.

В

.,

д

.

т

.

н

., 

профессор

 

ЧелГУ

Ключевые

 

слова

:

машинное

 

обучение

электро

-

энергетика

прогнозирование

 

временных

 

рядов

прогнозиро

-

вание

 

потребления

 

электро

-

энергии

Keywords:

machine learning, electric 
power, time series forecasting, 
forecasting of electricity 
consumption

ВВЕДЕНИЕ

На

 

сегодняшний

 

день

 

оптовый

 

рынок

 

электроэнергии

 

и

 

мощности

 

Россий

-

ской

 

Федерации

 

представляет

 

собой

 

двухуровневую

 

систему

 — 

оптовый

 

и

 

розничный

 

рынки

Участниками

 

дан

-

ного

 

рынка

 

являются

 

генерирующие

 

компании

  (

продавцы

 

электроэнергии

 

и

 

мощности

), 

сбытовые

 

компании

сетевые

 

компании

крупные

 

потре

-

бители

  (

покупатели

 

электроэнергии

 

и

 

мощности

). 

На

 

оптовом

 

рынке

 

элек

-

троэнергии

 

функционирует

 

несколько

 

секторов

различаются

 

они

 

условиями

 

заключения

 

сделок

 

и

 

сроками

 

постав

-

ки

сектор

 

регулируемых

 

договоров

сектор

 

свободных

 

договоров

рынок

 

на

 

сутки

 

вперед

  (

РСВ

), 

балансирую

-

щий

 

рынок

 (

БР

).

Основной

 

объем

 

производимой

 

электроэнергии

 

продается

 

в

 

одном

 

секторе

который

 

и

 

формирует

 

пла

-

новое

 

потребление

, — 

рынок

 

на

 

сутки

 

вперед

  (

РСВ

). 

На

 

РСВ

 

коммерческий

 

оператор

 

ОАО

  «

АТС

» 

проводит

 

кон

-

курентный

 

отбор

 

ценовых

 

заявок

 

по

-

ставщиков

 

и

 

покупателей

 

за

 

сутки

 

до

 


Page 3
background image

45

реальной

 

поставки

 

электроэнергии

 

с

 

определением

 

цен

 

и

 

объемов

 

поставки

 

на

 

каждый

 

час

 

суток

Однако

 

фактическое

 

потребление

 

неизбежно

 

отличается

 

от

 

планового

и

 

именно

 

поэтому

 

был

 

создан

 

баланси

-

рующий

 

рынок

На

 

БР

 

осуществляется

 

торговля

 

от

-

клонениями

 

от

 

планового

 

производства

/

потребления

 

в

 

режиме

 

реального

 

времени

.

В

 

сложившихся

 

рыночных

 

условиях

 

ценообразо

-

вывающим

 

фактором

 

электроэнергии

 

при

 

расчете

 

конечной

 

цены

 

отпуска

 

ее

 

потребителям

 

для

 

энер

-

госбытовой

 

компании

 

является

 

ее

 

стоимость

 

приоб

-

ретения

 

на

 

РСВ

При

 

данном

 

факторе

 

использова

-

ние

 

актуальных

 

методов

 

прогнозирования

а

 

также

 

современного

 

программного

 

обеспечения

 

совместно

 

с

 

системами

 

автоматизированного

 

контроля

 

учета

 

электроэнергии

  (

АСКУЭ

представляет

 

стратегиче

-

ский

 

и

 

экономический

 

интересы

Отличие

 

цен

 

элек

-

троэнергии

 

на

 

БР

 

от

 

РСВ

 

в

 

Российской

 

Федерации

 

составляет

 15–40%.

Постоянно

 

изменяющиеся

 

условия

 

рынка

объемы

 

покупаемой

 

энергии

 

и

 

объемы

 

энергии

 

для

 

транспор

-

тировки

 

создают

 

необходимость

 

сетевым

 

организаци

-

ям

 

в

 

прогнозировании

количества

 

энергии

которую

 

необходимо

 

поставить

 

потребителям

нагрузки

 

на

 

се

-

тевые

 

мощности

 

организации

вероятности

 

возникно

-

вения

 

поломок

 

на

 

линиях

 

передачи

количества

 

энер

-

гозатрат

 

на

 

собственные

 

нужды

 

для

 

поддержания

 

основной

 

хозяйственной

 

деятельности

.

Из

 

перечисленного

 

выше

 

следует

что

 

получение

 

максимально

 

возможной

 

точности

 

построения

 

про

-

гнозов

 

с

 

помощью

 

используемых

 

прогностических

 

моделей

 

энергопотребления

 

представляет

 

экономи

-

ческий

 

интерес

 

как

 

для

 

сетевых

так

 

и

 

для

 

сбытовых

 

компаний

.

Актуальность

 

задачи

 

прогнозирования

 

потре

-

бления

 

электроэнергии

 

для

 

отечественной

 

электро

-

энергетики

 

подтверждается

 

и

 

обширным

 

списком

 

научных

 

работ

проведенных

 

российскими

 

иссле

-

дователями

Следует

 

отметить

 

следующие

 

работы

опубликованные

 

за

 

последние

 

годы

Грицай

 

А

.

С

«

Гиб

 

ридный

 

метод

 

краткосрочного

 

прогнозирования

 

потребления

 

электрической

 

энергии

 

для

 

энергос

-

бытового

 

предприятия

 

с

 

учетов

 

метеофкаторов

», 

2017 

г

.; 

Абдурахманов

 

А

.

М

. «

Методы

 

прогнозиро

-

вания

 

электропотребления

 

в

 

распределительных

 

сетях

», 2016 

г

.; 

Соломахо

 

К

.

Л

  «

Применение

 

метода

 

главных

 

компонент

 

для

 

прогнозирования

 

объемов

 

электропотребления

 

энергосбытового

 

предпри

-

ятия

», 2015 

г

.; 

Хуссейн

 

А

.

З

. «

Повышение

 

точности

 

краткосрочного

 

прогнозирования

 

электрической

 

на

-

грузки

 

потребителей

 

региона

 

с

 

учетом

 

метеофакто

-

ров

 

на

 

основе

 

метода

 

опорных

 

векторов

», 2015 

г

.; 

Кошарная

 

Ю

.

В

. «

Разработка

 

методики

 

анализа

 

па

-

раметров

 

электропотребления

 

для

 

их

 

нормирова

-

ния

 

и

 

оценки

 

объемов

 

энергосбережения

 

при

 

про

-

ведении

 

энергоаудита

 

предприятий

 

и

 

организаций

», 

2015 

г

.; 

Гарифуллин

 

Ш

.

Р

. «

Прогнозирование

 

потре

-

бления

 

электроэнергии

 

с

 

помощью

 

методов

 

машин

-

ного

 

обучения

», 2015 

г

.; 

Гофман

 

А

.

В

. «

Моделиро

-

вание

 

электропотребления

 

многономенклатурного

 

предприятия

 

для

 

краткосрочного

 

прогнозирования

», 

2013 

г

.; 

Белов

 

К

.

И

. «

Автоматизированная

 

система

 

прогнозирования

 

потребления

 

электрической

 

энер

-

гии

 

предприятием

», 2012 

г

.; 

Валь

 

П

.

В

. «

Краткосроч

-

ное

 

прогнозирование

 

электропотребления

 

горного

 

предприятия

 

в

 

условиях

 

оптового

 

рынка

 

электро

-

энергии

 

и

 

мощности

», 2012 

г

.; 

Бажинов

 

А

.

Н

. «

Метод

 

прогнозирования

 

объемов

 

потребления

 

электро

-

энергии

 

предприятием

 

черной

 

металургии

 

на

 

основе

 

нейро

-

нечетких

 

алгоритмов

», 2011 

г

.; 

Анушина

 

Е

.

С

«

Система

 

краткосрочного

 

прогнозирования

 

электри

-

ческой

 

нагрузки

», 2009 

г

.; 

Гордеев

 

А

.

С

. «

Прогнозиро

-

вание

 

электропотребления

 

объектов

 

с

 

применением

 

искусственных

 

нейронных

 

сетей

», 2008 

г

.

ЗАДАЧА

Объект

 

исследования

 

— 

объекты

 

электросетевого

 

хозяйства

 

ПАО

 «

ФСК

 

ЕЭС

».

Предмет

 

исследования

 — 

потребление

 

электро

-

энергии

 

на

 

собственные

 

нужды

 

субъектами

 

электро

-

сетевого

 

хозяйства

 

предприятия

модели

 

и

 

методы

 

краткосрочного

 

прогнозирования

 

потребления

 

элек

-

троэнергии

.

Цель

 

исследования

 — 

сравнение

 

методов

 

кратко

-

срочного

 

прогнозирования

 

потребления

 

электро

-

энергии

 

для

 

объектов

 

электросетевого

 

хозяйства

 

ПАО

 «

ФСК

 

ЕЭС

».

Задачи

 

исследования

:

1) 

провести

 

обзор

 

методов

 

прогнозирования

 

вре

-

менных

 

рядов

;

2) 

провести

 

отбор

 

алгоритмов

 

для

 

построения

 

моде

-

лей

 

прогнозирования

 

потребления

 

электроэнергии

;

3) 

подготовить

 

данные

 

для

 

составления

 

краткосроч

-

ного

 

прогноза

 

потребления

 

электроэнергии

;

4) 

подготовить

 

прогнозные

 

модели

;

5) 

провести

 

сравнение

 

результатов

 

прогнозных

 

мо

-

делей

.

В

 

качестве

 

опорных

 

данных

 

будут

 

использованы

 

данные

 

потребления

взятые

 

из

 

АИИС

 

КУЭ

 

четы

-

рех

 

ТСН

 0,4 

кВ

 

ПС

 500 

кВ

 «

Челябинская

» 

за

 

период

 

с

 01.01.2014 

по

 06.11.2017. 

Для

 

хранения

 

и

 

предо

-

бработки

 

расчетных

 

данных

 

используются

 

библиоте

-

ки

 pandas, numpy, autocleaner, 

для

 

расчетов

 

исполь

-

зуются

 

библиотеки

 

машинного

 

обучения

 xgboost, 

scikit-learn, statsmodels, seasonals. 

Визуализация

 

выполнена

 

при

 

помощи

 

библиотек

 matplotlib.pyplot, 

seaborn, plotly. 

1. 

Обзор

 

методов

 

прогнозирования

временных

 

рядов

Для

 

начала

 

необходимо

 

ввести

 

определение

 

вре

-

менного

 

ряда

.

Временной

 

ряд

 — 

это

 

последовательность

 

зна

-

чений

описывающих

 

протекающий

 

во

 

времени

 

про

-

цесс

измеренных

 

в

 

последовательные

 

моменты

 

времени

обычно

 

через

 

равные

 

промежутки

 [1].

Используемые

 

для

 

целей

 

и

 

задач

 

прогнозирова

-

ния

 

временные

 

ряды

 

экономических

 

показателей

 

об

-

ладают

 

рядом

 

особенностей

Так

 

как

 

временной

 

ряд

 

является

 

последовательностью

 

значений

в

 

котором

 

каждое

 

следующее

 

значение

 

содержит

 

в

 

себе

 

про

-

шлое

 

для

 

последующих

то

 

любая

 

попытка

 

прогнози

-

ровать

 

будущее

 

без

 

исследования

 

временных

 

рядов

 

прошлого

 

является

 

ненаучной

 

и

 

ошибочной

Поэто

-

му

 

для

 

получения

 

достаточно

 

точных

 

и

 

надежных

 

прогнозов

 

необходимо

 

подробно

 

изучить

 

настоящее

 

 2 (47) 2018


Page 4
background image

46

состояние

 

явления

 

или

 

процесса

Например

раз

-

ложить

 

ряд

 

на

 

составные

 

компоненты

 

и

 

устранить

 

влияние

 

систематических

 

компонент

 

на

 

изменение

 

случайных

проверить

 

ряд

 

на

 

наличие

 

основной

 

тен

-

денции

 

и

 

при

 

наличии

 

таковой

 

провести

 

ее

 

выде

-

ление

выявить

 

тренд

 

и

 

его

 

направление

  (

критерий

 

Аббе

-

Линника

критерий

 

Кокса

-

Стюарта

критерий

 

Фостера

-

Стюарта

), 

определить

 

сезонность

  (

мульти

-

пликативная

 

или

 

аддитивная

), 

избавить

 

ряд

 

от

 

не

-

стационарности

  (

взятие

 

разностей

преобразование

 

Бокса

-

Кокса

). 

Выявление

 

указанных

 

параметров

 

временного

 

ряда

 

очень

 

важно

 

для

 

выбора

 

после

-

дующей

 

модели

 

прогнозирования

 

и

 

без

 

проведения

 

предварительного

 

анализа

 

невозможно

 

построить

 

качественную

 

модель

.

Метод

 

средних

Воспользуемся

 

наивным

 

предположением

что

  «

завтра

 

будет

как

 

вчера

», 

однако

 

примем

 

утверждение

что

 

будущее

 

потре

-

бление

 

зависит

 

от

 

среднего

 n 

его

 

предыдущих

 

значений

а

 

значит

воспользуемся

 

скользящей

 

сред

-

ней

 [2].

Сделать

 

такой

 

прогноз

 

долго

-

срочным

 

не

 

удастся

 — 

для

 

полу

-

чения

 

прогноза

 

на

 

период

 

вперед

 

необходимо

чтобы

 

предыдущий

 

период

 

был

 

фактически

 

наблю

-

даемым

Однако

 

скользящую

 

среднюю

 

можно

 

использовать

 

и

 

для

 

другой

 

цели

 — 

сглаживания

 

исходного

 

ряда

 

для

 

выявления

 

тренда

Чем

 

больше

 

будет

 

ширина

тем

 

более

 

сглаженным

 

будет

 

тренд

В

 

на

-

шем

 

случае

 

тренды

 

очевидны

и

 

сглаживание

 

по

 

неделям

 

и

 

ме

-

сяцам

 

лишь

 

сгладит

 

общий

 

гра

-

фик

 

потребления

 (

рисунки

 1 

и

 2).

Модификацией

 

простой

 

скользящей

 

средней

 

является

 

так

 

называемая

 

взвешенная

 

средняя

внутри

 

которой

 

наблю

-

дениям

 

придаются

 

различные

 

веса

в

 

сумме

 

дающие

 

едини

-

цу

при

 

этом

 

обычно

 

последним

 

наблюдениям

 

присваивается

 

больший

 

вес

Подобная

 

модель

 

обладает

 

возможностью

 

на

-

стройки

 

в

 

сравнении

 

с

 

простой

 

моделью

 

скользящей

 

средней

.

Экспоненциальные

 

сглаживания

Взвесим

 

все

 

доступные

 

на

-

блюдения

экспоненциально

 

уменьшая

 

веса

 

по

 

мере

 

углубле

-

ния

 

в

 

исторические

 

данные

Для

 

этого

 

воспользуемся

 

формулой

 

простого

 

экспоненциального

 

сгла

-

живания

 [3]:

t

 = 



yt 

+ (1

 

– 

– 1.

Здесь

 

значение

 

прогноза

 

представляет

 

собой

 

средневзвешенную

 

между

 

текущим

 

истинным

 

и

 

пре

-

дыдущим

 

модельным

 

значениями

 — 

сглажива

-

ющий

 

фактор

С

 

его

 

помощью

 

определяется

как

 

быстро

 

будет

 «

забываться

» 

последнее

 

доступное

 

на

-

блюдение

Чем

 

меньше

 

сглаживающий

 

фактор

тем

 

больше

 

влияния

 

оказывают

 

предыдущие

 

модельные

 

значения

и

 

тем

 

сильнее

 

сглаживается

 

ряд

.

В

 

данном

 

случае

 

экспоненциальность

 

модели

 

в

 

ее

 

рекурсивности

 — 

каждый

 

раз

 

мы

 

умножаем

 (1 – 

на

 

предыдущее

 

модельное

 

значение

которое

 

также

 

со

-

держало

 

в

 

себе

 (1 – 

), 

и

 

так

 

до

 

начала

 

наблюдений

 

(

рисунок

 3). 

Изменяя

 

вес

 

мы

 

можем

 

добиться

 

приемлемого

 

качества

 

прогноза

однако

как

 

и

 

модель

 

скользящей

 

Рис

. 1. 

Суточный

 

тренд

Рис

. 2. 

Недельный

 

тренд

Дата

По

тре

бление

кВ

/

ч

2014-01

1000

800

600

400

200

0

2014-07

2015-01

2015-06

2016-01

2016-07

2017-01

2017-07

2018-01

Реальное

 

потребление

Скользящая

 

средняя

 

тренда

Дата

По

тре

бление

кВ

/

ч

2014-01

1000

800

600

400

200

0

2014-07

2015-01

2015-06

2016-01

2016-07

2017-01

2017-07

2018-01

Реальное

 

потребление

Скользящая

 

средняя

 

тренда

Рис

. 3. 

Экспоненциальное

 

сглаживание

Наблюдения

По

тре

бление

кВ

/

ч

0

5000

1000

800

600

400

200

0

10000

15000

20000

25000

30000

35000

Реальное

 

потребление

 = 0,3

 = 0,05

ЭНЕРГО-

ЭФФЕКТИВНОСТЬ


Page 5
background image

47

и

 

взвешенной

 

средней

такая

 

мо

-

дель

 

позволяет

 

делать

 

прогноз

 

лишь

 

на

 

одну

 

точку

 

вперед

что

 

явно

 

недостаточно

 

для

 

решения

 

задачи

 

прогнозирования

 

потре

-

бления

 

электроэнергии

.

Разобьем

 

ряд

 

на

 

две

 

составля

-

ющие

 — 

уровень

 

и

 

тренд

 

Уро

-

вень

  (

ожидаемое

 

значение

 

ряда

мы

 

предсказывали

 

с

 

помощью

 

вышеописанных

 

моделей

теперь

 

же

 

применим

 

экспоненциальное

 

сглаживание

 

к

 

тренду

полагая

что

 

будущее

 

направление

 

изме

-

нения

 

ряда

 

зависит

 

от

 

взвешен

-

ных

 

предыдущих

 

изменений

 [3]:

l

x

 = 

y

x

 + (1 – 

) (

l

x

 – 1

 + 

b

x

 – 1

);

b

x

 = 



(

l

x

 – 

l

x

 – 1

) + (1 – 

b

x

 – 1

;

x

 + 1

 = 

l

x

 

b

x

.

Результатом

 

такого

 

разбиения

 

является

 

набор

 

функций

Первая

 

из

 

них

 

описывает

 

уровень

завися

-

щий

как

 

и

 

прежде

от

 

текущего

 

значения

 

ряда

а

 

вто

-

рое

 

слагаемое

 

разбивается

 

на

 

предыдущее

 

значение

 

уровня

 

и

 

тренда

Вторая

 

функция

 

отвечает

 

за

 

тренд

зависящий

 

от

 

изменения

 

уровня

 

на

 

текущем

 

шаге

 

и

 

от

 

предыдущего

 

значения

 

тренда

Финальный

 

про

-

гноз

 

является

 

суммой

 

модельных

 

значений

 

уровня

 

и

 

тренда

 (

рисунок

 4).

Сочетание

 

параметров

 

 

и

 

 

позволяет

 

тонко

 

на

-

строить

 

модель

 

двойного

 

экспоненциального

 

сглажи

-

вания

Первый

 

отвечает

 

за

 

сглаживание

 

ряда

 

трен

-

да

второй

 — 

за

 

сглаживание

 

самого

 

тренда

Чем

 

выше

 

значения

тем

 

больший

 

вес

 

будет

 

у

 

последних

 

наблюдений

и

 

тем

 

менее

 

будет

 

сглаживаться

 

мо

-

дельный

 

ряд

Модель

 

двойного

 

экспоненциального

 

сглаживания

 

позволяет

 

делать

 

прогноз

 

сразу

 

на

 

два

 

периода

 

вперед

.

Теперь

 

добавим

 

третью

 

компоненту

 — 

сезон

-

ность

Стоит

 

оговориться

что

 

данный

 

метод

 

при

-

меним

 

лишь

 

в

 

случае

когда

 

исходный

 

ряд

 

обладает

 

сезонностью

что

 

справедливо

 

для

 

исходных

 

данных

 

эксперимента

Данная

 

компонента

 

объяснит

 

повто

-

ряющие

 

колебания

 

вокруг

 

уровня

 

и

 

тренда

а

 

харак

-

теризуется

 

она

 

длиной

 

сезона

 — 

периодом

после

 

которого

 

начинаются

 

повторения

 

колебаний

Для

 

каждого

 

наблюдения

 

в

 

сезоне

 

формируется

 

своя

 

компонента

например

если

 

длина

 

сезона

 

составля

-

ет

 7 (

к

 

примеру

сезонная

 

компонента

), 

то

 

получим

 

сезонных

 

компонент

Получим

 

новую

 

систему

:

l

x

 = 

 (

y

x

 – 

s

x

 – 

L

) + (1 – 

) (

l

x

 – 1

 + 

b

x

 – 1

);

b

x

 = 



(

l

x

 – 

l

x

 – 1

) + (1 – 

b

x

 – 1

;

s

x

 = 



(

y

x

 – 

l

x

) + (1 – 

s

x

 – 

L

;

x

 + 

m

 = 

l

x

 

m

 

b

x

 

s

x

 – 

L

 + 1 + (

m

 – 1) 

mod 

L

.

Уровень

 

теперь

 

зависит

 

от

 

текущего

 

значения

 

ряда

 

за

 

вычетом

 

соответствующей

 

сезонной

 

компоненты

тренд

 

остается

 

без

 

изменений

а

 

сезонная

 

компонен

-

та

 

зависит

 

от

 

текущего

 

значения

 

ряда

 

за

 

вычетом

 

уровня

 

и

 

от

 

предыдущего

 

значения

 

компоненты

При

 

этом

 

компоненты

 

сглаживаются

 

через

 

все

 

доступные

 

Рис

. 4. 

Двойное

 

экспоненциальное

 

сглаживание

Наблюдения

По

тре

бление

кВ

/

ч

0

5000

1500

1250

1000

750

500

250

0

-250

10000

15000

20000

25000

30000

35000

Реальное

 

потребление

 = 0,9, 

 = 0,9

 = 0,9, 

 = 0,02

 = 0,02, 

 = 0,9

 = 0,02, 

 = 0,02

Рис

. 5. 

Сравнение

 

стационарных

 

и

 

нестационарных

 

рядов

 

Стационарные

 

ряды

 

Нестационарные

 

ряды

сезоны

например

если

 

это

 

компонента

отвечающая

 

за

 

понедельник

то

 

и

 

усредняться

 

она

 

будет

 

только

 

с

 

другими

 

понедельниками

Теперь

имея

 

сезонную

 

компоненту

появляется

 

возможность

 

делать

 

прогноз

 

на

 

произвольное

 

количество

 (

m

шагов

Получившаяся

 

модель

 

называется

 

моделью

 

трой

-

ного

 

экспоненционального

 

сглаживания

 

или

 

моде

-

лью

 

Хольта

-

Винтерса

 [4]. 

Следует

 

отметить

что

 

качество

 

моделей

осно

-

ванных

 

на

 

экспоненциальном

 

сглаживании

сильно

 

зависит

 

от

 

подбора

 

коэффициентов

размерности

 

исходных

 

данных

зашумленности

 

данных

сезонно

-

сти

 

и

 

т

.

д

Эконометрический

 

подход

Перед

 

тем

 

как

 

перейти

 

к

 

использованию

 

экономе

-

трического

 

подхода

определим

 

понятие

 

стационар

-

ности

Под

 

стационарностью

 

понимают

 

свойство

 

про

-

цесса

 

не

 

менять

 

своих

 

статистических

 

характеристик

 

с

 

течением

 

времени

  (

постоянство

 

математического

 

ожидания

гомоскедастичность

и

 

независимость

 

ко

-

вариационной

 

функции

 

от

 

времени

 (

рисунок

 5) [5]. 

 2 (47) 2018


Page 6
background image

48

 

В

 

чем

 

заключается

 

важность

 

стационарности

Большинство

 

моделей

 

временных

 

рядов

 

модели

-

руют

 

математическое

 

ожидание

 

либо

 

дисперсию

и

 

в

 

случае

 

нестационарности

 

ряда

 

предсказания

 

бу

-

дут

 

неверными

Определим

 

понятие

 ARIMA.

ARIMA (

англ

. autoregressive integrated moving 

average, 

иногда

 

модель

 

Бокса

-

Дженкинса

методо

-

логия

 

Бокса

-

Дженкинса

) — 

интегрированная

 

модель

 

авторегрессии

 — 

скользящего

 

среднего

 — 

модель

 

и

 

методология

 

анализа

 

временных

 

рядов

Является

 

расширением

 

моделей

 ARMA 

для

 

нестационарных

 

временных

 

рядов

которые

 

можно

 

сделать

 

стацио

-

нарными

 

взятием

 

разностей

 

некоторого

 

порядка

 

от

 

исходного

 

временного

 

ряда

  (

так

 

называемые

 

инте

-

грированные

 

или

 

разностно

-

стационарные

 

времен

-

ные

 

ряды

) [6]. 

SARIMA 

является

 

модификацией

 

модели

 ARIMA 

(

так

 

называемая

 Seasonal ARIMA). 

Общий

 

вид

 

мо

-

дели

 ARIMA(

p,d,q

)(

P,D,Q

)

.

В

 

этой

 

модели

 

параметры

 

обозначают

 

следующее

:

p

 — 

порядок

 

модели

 AR(

p

); 

d

 — 

порядок

 

интегрирования

 

исходных

 

данных

;

q

 — 

порядок

 

модели

 MA(

q

); 

P

 — 

порядок

 

сезонной

 

составляющей

 SAR(

P

);

D

 — 

порядок

 

интегрирования

 

сезонной

 

составляющей

;

Q

 — 

порядок

 

сезонной

 

составляющей

 SMA(

Q

); 

s

 — 

размерность

 

сезонности

 (

месяц

квартал

 

и

 

т

.

д

.).

Регрессионные

 

модели

Регрессионные

 

алгоритмы

 

являются

 

моделью

 

обучения

 

с

 

учителем

когда

 

на

 

вход

 

алгоритма

 

пода

-

ется

 

обучающая

 

выборка

содержащая

 

ряд

 

призна

-

ков

 

и

 

переменную

соответствующую

 

этому

 

ряду

В

 

ходе

 

обучения

 

модель

 

подбирает

 

коэффициенты

 

формулы

 

регрессии

 

и

 

в

 

дальнейшем

 

может

 

строить

 

прогноз

 

на

 

произвольное

 

количество

 

шагов

Однако

 

сама

 

логика

 

временного

 

ряда

 

состоит

 

в

 

том

чтобы

 

мы

 

опирались

 

на

 

предыдущее

 

значение

прогнози

-

руя

 

текущее

Таким

 

образом

одним

 

из

 

ключевых

 

признаков

 

для

 

обучения

 

прогнозных

 

моделей

 

с

 

ис

-

пользованием

 

регрессионных

 

алгоритмов

 

является

 

разница

 

между

 

текущим

 

и

 

предыдущим

 

значением

 

или

 

лаг

.

Используемая

 

в

 

статистике

 

регрессионная

 

модель

 

зависимости

 

одной

  (

объясняемой

зави

-

симой

переменной

 

y

 

от

 

другой

 

или

 

нескольких

 

других

 

переменных

 (

факторов

регрессоров

неза

-

висимых

 

переменных

x

 

с

 

линейной

 

функцией

 

за

-

висимости

Модель

 

линейной

 

регрессии

 

является

 

часто

 

используемой

 

и

 

наиболее

 

изученной

 

в

 

эко

-

нометрике

А

 

именно

 

изучены

 

свойства

 

оценок

 

параметров

получаемых

 

различными

 

методами

 

при

 

предположениях

 

о

 

вероятностных

 

характе

-

ристиках

 

факторов

и

 

случайных

 

ошибок

 

модели

Предельные

  (

асимптотические

свойства

 

оценок

 

нелинейных

 

моделей

 

также

 

выводятся

 

исходя

 

из

 

аппроксимации

 

последних

 

линейными

 

моделями

Необходимо

 

отметить

что

 

с

 

эконометрической

 

точки

 

зрения

 

более

 

важное

 

значение

 

имеет

 

ли

-

нейность

 

по

 

параметрам

чем

 

линейность

 

по

 

фак

-

торам

 

модели

 [10]. 

Однако

 

линейная

 

регрессия

 

очень

 

чувствительна

 

к

 

выбросам

которые

 

сильно

 

искажают

 

ее

 

результаты

.

Робастные

 

методы

 

представляют

 

собой

 

форму

 

регрессионного

 

анализа

разработанную

 

для

 

пре

-

одоления

 

некоторых

 

ограничений

 

традиционных

 

параметрических

 

и

 

непараметрических

 

методов

На

 

практике

 

наличие

 

в

 

выборках

 

даже

 

небольшого

 

числа

 

резко

 

выделяющихся

 

наблюдений

  (

выбро

-

сов

способно

 

сильно

 

повлиять

 

на

 

результат

 

иссле

-

дования

например

метод

 

наименьших

 

квадратов

 

и

 

метод

 

максимального

 

правдоподобия

 

подверже

-

ны

 

такого

 

рода

 

искажениям

и

 

значения

получае

-

мые

 

в

 

результате

 

исследования

могут

 

перестать

 

нести

 

в

 

себе

 

какой

-

либо

 

смысл

Для

 

исключения

 

влияния

 

таких

 

помех

 

используются

 

различные

 

под

-

ходы

 

для

 

снижения

 

влияния

 «

плохих

» 

наблюдений

 

(

выбросов

), 

либо

 

полного

 

их

 

исключения

Основ

-

ная

 

задача

 

робастных

 

методов

 — 

отличить

  «

пло

-

хое

» 

наблюдение

 

от

 «

хорошего

» [11].

Широкое

 

распространение

 

получили

 

методы

основанные

 

на

 

алгоритмах

 

решающих

 

деревьев

Структура

 

дерева

 

представляет

 

собой

  «

листья

» 

и

  «

ветки

». 

На

 

ребрах

 («

ветках

») 

дерева

 

решения

 

записаны

 

атрибуты

от

 

которых

 

зависит

 

целевая

 

функция

в

  «

листьях

» 

записаны

 

значения

 

целевой

 

функции

а

 

в

 

остальных

 

узлах

 — 

атрибуты

по

 

кото

-

рым

 

различаются

 

случаи

Чтобы

 

классифицировать

 

новый

 

случай

надо

 

спуститься

 

по

 

дереву

 

до

 

листа

 

и

 

выдать

 

соответствующее

 

значение

Подобные

 

де

-

ревья

 

решений

 

широко

 

используются

 

в

 

интеллекту

-

альном

 

анализе

 

данных

Цель

 

состоит

 

в

 

том

чтобы

 

создать

 

модель

которая

 

предсказывает

 

значение

 

целевой

 

переменной

 

на

 

основе

 

нескольких

 

перемен

-

ных

 

на

 

входе

 [12].

Также

 

часто

 

используются

 

так

 

называемые

 

ан

-

самблевые

 

методы

суть

 

которых

 

в

 

построении

 

сильного

 

ансамбля

 

из

 

простых

 

моделей

Напри

-

мер

решающий

 

лес

 

на

 

основе

 

решающих

 

деревьев

 

либо

 

алгоритмы

 

на

 

основе

 

бустинга

в

 

основе

 

ко

-

торого

 

процедура

 

последовательного

 

построения

 

композиции

 

алгоритмов

 

машинного

 

обучения

когда

 

каждый

 

следующий

 

алгоритм

 

стремится

 

компенси

-

ровать

 

недостатки

 

композиции

 

всех

 

предыдущих

 

алгоритмов

 [13].

Для

 

исследования

 

были

 

отобраны

 

регрессион

-

ные

 

алгоритмы

 

из

 

состава

 

открытой

 

библиотеки

 

sklearn (Bayesian Ridge, Elastic Net CV, Huber Re-
gressor, Lasso Lars CV, Orthogonal Matching Pursuit 
CV, Linear Regression, DecisionTreeRegressor, Extra-
TreesRegressor, RandomForestRegressor) 

и

 

библио

-

теки

 xgboost (XGBRegressor).

2. 

Подготовка

 

данных

 

для

 

прогнозирования

 

потребления

 

электроэнергии

 

при

 

помощи

 

модели

 ARIMA

Главным

 

условием

 

использования

 

модели

 ARIMA 

является

 

стационарность

 

временного

 

ряда

Для

 

про

-

верки

 

ряда

 

на

 

стационарность

 

воспользуемся

 

рас

-

ширенным

 

тестом

 

Дики

-

Фуллера

 [14]. 

Результаты

 

проверки

 

приведены

 

на

 

рисунке

 6.

Критерий

 

Дики

-

Фуллера

 

для

 

исходного