28
Прогнозирование вероятности
аварийных отключений
на объектах электросетевого
комплекса
Бурдуков
Н
.
И
.,
заместитель
главного
инженера
по
Ленинградской
области
ПАО
«
Ленэнерго
»
Галеев
М
.
Т
.,
начальник
ситуационно
-
аналитического
центра
ПАО
«
Ленэнерго
»
Волтов
И
.
П
.,
главный
специалист
ситуационно
-
аналитического
центра
ПАО
«
Ленэнерго
»
Сегодня
все
больше
компаний
производственной
отрасли
понимают
ценность
накоплен
-
ной
информации
и
энергетика
здесь
не
исключение
.
Но
все
же
,
как
из
объема
разно
-
образной
(
почти
всегда
неструктурированной
)
информации
получить
тот
необходимый
объем
данных
,
который
будет
полезен
для
стратегического
планирования
и
системного
управления
организацией
или
предприятием
?
СЛОЖНОСТИ
ВЫБОРА
МОДЕЛИ
ПРОГНОЗИРОВАНИЯ
АВАРИЙНЫХ
СОБЫТИЙ
НА
ОБЪЕКТАХ
ЭЛЕКТРОСЕТЕВОГО
ХОЗЯЙСТВА
Во
многих
лидирующих
компаниях
энергетической
отрасли
в
настоящее
время
созданы
специализи
-
рованные
структурные
подразделения
—
ситуаци
-
онные
аналитические
центры
(
САЦ
).
Их
основная
задача
—
анализ
состояния
объектов
управления
и
прогнозирование
развития
проблемной
ситуации
.
В
случае
,
когда
речь
идет
о
прогнозировании
в
си
-
туационном
управлении
энергетической
компанией
,
прежде
всего
,
подразумеваем
вероятность
аварий
-
ных
отключений
(
аварийных
событий
)
в
определен
-
ный
период
по
заданным
параметрам
.
Бесспорно
,
при
создании
такого
«
высшего
алгоритма
»
прогно
-
зирования
,
принятие
стратегических
управленческих
решений
упростится
,
что
приведет
к
заметной
эконо
-
мической
выгоде
предприятия
.
СПР
АВК
А
РАБОТА
С
«
БОЛЬШИМИ
ДАННЫМИ
», «
ГЛУБИННЫЙ
АНАЛИЗ
ДАННЫХ
»
Термины
Big Data, Data Mining
или
статистический
бутстреп
(bootstrapping).
Сейчас
эти
сло
-
ва
все
чаще
и
чаще
появляют
-
ся
при
работе
с
аналитической
отчетностью
.
И
здесь
встает
философская
проблема
:
борь
-
ба
эвристики
и
теории
,
эври
-
стических
методов
и
формали
-
стики
,
опирающейся
на
точные
математические
модели
.
У
сторонников
эвристиче
-
ской
методологии
сразу
же
по
-
является
закономерная
мысль
о
применении
специализиро
-
ванного
программного
обе
-
спечения
с
механизмом
«
ма
-
шинного
обучения
» (Machine
Learning)
для
прогнозирова
-
ния
,
где
все
наши
модели
бу
-
дут
«
обучаться
»,
проще
гово
-
ря
,
меняться
в
зависимости
от
накопленных
данных
.
Но
при
создании
модели
машинного
обучения
,
отвечающей
за
ве
-
роятность
аварийных
отклю
-
чений
в
электросетях
,
мы
на
первом
же
этапе
столкнемся
с
проблемой
:
аварийные
от
-
ключения
могут
быть
вызва
-
ны
факторами
,
отсутствую
-
щими
в
обучающей
выборке
,
а
так
же
возможна
«
некор
-
ректность
»
входных
данных
.
К
сожалению
,
эту
проблему
не
решает
увеличение
объ
-
ема
выборки
,
как
в
других
случаях
.
Поэтому
разработка
алгоритма
машинного
обуче
-
ния
«
Вероятность
аварийных
отключений
в
электросетях
»
требует
самой
тесной
консо
-
лидации
знаний
специалистов
технического
отдела
компа
-
нии
(
внутренние
факторы
)
и
ситуационного
управления
(
внешние
факторы
).
А
также
IT-
специалиста
,
который
все
эти
факторы
сможет
интегри
-
ровать
в
единый
«
высший
»
алгоритм
.
Очевидно
,
что
в
са
-
мом
ближайшем
будущем
будет
создана
такая
модель
,
оптимизированная
к
эксплуа
-
тации
.
Исследовательские
рабо
-
ты
по
поиску
«
значимости
»
связей
внешних
и
внутренних
факторов
начаты
в
ПАО
«
Лен
-
энерго
»
с
января
2017
года
.
ЭЛЕКТРОСНАБЖЕНИЕ
29
Американскому
философу
Джорджу
Сантаяна
принадлежит
очень
красивый
образ
: «
Подобно
тому
,
как
все
искусства
тяготеют
к
музыке
,
все
науки
стре
-
мятся
к
математике
».
Прежде
всего
,
при
создании
прогнозов
для
каждого
фактора
должна
быть
вы
-
брана
и
обоснована
своя
математическая
модель
.
Математическое
представление
должно
быть
мак
-
симально
оптимизировано
к
эксплуатации
,
в
этом
и
состоит
обоснованность
модели
.
К
примеру
,
мы
можем
воспользоваться
аппаратом
математической
статистики
,
выбрать
теорию
вероятностей
,
постро
-
ить
модель
с
неким
количеством
параметров
.
Мо
-
дель
будет
настроена
по
предыдущим
историческим
результатам
превосходно
.
Но
результат
прогноза
на
завтра
разойдется
с
реальностью
настолько
,
что
мо
-
дель
окажется
вредной
.
Эта
модель
не
оптимизиро
-
вана
к
эксплуатации
.
Второй
вопрос
(
но
не
менее
важный
)
связан
с
про
-
веркой
значимости
влияния
параметров
на
прогноз
.
ОСОБЕННОСТИ
ПОИСКА
ЗАКОНОМЕРНОСТЕЙ
В
СТАТИСТИЧЕСКОЙ
ИНФОРМАЦИИ
,
ПРОГНОЗИРОВАНИЕ
ВРЕМЕННЫХ
РЯДОВ
Использование
научного
подхода
требует
от
анали
-
тика
,
осуществляющего
прогнозирование
,
знания
на
-
чального
состояния
объекта
и
законов
их
изменения
.
Следовательно
,
для
синтеза
прогноза
аналитику
требуется
составить
гипотезу
о
временной
развертке
событий
(
сформировать
теорию
),
исходя
из
сведе
-
ний
о
состоянии
интересующего
объекта
.
До
начала
исследовательских
работ
в
ПАО
«
Лен
-
энерго
»
была
разработана
сравнительная
характери
-
стика
возможных
методов
анализа
данных
(
таблица
1).
В
ней
рассмотрены
наиболее
характерные
методы
,
ис
-
ходя
из
разнородности
входных
данных
и
маленького
«
шага
»
временных
рядов
(
как
выяснилось
позже
,
для
многих
параметров
будущей
системы
).
В
сентябре
2016
года
в
ситуационно
-
аналити
-
ческом
центре
ПАО
«
Ленэнерго
»
начались
рабо
-
ты
по
глубокому
анализу
отчетности
об
аварийных
событиях
на
объектах
электросетевого
комплекса
в
2014–2016
годах
.
Одной
из
целей
данной
детали
-
зированной
работы
стало
выявление
модели
прогно
-
зирования
,
обладающей
наибольшей
точностью
.
После
предварительного
анализа
природы
ста
-
тистических
данных
было
решено
воспользоваться
классическими
методами
,
так
как
,
выбирая
данный
путь
исследований
можно
было
«
убить
двух
зайцев
».
Во
-
первых
,
основательно
проработать
сам
класси
-
ческий
(
статистический
)
метод
и
добиться
его
опти
-
мизации
математическими
методами
.
Во
-
вторых
,
на
Табл
. 1.
Сравнительная
характеристика
возможных
методов
анализа
данных
Способ
(
алгоритм
)
Точность
Масштаби
-
руемость
Пригодность
к
исполь
зованию
Трудо
емкость
Быстрота
Классические
методы
(
линейная
регрессия
)
нейтральная
высокая
высокая
(
легко
адаптируемая
)
низкая
(
нейтральная
)
высокая
Нейронные
сети
высокая
низкая
низкая
нейтральная
(
высокая
)
низкая
Полиномиальные
нейронные
сети
высокая
высокая
высокая
низкая
(
нейтральная
)
низкая
(
нейтральная
)
основании
заключений
классического
метода
соста
-
вить
связи
(
зависимости
)
для
нейронных
сетей
и
их
разновидностей
.
Был
составлен
план
исследовательских
работ
и
список
действий
для
построения
прогностической
модели
,
включавший
в
себя
:
1.
Анализ
временной
последовательности
на
пред
-
мет
наличия
пропущенных
и
выпадающих
зна
-
чений
(
в
случае
необходимости
,
коррекция
этих
значений
).
2.
Определение
наличия
тренда
и
его
типа
.
Опреде
-
ление
наличия
периодичности
в
последователь
-
ности
.
3.
Проверка
последовательности
на
стационар
-
ность
.
4.
Анализ
последовательности
на
предмет
необходи
-
мости
предварительной
обработки
(
логарифмиро
-
вание
,
взятие
разнос
тей
).
5.
Выбор
модели
.
6.
Определение
параметров
модели
.
Прогноз
на
ос
-
новании
выбранной
модели
.
7.
Оценка
точности
прогнозирования
модели
.
8.
Анализ
характера
ошибок
выбранной
модели
.
9.
Определение
адекватности
выбранной
модели
и
,
в
случае
необходимости
,
ее
замена
и
возвра
-
щение
к
предыдущим
пунктам
.
После
подготовки
исходных
данных
для
анализа
(
агрегирования
),
определилась
весьма
интересная
закономерность
сильной
зависимости
количества
аварийных
отключений
от
некоторых
(
не
всех
)
погод
-
ных
факторов
.
ОПИСАНИЕ
МОДЕЛИ
.
ДАЛЬНЕЙШЕЕ
РАЗВИТИЕ
ПРОГНОЗИРОВАНИЯ
КОЛИЧЕСТВА
АВАРИЙНЫХ
ОТКЛЮЧЕНИЙ
В
ПАО
«
ЛЕНЭНЕРГО
»
В
процессе
определений
зависимости
каждого
ис
-
следуемого
параметра
на
количество
аварийных
от
-
ключений
в
сетях
ПАО
«
Ленэнерго
»
использовались
классические
методы
проверки
гипотез
—
t
-
критерий
Стьюдента
и
F
-
тест
.
Наиболее
сильными
параметрами
,
имеющими
значение
близкое
к
1 (
или
–1,
в
случае
обратной
свя
-
зи
)
по
критерию
Стьюдента
,
оказались
семь
погод
-
ных
факторов
:
1)
скорость
ветра
;
2)
направление
ветра
;
3)
температура
воздуха
;
4)
относительная
влажность
воздуха
;
5)
точка
росы
;
6)
относительное
атмосферное
давления
;
7)
погодные
явления
(
дождь
,
гроза
,
морось
,
снег
,
туман
).
№
2 (41) 2017
30
Чтобы
составить
общую
формулу
прогно
-
зирования
—
линейно
регрессионную
—
необ
-
ходимо
было
перевести
некоторые
парамет
ры
в
фиктивные
переменные
.
Например
, «
погод
-
ные
явления
»
и
«
направление
ветра
»
не
могут
напрямую
попасть
в
модель
прогнозирования
(
рисунок
1).
В
этих
целях
была
проведена
про
-
цедура
«
оцифровки
» (
переменным
приписы
-
вались
цифровые
метки
по
определенным
правилам
).
Таким
образом
,
с
точки
зрения
математики
,
наши
номинальные
переменные
превратились
в
фиктивные
переменные
.
Для
всех
остальных
(
нефиктивных
)
пере
-
менных
коэффициенты
просчитываются
по
стандартным
правилам
,
с
помощью
метода
наименьших
квадратов
.
Отдельно
рассчитан
и
введен
в
модель
параметр
сезонности
(
три
сезона
:
лето
,
зима
,
осень
-
весна
;
имеющие
свой
«
вес
»
на
основе
анализа
временных
рядов
).
Построение
ад
-
дитивных
моделей
сезонности
,
где
значение
признака
в
период
времени
t
представляется
в
виде
суммы
трех
слагаемых
(
тренда
,
сезон
-
ности
,
случайной
компоненты
),
закрыло
во
-
прос
количества
аварийных
событий
в
осен
-
не
-
зимний
период
.
В
итоге
математическая
модель
получи
-
лась
очень
гибкой
,
позволяющей
вводить
до
-
статочно
много
новых
параметров
в
систему
(
естественно
,
после
доказательства
значимо
-
сти
параметра
).
Как
видно
из
графика
модели
прогнози
-
рования
и
реальных
значений
аварийных
со
-
бытий
,
значения
прогноза
почти
всегда
совпадают
с
реальными
значениями
и
всегда
попадают
в
прогно
-
зируемый
коридор
(
рисунок
2).
Это
говорит
о
пригод
-
ности
модели
к
эксплуатации
.
Для
того
чтобы
сузить
коридор
и
избежать
явно
выпадающих
значений
,
на
последнем
этапе
в
систему
вводится
метод
Гаусса
-
Зейделя
и
Фибоначчи
.
Эти
ма
-
тематические
формулы
позволяют
минимизировать
отклонения
прогноза
от
реальных
значений
.
В
результате
после
завершения
всех
этапов
ис
-
следования
,
стало
очевидно
,
что
полученная
модель
имеет
большую
статистическую
мощность
и
отвечает
на
все
поставленные
первостепенные
задачи
:
Автоматизация
—
модель
способна
обрабаты
-
вать
большие
потоки
входных
данных
;
модель
легко
интегрировать
с
системой
управления
базы
данных
.
Точность
—
изначально
модель
имела
коэффи
-
циент
детерминации
(
зависимость
всех
переменных
модели
)
равный
70%,
но
при
вводе
дополнительных
значимых
параметров
(
t
-
критерий
Стьюдента
боль
-
ше
0,8)
этот
показатель
увеличивается
;
также
увели
-
чение
точности
прогноза
достигнуто
путем
ввода
в
си
-
стему
методов
сглаживания
динамических
рядов
.
Адаптируемость
—
в
зависимости
от
целей
и
за
-
дач
модель
можно
применять
на
разных
географиче
-
ских
и
временных
уровнях
,
что
не
потребует
полного
перерасчета
математической
составляющей
,
а
толь
-
ко
отдельных
параметров
.
Гибкость
—
построение
модели
из
начальных
па
-
раметров
дает
возможность
экспериментировать
при
Рис
. 1.
График
зависимости
аварийных
отключений
от
силы
ветра
(
определенный
исследуемый
период
,
определенная
геогра
-
фическая
область
) —
зависимость
почти
линейная
Рис
. 2.
График
модели
прогнозирования
по
погодным
парамет
рам
:
Y-
отклик
—
реальное
количество
аварийных
событий
; Y-
прогноз
—
прогнозируемая
величина
;
Макс
-
Мин
—
прогнозируемый
коридор
ее
реализации
и
в
процессе
эксплуатации
(
тем
самым
обеспечивается
необходимая
гибкость
модели
).
Все
закономерности
,
открытые
в
ходе
аналитиче
-
ских
работ
,
будут
основой
для
продолжения
иссле
-
дований
и
создания
более
совершенного
механизма
прогнозирования
/
моделирования
,
своего
рода
«
выс
-
шего
»
алгоритма
.
Стоит
отметить
,
что
текущая
модель
,
разрабо
-
танная
в
ПАО
«
Ленэнерго
»,
строит
прогнозы
общего
количества
аварийных
событий
за
определенный
пе
-
риод
(
от
одной
до
восьми
недель
).
Это
необходимо
учитывать
при
работе
в
рамках
системной
аналитики
.
Сейчас
в
ПАО
«
Ленэнерго
»
идут
работы
по
опре
-
делению
взаимосвязей
между
другими
внешними
факторами
,
а
также
внутренними
(
индекс
состояния
оборудования
,
графики
ТО
и
другие
).
Это
позволит
воплотить
более
совершенную
модель
прогнозирова
-
ния
аварийных
отключений
в
создаваемой
«
Единой
базе
данных
САЦ
ПАО
«
Ленэнерго
».
ЛИТЕРАТУРА
1.
Елисеева
И
.
И
.,
Курышева
С
.
В
.
Фиктивные
переменные
в
анализе
данных
//
Социология
:
методология
,
методы
,
математическое
моделирование
, 2010,
№
30.
С
. 43–63.
2.
Чубукова
И
.
А
. Data Minning [
Электронный
ресурс
].
URL: http://www.kodges.ru/komp/database/336211-data-
mining-2016.html.
3.
Лукашин
Ю
.
П
.
Адаптивные
методы
краткосрочного
про
-
гнозирования
временных
рядов
.
М
.:
Изд
-
во
«
Финансы
и
статистика
», 2003. 415
с
.
ЭЛЕКТРОСНАБЖЕНИЕ
Оригинал статьи: Прогнозирование вероятности аварийных отключений на объектах электросетевого комплекса
Сегодня все больше компаний производственной отрасли понимают ценность накопленной информации и энергетика здесь не исключение. Но все же, как из объема разнообразной (почти всегда неструктурированной) информации получить тот необходимый объем данных, который будет полезен для стратегического планирования и системного управления организацией или предприятием?