66
УПРАВЛЕНИЕ
СЕТЯМИ
Особенности подготовки и обработки
данных для прогнозирования
событий в распределительных
электрических сетях
В
2006 году, выступая на
конференции по марке-
тингу, математик Клайв
Хамби высказал тезис,
который сейчас определяет раз-
витие не только отдельно взятых
IT-фирм, но и целых отраслей:
«Данные — это новая нефть. Как
и нефть, они ценны, но не сами по
себе, а благодаря продуктам на их
основе. Данные должны быть об-
работаны, проанализированы для
того, чтобы извлечь из них цен-
ность, повысить рентабельность
бизнеса». Что мы видим спустя
полторы декады — большие объ-
емы данных, или Big Data, ста-
новятся частью бизнес-модели
в различных направлениях дея-
тельности. Аналитики компании
IDC прогнозируют, что к 2025 году
во всем мире объем информации,
который накоплен компаниями
и потребителями, достигнет от-
метки в 163 зеттабайта. По срав-
нению с 2016 годом этот показа-
тель вырастет в 10 раз.
По наблюдениям Ассоциации
больших данных, в Российской
Федерации данные от таких от-
раслей, как телекоммуникации
или IT, используются для обуче-
ния нейросетей гораздо чаще,
чем данные таких отраслей, как
металлургия, ретейл или нефте-
газовая отрасль. Данные же от
электроэнергетики пока никак не
фигурируют в отчетах. С чем это
связано и как можно изменить си-
туацию — пойдет речь в статье.
Для начала отметим основные
особенности, связанные с под-
готовкой и обработкой данных
в распределительных электриче-
ских сетях:
• события в электроэнергетике
происходят достаточно редко;
• отсутствуют описания проис-
ходящих событий в открытом
доступе (только в журнале
диспетчера), откуда следует
проблема классификации дан-
ных — сопоставить реальные
события и полученные данные;
• фактически отсутствуют специ-
ализированные для нейросе-
тей устройства регистрации
нормального/аномального
поведения распределительной
электросети;
• нет понимания необходимых
типов данных для сбора и для
использования в алгоритмах
нейросетевого анализа;
• в текущих временных рядах,
получаемых из штатных реги-
страторов, преимущественно
нет достаточной для построе-
ния моделей нейросети часто-
ты дискретизации;
• недостаточно налажен процесс
сотрудничества разработчиков
искусственного интеллекта
с пользователем;
• в отрасли отсутствует пони-
мание необходимости сбора
данных нормального режима
работы РЭС;
• в применяемых системах мо-
ниторинга отсутствует подхо-
дящая организация процесса
сбора и хранения данных.
Постараемся рассмотреть все
по порядку. Для чего мы хотим
собирать данные? В первую оче-
редь, актуальные данные помо-
гают нам строить статистические
модели и производить аналитиче-
ские выводы, что в свою очередь
дает повод для внесения измене-
ний в систему с целью достиже-
ния лучших показателей эффек-
тивности самой системы. Более
качественный анализ, подразуме-
вающий разделение классифици-
рованных данных по соответству-
ющим кластерам и использование
методов искусственного интел-
лекта, может дать нам больше —
предиктивную аналитику.
Цифровизация электроэнер-
гетики идет полным ходом, про-
должаясь уже не первый год, и на
первый взгляд может показаться,
что с введением новых цифро-
вых РЭС количество данных,
пригодных для проведения ста-
тистического анализа, должно
расти прямо пропорционально их
количеству. На деле все гораздо
сложнее, ведь отрасль электро-
энергетики характеризуется не-
стабильной и, на первый взгляд,
не поддающейся прогнозиро-
ванию частотой возникновения
аварийных ситуаций. Добавляя
к этому отсутствие специализи-
рованных устройств регистрации
данных и недостаточное понима-
ние типов данных, необходимых
для качественного анализа, мы
сталкиваемся с проблемой по-
лучения, сбора и обработки дан-
ных, а впоследствии с проблемой
построения архитектуры нейро-
сети для дальнейшего прогнози-
рования. Вдобавок ко всему, во
многих даже цифровых РЭС не
уделяется достаточно внимания
организации хранения данных,
а также электронному докумен-
тообороту.
Допустим, что мы собрали до-
статочно данных хорошего каче-
ства в виде аварийных событий
Синяков
С
.
А
.,
руководитель отдела разработки ПО МНПП «АНТРАКС»
67
(более 500 тысяч штук), провели
анализ и разработали модель
нейросети, которая с учетом то-
пологии и особенностей цифрово-
го РЭС способна решить задачу
прогнозирования, но далее, что-
бы наложить данные на реальные
события, необходимо изучить эти
500 тысяч событий из записей
журнала диспетчера и сопоста-
вить их с набором данных.
На данный момент такого пол-
ноценного обучения нейросети не
существует, так как невозможно
специально создавать сотни и ты-
сячи аварийных ситуаций в реаль-
ной работающей распределитель-
ной сети.
Несмотря на все эти трудно-
сти и нетривиальность задачи, мы
в компании АНТРАКС сможем ее
решить, и вот что мы делаем. Мы
имеем достаточное количество
устройств, которые адаптированы
и серифицированы для цифрови-
зации РЭС и которые уже установ-
лены на объектах несколько лет.
Эти приборы способны не только
регистрировать аварийные собы-
тия (ОЗЗ и МФЗ), но и записывать
данные в виде осциллограмм ава-
рийных процессов, протекающих
в распределительной сети. Также
Рис
. 1.
Количество
данных
с
некоторых
РЭС
,
в
которых
установлены
устройства
АНТРАКС
Числ
о осцилл
ограмм
РЭС
18
РЭС
12
РЭС
6
РЭС
15
РЭС
9
РЭС
3
РЭС
17
РЭС
11
РЭС
5
РЭС
14
РЭС
8
РЭС
2
РЭС
16
РЭС
10
РЭС
4
РЭС
13
РЭС
7
РЭС
1
20 k
15 k
10 k
5 k
0
нами разработана система мо-
ниторинга воздушных линий —
КОМОРСАН, архитектура БД ко-
торой позволяет обращаться к ар-
хивным данным (рисунок 1).
Мы взяли некоторое количе-
ство временных рядов, записан-
ных нашими устройствами ИКЗ-
В34Л, установленными в разных
местах, и попробовали обучить
нейросеть на имеющихся дан-
ных. Результаты были положи-
тельны, и мы поняли, что харак-
теристики приборов позволяют
нам использовать их как реги-
страторы данных.
Собраны более 170 тысяч ос-
циллограмм с более чем 8 тысяч
устройств ИКЗ-В34Л. В текущий
момент эти данные делятся ал-
горитмами искусственного ин-
теллекта на условные кластеры,
внутри которых определены ха-
рактеристики данных для опре-
деленного типа события, такого
как пробой изолятора, например,
или коммутационные перенапря-
жения. Некоторые кластеры со-
держат внутри себя шум с точки
зрения физических параметров,
однако, когда эти и другие дан-
ные будут однозначно размече-
ны при помощи журналов аварий
диспетчера, искусственный ин-
теллект, в отличие от человека,
сможет не просто отличать их
от нормального режима работы,
но и оценивать относительную
вероятность причастности шума
к конкретному событию в распре-
делительной сети (рисунок 2).
Тут мы подобрались к основ-
ной проблеме подготовки данных
для распределительных сетей —
это их разметка.
Для дальнейшего развития
продвинутого подхода в электро-
энергетике нам требуется убе-
дить персонал в необходимости
сотрудничать с искусственным
интеллектом — от персонала
требуется помогать размечать
происходящие события.
Алгоритмы должны явно по-
нимать, чем данные об обрыве
провода отличаются от данных,
связанных, скажем, с ускорен-
ным старением изоляции и по-
вреждением
электрооборудо-
вания. В нашем проекте с нами
сотрудничает несколько РЭС
в разных частях страны, которые
заинтересованы в развитии циф-
ровизации своих объектов. Из
этих пилотных РЭС мы получаем
информацию о событиях, запи-
№
2 (65) 2021
68
УПРАВЛЕНИЕ
СЕТЯМИ
санных в оперативных журналах
диспетчеров, затем наши data-
инженеры размечают собранные
на их пилотных фидерах данные
и наши разработчики обучают
нейросеть на полученные тем
самым события, одновременно
проверяя их принадлежность
к кластерам данных, упомянутых
выше. И если события попадают
в какой-либо неопределенный
кластер, уже содержащий сотни
или тысячи временных рядов, то
нейросеть переобучается и точ-
ность определения события рез-
ко возрастает.
В основу формирования да-
та-сета для обучения нейросети
должны ложиться все аномалии
относительного нормального ре-
жима работы, зафиксированные
в распределительной сети (рису-
нок 3). Для это необходим «отпе-
чаток пальца» РЭС. В пилотных
регионах мы обязательно сни-
маем нормальный режим работы
сети. Зачастую энергетики счита-
ют, что регистрация нормального
режима работы — это излишние
затраты. Однако непрерывные
временные ряды с достаточной
частотой дискретизации могут
дать понимание о характере ра-
боты распределительной сети
и режим, кажущийся нормаль-
ным, при обработке искусствен-
ным интеллектом может показать
нам индивидуальный рисунок
РЭС, связанный с особенностя-
ми его инфраструктуры.
Именно отклонения от нормы,
дают нам возможность осущест-
влять предиктивную аналитику
поведения распределительной
сети. А с привязкой к топологии
мы получаем прогностику по от-
дельным участкам сети или по
отдельным элементам инфра-
структуры. Например, возможно
выявлять часто повреждаемые
участки сети с селекцией по типу
аварий и причине возникнове-
ния или, скажем, предотвращать
ускоренное старение изоляции
и повреждение электрооборудо-
вания.
Несомненно, потенциал при-
менения предиктивной аналити-
ки в распределительных сетях
огромен, как, к слову, в работе
трансформаторов и электродви-
гателей. Для того чтобы его реа-
лизовать, мы с вами должны со-
действовать подготовке данных
для разработчиков интеллек-
туальных систем, а также вно-
сить новые критерии к данным
и устройствам, входящих в си с-
темы цифровизации.
Р
Рис
. 2.
Пример
распределения
аварий
по
типам
для
отдельно
взятого
РЭС
Числ
о осцилл
ограмм
ОЗЗ
С
вперед
ОЗЗ
А
ОЗЗ
А
назад
ОЗЗ
В
назад
ОЗЗ
С
МФЗ
АС
ОЗЗ
В
вперед
ОЗЗ
В
МФЗ
АВ
ОЗЗ
С
назад
ОЗЗ
А
вперед
МФЗ
ВС
МФЗ
АВС
70
60
50
40
30
20
10
0
МФЗ
ОЗЗ
Рис
. 3.
Алгоритм
работы
Оригинал статьи: Особенности подготовки и обработки данных для прогнозирования событий в распределительных электрических сетях
В 2006 году, выступая на конференции по маркетингу, математик Клайв Хамби высказал тезис, который сейчас определяет развитие не только отдельно взятых IT-фирм, но и целых отраслей: «Данные — это новая нефть. Как и нефть, они ценны, но не сами по себе, а благодаря продуктам на их основе. Данные должны быть обработаны, проанализированы для того, чтобы извлечь из них ценность, повысить рентабельность бизнеса». Что мы видим спустя полторы декады — большие объемы данных, или Big Data, становятся частью бизнес-модели в различных направлениях деятельности. Аналитики компании IDC прогнозируют, что к 2025 году во всем мире объем информации, который накоплен компаниями и потребителями, достигнет отметки в 163 зеттабайта. По сравнению с 2016 годом этот показатель вырастет в 10 раз.