Ключевые проблемы в задачах интеллектуального распознавания образов состояния силовых выключателей

Page 1
background image

103

Ключевые проблемы в задачах 
интеллектуального распознавания 
образов состояния силовых 
выключателей

УДК

 621.311

Хальясмаа

 

А

.

И

.,

к

.

т

.

н

., 

доцент

 

кафедры

 

«

Автоматизированные

 

электрические

 

системы

» 

УралЭНИН

 

ФГАОУ

 

ВО

 

УрФУ

 

им

Б

.

Н

Ельцина

Сенюк

 

М

.

Д

.,

магистр

 

кафедры

 

«

Автоматизированные

 

электрические

 

системы

» 

УралЭНИН

 

ФГАОУ

 

ВО

 

УрФУ

 

им

Б

.

Н

Ельцина

Ерошенко

 

С

.

А

.,

ассистент

 

кафедры

 

«

Автоматизированные

 

электрические

 

системы

» 

УралЭНИН

 

ФГАОУ

 

ВО

 

УрФУ

 

им

Б

.

Н

Ельцина

В

 

данной

 

статье

 

описаны

 

ключевые

 

проблемы

 

в

 

задачах

 

интеллектуального

 

распозна

-

вания

 

образов

 

состояния

 

силовых

 

масляных

 

выключателей

 

и

 

способы

 

их

 

возможного

 

решения

В

 

рамках

 

данного

 

исследования

 

представлены

 

результаты

 

апробации

 

разра

-

ботанной

 

авторами

 

системы

 

оценки

 

технического

 

состояния

 

силовых

 

выключателей

 

на

 

базе

 

методов

 

машинного

 

обучения

 

с

 

целью

 

оптимизации

 

графиков

 

ремонтов

 

и

 

замены

 

силовых

 

выключателей

 

на

 

основе

 

анализа

 

данных

 

технической

 

диагностики

 

и

 

ретро

-

спективных

 

данных

В

 

статье

 

также

 

были

 

выявлены

 

основные

 

требования

 

к

 

обучающей

 

выборке

 

для

 

распознавания

 

образов

 

состояния

 

силовых

 

выключателей

.

Ключевые

 

слова

:

силовой

 

выключатель

оценка

 

технического

 

состояния

машинное

 

обучение

распознавание

 

образов

обучающая

 

выборка

 

Keywords:

circuit breaker, technical 
state assessment, machine 
learning, patterns recognition, 
training sample

Н

а

 

сегодняшний

 

день

 

в

 

Единой

 

Энергосистеме

  (

ЕЭС

России

 

эксплу

-

атируется

 

около

 30 000 

силовых

 

выключателей

: 110 

кВ

 — 80,5%, 

220 

кВ

 — 15,2%, 330 

кВ

 — 1,2%, 500 

кВ

 — 3,0%, 750 

кВ

 — 0,1%. 

Большую

 

часть

 

выключателей

 

составляют

 

масляные

 

баковые

 

с

 

номи

-

нальным

 

напряжением

 110 

кВ

 

и

 220 

кВ

 (54%) [1]. 

Несмотря

 

на

 

то

что

 

производ

-

ство

 

выключателей

 

данного

 

типа

 

прекращено

 

из

-

за

 

высоких

 

трудозатрат

 

при

 

ремонте

 

и

 

эксплуатации

низких

 

показателей

 

безопасности

 

и

 

использования

 

морально

 

устаревшей

 

технологии

 

гашения

 

дуги

 

в

 

трансформаторном

 

масле

их

 

единовременная

 

замена

 

не

 

представляется

 

возможной

 

из

-

за

 

невозможно

-

сти

 

обеспечения

 

режимных

 

условий

 

на

 

время

 

ремонтной

 

кампании

 

и

 

высоких

 

финансовых

 

затрат

.

Сегодня

 

для

 

решения

 

представленной

 

задачи

 — 

с

 

целью

 

оптимизации

 

графиков

 

ремонтов

 

и

 

замены

 

силовых

 

выключателей

 

выполняется

 

анализ

 

их

 

технического

 

состояния

 

на

 

основе

 

результатов

 

испытаний

диагностики

 

и

 

ре

-

троспективных

 

данных

В

 

России

 

техническое

 

состояние

 

объектов

 

электро

-

энергетики

 

определяется

 

в

 

соответствии

 

с

 

РД

  «

Объемы

 

и

 

нормы

 

испытаний

 

электрооборудования

» [2].

Задача

 

оценки

 

технического

 

состояния

 

является

 

многопараметрической

 

за

-

дачей

для

 

решения

 

которой

 

использование

 

стандартных

 

математических

 

ме

-

тодов

 

на

 

жесткой

 

алгоритмической

 

основе

 

может

 

дать

 

неудовлетворительные

 

результаты

Это

 

связано

 

со

 

сложностью

 

анализируемого

 

объекта

 

и

 

тем

что

 

при

 

решении

 

поставленных

 

задач

 

приходится

 

оперировать

 

большим

 

объемом

 

входных

 

данных

 

не

 

только

 

числового

 

формата

но

 

и

 

лингвистического

для

 

ко

-

торых

 

характерны

 

неопределенность

неполнота

 

и

 

отсутствие

 

возможности

 

формальной

 

структуризации

 [3].

В

 

рамках

 

авторских

 

исследований

 [4] 

было

 

доказано

что

 

для

 

решения

 

за

-

дачи

 

оценки

 

технического

 

состояния

 

силовых

 

выключателей

 

возможно

 

приме

-

нение

 

методов

 

машинного

 

обучения

способных

 

реализовать

 

такие

 

функции

 

человеческого

 

интеллекта

как

 

выбор

 

оптимального

 

решения

 

на

 

основе

 

ранее

 

полученного

 

опыта

 

и

 

рационального

 

анализа

 

всей

 

доступной

 

информации

 

об

 

объекте

 

исследования

.

Под

 

машинным

 

обучением

 

понимается

 

класс

 

методов

характерной

 

чертой

 

которых

 

является

 

не

 

прямое

 

решение

 

задачи

а

 

обучение

 

в

 

процессе

 

решений

 

множества

 

аналогичных

 

задач

 

с

 

известным

 

ответом

 [5]. 

Применение

 

методов

 

машинного

 

обучения

 

позволяет

 

добиться

 

адаптивности

 

алгоритмов

выявить

 

скрытые

 

корреляции

 

и

 

определить

 

те

 

параметры

которые

 

имеют

 

наибольшее

 

влияние

 

на

 

функциональное

 

состояние

 

силовых

 

выключателей

 [6].

Качество

 

моделей

 

машинного

 

обучения

 

напрямую

 

зависит

 

от

 

параметров

 

об

-

учающей

 

выборки

объема

наличия

 

или

 

отсутствия

 

выбросов

значимости

 

пара

-

 5 (50) 2018


Page 2
background image

104

метров

 

и

 

т

.

д

Кроме

 

того

стоит

 

заметить

что

 

требова

-

ния

 

к

 

объему

 

и

 

структуре

 

обучающей

 

выборки

 

должны

 

разрабатываться

 

для

 

каждой

 

конкретной

 

задачи

.

В

 

данной

 

статье

 

описаны

 

основные

 

проблемы

 

и

 

требования

 

к

 

формированию

 

обучающей

 

выборки

 

в

 

задачах

 

интеллектуального

 

распознавания

 

обра

-

зов

 

технического

 

состояния

 

силовых

 

масляных

 

вы

-

ключателей

 110 

кВ

.

МОДЕЛЬ

 

ОЦЕНКИ

 

ТЕХНИЧЕСКОГО

 

СОСТОЯНИЯ

 

ВЫКЛЮЧАТЕЛЕЙ

 

НА

 

ОСНОВЕ

 

ГРАДИЕНТНОГО

 

БУСТИНГА

 

НАД

 

РЕШАЮЩИМИ

 

ДЕРЕВЬЯМИ

Для

 

распознавания

 

образов

 

технического

 

состоя

-

ния

 

силовых

 

выключателей

 

авторами

 

была

 

разра

-

ботана

 

и

 

программно

 

реализована

 

математическая

 

модель

 

на

 

языке

 Python 3 

с

 

помощью

 

алгоритма

 

гра

-

диентного

 

бустинга

 

деревьев

 

решений

 (XGBoost).

В

 

рамках

 

представленного

 

исследования

 

пошаго

-

вый

 

алгоритм

 

распознавания

 

образов

 

технического

 

состояния

 

силовых

 

выключателей

 

выглядит

 

следую

-

щим

 

образом

как

 

представлено

 

на

 

рисунке

 1.

В

 

качестве

 

алгоритма

 

машинного

 

обучения

 

был

 

выбран

 

градиентный

 

бустинг

 

деревьев

 

решений

где

 

дерево

 

решений

 — 

это

 

структура

 

данных

 

в

 

виде

 

древовидного

 

графа

 

и

 

в

 

каждом

 

узле

 

осуществля

-

ется

 

процесс

 

принятия

 

решений

 

по

 

заданным

 

усло

-

виям

а

 

градиентный

 

бустинг

 

является

 

инструмен

-

том

 

корректировки

 (

повышения

 

точности

обучения

 

исходного

 

решающего

 

дерева

реализуемый

 

по

 

средствам

 

пошагового

 

построения

 

новых

 

деревьев

 

относительно

 

исходного

 

по

 

критерию

 

минимиза

-

ции

 

ошибки

 

на

 

каждом

 

последующем

 

этапе

Дру

-

гими

 

словами

 — 

это

 

множество

 

последовательно

 

уточняющих

 

друг

 

друга

 

элементарных

 

моделей

где

 

n

-

я

 

элементарная

 

модель

 

обучается

 

на

 «

ошиб

-

ках

» 

множества

 

из

 

n

 – 1 

моделей

а

 

ответы

 

моделей

 

взвешенно

 

суммируются

 [7]. 

Алгоритм

 

градиентного

 

бустинга

 

над

 

деревьями

 

решений

 

в

 

данной

 

системе

 

реализован

 

таким

 

обра

-

зом

что

 

сначала

 

инициализируется

 

первый

 

базовый

 

алгоритм

 

b

0

 

и

 

для

 

n

 = 1, ..., 

N

 

последовательно

 

вычисляется

 

вектор

 

сдвига

 

S

который

 

показывает

как

 

нужно

 

скорректировать

 

прогнозы

 

уже

 

постро

-

енной

 

композиции

чтобы

 

уменьшить

 

ошибку

 

на

 

обучающей

 

выборке

:

 

s

n

 = (–2(

a

n

 – 1

(

x

1

) – 

y

1

), ..., –2(

a

n

 – 1

(

x

l

) – 

y

l

));  

(1)

 

строится

 

базовый

 

алгоритм

 

b

n

 

путем

 

приближения

 

его

 

ответов

 

на

 

обучающей

 

выборке

 

к

 

данным

 

сдвига

 

s

i

:

 

1

 

n

 

J

 

b

N

(

x

) = 

argmin — 

(

b

(

x

i

) – 

s

i

)

[

x

   

R

Nj

b

Nj

;   (2)

 

b

 

l

 

=

 

1

 

=

 

1

 

после

 

того

как

 

алгоритм

 

найден

он

 

добавляется

 

в

 

композицию

 

J

 

a

N

(

x

) = 

a

n

 – 1

(

x

) + 

[

x

   

R

Nj

b

Nj 

.  

(3)

 

=

 

1

Затем

 

выполняются

 

предыдущие

 

три

 

шага

 

до

 

тех

 

пор

пока

 

не

 

будет

 

выполнен

 

критерий

 

останова

В

 

результате

на

 

выходе

 

алгоритм

 

представляет

 

со

-

бой

 

кусочно

-

постоянную

 

функцию

описывающую

 

зависимость

 

состояния

 

Y

 (

или

 

дефекта

 

в

 

зависимо

-

сти

 

от

 

типа

 

и

 

вида

 

анализируемых

 

данных

от

 

раз

-

личных

 

параметров

 

функционирования

 

оборудова

-

ния

 

множества

 

X

n

Для

 

анализа

 

ошибки

 

тестирования

 

использова

-

лась

 

средняя

 

ошибка

 

Q

 

в

 

процентах

 [%] 

алгоритма

 

a

 

на

 

выборке

 

X

l

которая

 

рассчитывается

 

по

 

формуле

:

 

1

 

l

 

Q

(

a

,

 X

l

) = 

— 

|

a

(

x

 

y

*

(

x

)| · 100%, 

(4)

 

l

 

=

 

1

где

 |

a

(

x

 

y

*

(

x

)| — 

индикатор

 

ошибки

;  

y

*

(

x

) — 

целевая

 

зависимость

l

 — 

число

 

наблюдений

.

ТРЕБОВАНИЯ

К

 

ОБУЧАЮЩЕЙ

 

ВЫБОРКЕ

Метод

 

Бустинга

 

применяется

 

в

 

данной

 

задаче

 

с

 

це

-

лью

 

исключения

 

главного

 

недостатка

 

деревьев

 

ре

-

шений

 — 

склонности

 

к

 

переобучению

Переобучение

 

наблюдается

 

при

 

точности

 

алгорит

-

ма

превосходящей

 90%, 

а

 

оптималь

-

ной

 

является

 

точность

 80–85%. 

По

 

сути

все

 

далее

 

описанные

 

требова

-

ния

 

к

 

обучающей

 

выборке

 

и

 

являются

 

способами

 

борьбы

 

с

 

переобучением

Главными

 

преимуществами

 

дан

-

ного

 

метода

 

для

 

решения

 

пред

-

ставленной

 

задачи

 

являются

устой

-

чивость

 

алгоритма

 

к

 

выбросам

возможность

 

анализа

 

данных

 

с

 

про

-

пущенными

 

значениями

возмож

-

ность

 

работы

 

с

 

переменными

 

различ

-

ных

 

типов

а

 

также

 

возможность

 

его

 

автоматического

 

обучения

.

В

 

работе

 [8] 

было

 

определено

что

 

переобученную

 

модель

 

можно

 

вы

-

явить

 

по

 

величине

 

коэффициентов

 

мо

-

дели

Суть

 

метода

 L2-

регуляризации

 

заключается

 

в

 

переходе

 

от

 

безуслов

-

ной

 

минимизации

 

значения

 

функции

 

ошибки

 

модели

 

к

 

условной

 

с

 

помощью

 

дополнительного

 

слагаемого

:

КОНЕЦ

Загрузка

 

выборки

Обучение

 

алгоритма

 XGBoost

Фильтрация

Проверка

 

точности

 

алгоритма

 

на

 

тестовой

 

выборке

Нормализация

Вывод

 

значения

переменной

accuracy

Деление

 

выборки

на

 

тестовую

 

и

 

обучающую

НАЧАЛО

Рис

. 1. 

Алгоритм

 

распознавания

 

образов

 

технического

 

состояния

 

сило

-

вых

 

выключателей

ДИАГНОСТИКА

И МОНИТОРИНГ


Page 3
background image

105

 

d

 

|| 

w

|| 

2

 = 

 

w

j

2

, (5)

 

=

 

1

где

 || 

w

|| 

2

 — L2-

регуляризатор

d

 — 

количество

 

коэф

-

фициентов

 

модели

w

j

 — 

значение

 

j

-

ого

 

коэффици

-

ента

 — 

коэффициент

 

регуляризации

.

В

 

качестве

 

меры

 

неоднородности

 

обучающей

 

вы

-

борки

 

служит

 

значение

 

энтропии

 

H

 

распределений

 

плотности

 

вероятности

 

образов

 

в

 

обучающей

 

вы

-

борке

которую

 

можно

 

определить

 

по

 

следующему

 

выражению

:

 

d

 

H

 = –

p

log

2

 

p

i

, (5)

 

=

 

1

где

 

d

 — 

количество

 

классов

 

в

 

обучающей

 

выборке

p

i

 — 

плотность

 

вероятности

 

образа

 

i

 

в

 

обучающей

 

выборке

.

Также

 

стоит

 

заметить

что

 

задача

 

идентификации

 

состояния

 

электросетевого

 

оборудования

 

сопряже

-

на

 

с

 

проблемой

 

оценки

 

информативности

 

исходных

 

данных

 — 

обучающих

 

выборок

Для

 

каждого

 

типа

 

и

 

вида

 

оборудования

 

множество

 

параметров

 

явля

-

ется

 

индивидуальным

 

и

 

может

 

быть

 

выражено

 

как

 

в

 

числовой

так

 

и

 

в

 

лингвистической

 

форме

Все

 

вы

-

шесказанное

 

ведет

 

к

 

необходимости

 

адекватной

 

ми

-

нимизации

 

числа

 

признаков

 

состояний

Для

 

определения

 

информативности

 

признака

 

обучающей

 

выборки

 

применяется

 

корреляционный

 

анализ

суть

 

которого

 

заключается

 

в

 

анализе

 

коэф

-

фициентов

 

корреляции

значение

 

которых

 

может

 

быть

 

вычислено

 

по

 

следующему

 

выражению

:

 

(

x

i

 

– 

M

(

x

i

))(

y

i

 

– 

M

(

y

i

))

 

r

x

,

y

 = ——, (7)

 

___________________________________________________

 

 

(

x

i

 

– 

M

(

x

i

))

2

 

(

y

i

 

– 

M

(

y

i

))

2

где

 

x

i

 — 

значение

 

признака

 

i

y

i

  — 

i

-

й

 

образ

M

(

x

i

) — 

математическое

 

ожидание

 

признака

 

i

M

(

y

i

) — 

мате

-

матическое

 

ожидание

 

образов

 

в

 

обучающей

 

выборке

.

Если

 

значение

 

коэффициента

 

корреляции

 

при

-

знака

 

и

 

образа

 

состояния

 

силового

 

выключателя

 

со

-

ставляет

 

меньше

 0,2, 

то

 

данный

 

признак

 

может

 

быть

 

признан

 

незначимым

 

и

 

далее

 

может

 

не

 

учитываться

.

ПРИМЕР

 

ФОРМИРОВАНИЯ

ОБУЧАЮЩЕЙ

 

ВЫБОРКИ

Рассмотрим

 

анализ

 

задачи

 

формирования

 

обучаю

-

щей

 

выборки

 

на

 

примере

 

оценки

 

состояния

 50 

мас

-

ляных

 

выключателей

 110 

кВ

 

на

 

основе

 

совокупности

 

данных

 

технической

 

диагностики

Для

 

определения

 

требований

 

к

 

объему

 

обучающей

 

выборки

 

была

 

про

-

ведена

 

серия

 

расчетов

на

 

каждом

 

из

 

которых

 

фик

-

сировался

 

объем

 

выборки

 

и

 

определялась

 

точность

 

распознавания

 

образов

 

технического

 

состояния

 

си

-

ловых

 

выключателей

.

Для

 

масляных

 

баковых

 

выключателей

 110 

кВ

 

была

 

сформирована

 

выборка

в

 

которой

 

были

 

представ

-

лены

 

два

 

образа

 

состояния

 

силовых

 

выключателей

«

рабочее

 

состояние

» 

и

 «

предаварийное

 

состояние

». 

Образ

  «

ухудшенное

 

состояние

» 

в

 

выборку

 

включен

 

не

 

был

 

из

-

за

 

невозможности

 

точного

 

распознавания

 

с

 

учетом

 

шума

 

и

 

погрешности

 

исходных

 

данных

.

Выбор

 

признаков

 

обучающей

 

выборки

 

произво

-

дился

 

исходя

 

из

 

минимально

 

достаточного

 

доступ

-

ного

 

объема

 

данных

 

и

 

основных

 

неисправностей

 

масляных

 

баковых

 

выключателей

снижения

 

элек

-

трической

 

прочности

 

трансформаторного

 

масла

износа

 

основных

 

узлов

 

выключателя

 

и

 

увеличения

 

переходного

 

сопротивления

 

контактной

 

системы

В

 

выборку

 

были

 

включены

 

следующие

 

параметры

:

1) 

содержание

 

жидкости

 

и

 

механических

 

примесей

 

в

 

трансформаторном

 

масле

;

2) 

напряжение

 

пробоя

 

трансформаторного

 

масла

определяемое

 

в

 

соответствии

 

с

 

ГОСТ

 

Р

 

МЭК

 

60156-2013 «

Жидкости

 

изоляционные

Опреде

-

ление

 

напряжения

 

пробоя

 

на

 

промышленной

 

ча

-

стоте

»;

3) 

объем

 

трансформаторного

 

масла

;

4) 

собственное

 

время

 

отключения

 

и

 

включения

 

вы

-

ключателя

;

5) 

год

 

выпуска

;

6) 

год

 

истечения

 

нормативного

 

срока

 

службы

  (

свы

-

ше

 25 

лет

).

Для

 

вычисления

 

точности

 

модели

 

машинного

 

обу

-

чения

 

выборка

 

была

 

разделена

 

на

 

обучающую

 

и

 

тес

-

товую

 

в

 

соотношении

 80%/20% 

соответственно

.

К

 

данным

 

сформированной

 

выборки

 

были

 

при

-

менены

 

фильтрация

 

и

 

нормирование

 

и

 

определена

 

информативность

 

каждого

 

параметра

что

 

подробно

 

описано

 

авторами

 

в

 

исследовании

 [9]. 

В

 

результа

-

те

 

из

-

за

 

низкой

 

корреляции

  (

менее

 0,2) 

из

 

выборки

 

были

 

удалены

 

следующие

 

параметры

 

обучающей

 

выборки

время

 

отключения

/

включения

 

выключате

-

ля

 

и

 

масса

 

масла

.

Требования

 

к

 

обучающим

 

выборкам

 

в

 

задачах

 

ин

-

теллектуального

 

распознавания

 

образов

 

состояния

 

силовых

 

выключателей

 

были

 

разработаны

 

на

 

осно

-

ве

 

серии

 

расчетов

 

с

 

помощью

 

алгоритма

 XGBoost, 

реализованного

 

в

 

среде

 Python 3.

Для

 

алгоритма

 XGBoost 

использовались

 

следую

-

щие

 

параметры

рекомендованные

 

в

 

работе

 [9]:

1) 

максимальная

 

глубина

 

решающего

 

дерева

 — 3;

2) 

количество

 

деревьев

 

в

 

ансамбле

 — 5;

3) 

коэффициент

 

регуляризации

 

 = 0,2.

Для

 

определения

 

зависимости

 

точности

 

рас

-

познавания

 

образов

 

от

 

объема

 

и

 

энтропии

 

исполь

-

зовалась

 

так

 

называемая

 

матрица

 

распознавания

которая

 

формируется

 

следующим

 

образом

элемен

-

ты

 

матрицы

 — 

значения

 

точности

 

распознавания

 

a

каждый

 

столбец

 

соответствует

 

определенному

 

зна

-

чению

 

энтропии

 

выборки

каждая

 

строка

 — 

объему

 

(

таблица

 1). 

Табл

. 1. 

Матрица

 

распознавания

Энтропия

Об

ъе

м

 

выборки

T/S

0,72

0,84

0,99

1

0,99

0,95

0,94

250

0,94

0,89

0,54

0,63

0,58

0,89

0,94

300

0,92

0,91

0,58

0,65

0,58

0,92

0,92

350

0,92

0,91

0,65

0,73

0,63

0,88

0,92

400

0,92

0,88

0,63

0,79

0,65

0,92

0,93

450

0,94

0,88

0,65

0,82

0,67

0,91

0,94

500

0,94

0,92

0,71

0,83

0,66

0,89

0,92

550

0,94

0,91

0,64

0,84

0,65

0,88

0,94  

600

0,93

0,92

0,66

0,82

0,85

0,91

0,93

 5 (50) 2018


Page 4
background image

106

В

 

таблице

 1 

представлена

 

матрица

 

распознава

-

ния

 

для

 

тестовой

 

выборки

ее

 

графическое

 

пред

-

ставление

 

изображено

 

на

 

рисунке

 2. 

Зависимость

 

точности

 

распознавания

 

от

 

объема

 

обучающей

 

вы

-

борки

 

при

 

фиксированной

 

энтропии

 

S

 = 1 

показана

 

на

 

рисунке

 3.

Из

 

рисунка

 2 

и

 

таблицы

 

видно

что

 

точность

 

ал

-

горитма

 

достигает

 79–84% 

при

 

значении

 

энтропии

 

S

 = 1 (

все

 

классы

 

представлены

 

в

 

равных

 

долях

и

 

объемах

 

обучающей

 

выборки

 

более

 400 

эле

-

ментов

Из

 

рисунка

 3 

можно

 

видеть

что

начиная

 

с

 400 

элементов

 

обучающей

 

выборки

достигается

 

насыщение

 

кривой

 

точности

На

 

рисунке

 2 

значения

 

энтропии

 

от

 0,323 

до

 1 

соответствуют

 

преоблада

-

нию

 

класса

  «

работоспособное

 

состояние

», 

от

 1 

до

 

0,918 — «

предаварийное

 

состояние

».

Исходя

 

из

 

проведенных

 

расчетов

 

для

 

масля

-

ных

 

выключателей

 110 

кВ

 

можно

 

сформулиро

-

вать

 

следующие

 

требования

 

к

 

обучающей

 

вы

-

борке

:

1) 

образы

 

распознаваемых

 

состояний

 

силовых

 

вы

-

ключателей

 

должны

 

быть

 

представлены

 

в

 

рав

-

ных

 

долях

то

 

есть

 

энтропия

 

обучающей

 

выборки

 

должна

 

быть

 

равна

 1;

2) 

объем

 

обучающей

 

выборки

 

должен

 

быть

 

не

 

ме

-

нее

 400 

элементов

;

3) 

элементы

 

обучающей

 

выборки

 

должны

 

подвер

-

гаться

 

фильтрации

 

и

 

нормированию

;

4) 

количество

 

признаков

 

обучающей

 

выборки

 

долж

-

но

 

определяться

 

с

 

помощью

 

корреляционного

 

анализа

.

Разработанные

 

требования

 

позволяют

 

форма

-

лизовать

 

основные

 

характеристики

 

обучающей

 

вы

-

борки

 

для

 

достижения

 

оптимальной

 

точности

 

алго

-

ритма

 

машинного

 

обучения

 80–85%.

ПРИМЕР

 

ТЕСТИРОВАНИЯ

РАЗРАБОТАННОЙ

 

СИСТЕМЫ

Для

 

тестирования

 

разработанной

 

авторами

 

сис

-

темы

 

были

 

выбраны

 

два

 

масляных

 

выключателя

 

типа

 

У

-110-2000, 

установленных

 

на

 

реальной

 

под

-

станции

 500/220/110 

кВ

На

 

основе

 

паспортных

 

дан

-

ных

 

и

 

данных

 

технической

 

диагностики

 

с

 2000 

по

 

2017 

год

 

была

 

сформирована

 

выборка

 

из

 400 

эле

-

ментов

содержащая

 

следующие

 

данные

:

1) 

содержание

 

жидкости

 

и

 

механических

 

примесей

 

в

 

трансформаторном

 

масле

;

2) 

напряжение

 

пробоя

 

трансформаторного

 

масла

;

3) 

год

 

выпуска

.

С

 

помощью

 

реализованного

 

алгоритма

 XGBoost 

в

 

среде

 Python 3 

была

 

проведена

 

серия

 

расчетов

 

на

 

тестовой

 

выборке

которая

 

составляет

 20% 

от

 

общей

 

выборки

Результаты

 

расчетов

 

приведены

 

на

 

рисунках

 4 

и

 5. 

На

 

рисунке

 4 

показана

 

зависимость

 

точности

 

классификации

 

от

 

максимальной

 

глубины

 

решающего

 

дерева

 

при

 

фиксированном

 

значении

 

деревьев

 

в

 

ансамбле

равном

 5. 

На

 

рисунке

 4 

приве

-

дена

 

зависимость

 

точности

 

классификации

 

от

 

числа

 

деревьев

 

решений

 

в

 

ансамбле

 

при

 

фиксированной

 

глубине

 

дерева

 3.

Рис

. 2. 

Графическое

 

представление

 

матрицы

 

распозна

-

вания

То

чно

сть

о

е

.

Об

ъе

м

об

учающей

выборки

Энтропия

То

чно

сть

о

е

.

Объем

 

обучающей

 

выборки

0,9

0,8

0,7

0,6

0,5

0,4

0,3

0,2

0,1

0

750

700

650

600

550

500

450

400

350

300

250

200

150

100

50

То

чно

сть

о

е

.

Глубина

 

решающих

 

деревьев

1,2

1

0,8

0,6

0,4

0,2

0

12

11

10

9

8

7

6

5

4

3

2

1

Рис

. 3. 

Зависимость

 

точности

 

распознавания

 

от

 

объема

 

обучающей

 

выборки

 

при

 

фиксированной

 

энтропии

 

S

 = 1

Рис

. 4. 

Зависимость

 

точности

 

классификации

 

от

 

мак

-

симальной

 

глубины

 

решающего

 

дерева

То

чно

сть

о

е

.

Число

 

решающих

 

деревьев

 

в

 

ансамбле

1,2

1

0,8

0,6

0,4

0,2

0

12

11

10

9

8

7

6

5

4

3

2

1

Рис

. 5. 

Зависимость

 

точности

 

классификации

 

от

 

числа

 

деревьев

 

решения

 

в

 

ансамбле

ДИАГНОСТИКА

И МОНИТОРИНГ


Page 5
background image

107

Из

 

рисунков

 4 

и

 5 

можно

 

видеть

что

 

обучающая

 

выборка

сформированная

 

в

 

соответствии

 

с

 

требо

-

ваниями

 

раздела

 III, 

не

 

обеспечивает

 

обучение

 

мо

-

дели

 

с

 

точностью

 0,8 

при

 

некорректных

 

настройках

 

самой

 

модели

.

Необходимо

 

также

 

оценить

 

не

 

просто

 

величину

 

ошибок

 

тестирования

а

 

выявить

 

среди

 

них

 

ошиб

-

ки

 

первого

 

рода

 — 

отказ

 

от

 

правильной

 

гипотезы

 

ложный

 

дефект

») 

и

 

второго

 

рода

 — 

принятие

 

неправильной

 

гипотезы

 («

пропуск

 

дефекта

»). 

Это

 

связано

 

с

 

тем

что

 

предельно

 

допустимое

 

значение

 

параметра

 

имеет

 

рассеивание

 

на

 

граничных

 

обла

-

стях

и

 

одни

 

и

 

те

 

же

 

значения

 

могут

 

соответствовать

 

как

 

одному

так

 

и

 

другому

 

состоянию

Ошибка

 

первого

 

рода

 

приводит

 

к

 

дополнитель

-

ным

 

предупредительным

 

работам

а

 

ошибка

 

второ

-

го

 

рода

 

влечет

 

за

 

собой

 

затраты

включающие

 

не

 

только

 

аварийный

 

ремонт

но

 

и

 

износ

 

оборудования

 

и

 

т

.

п

В

 

результате

 

были

 

получены

 

следующие

 

по

-

казатели

 

ошибок

:

• 

первого

 

рода

 — 53;

• 

второго

 

рода

 — 27.

Анализ

 

ошибок

 

первого

 

и

 

второго

 

рода

 

на

 

те

-

стовой

 

выборке

 

из

 400 

элементов

 

подтвердил

 

эф

-

фективность

 

использования

 

метода

 

машинного

 

об

-

учения

Очевидно

что

 

в

 

данном

 

случае

 

среди

 

всех

 

ошибок

 

преобладают

 

ошибки

 

первого

 

рода

 

типа

 

«

ложный

 

дефект

», 

что

 

значительно

 

повышает

 

на

-

дежность

 

применения

 

такой

 

системы

.

Полученные

 

результаты

 

характеризуют

 

систему

 

как

 

достаточно

 

достоверную

и

 15–20% 

ошибок

 

от

 

общего

 

числа

 

оценок

 

в

 

определении

 

состояния

 

вы

-

ключателей

 

при

 

учете

 

небольшого

 

объема

 

данных

 

технической

 

диагностики

 

в

 

данном

 

случае

 

можно

 

считать

 

хорошим

 

результатом

.

ВЫВОДЫ

Задача

 

оценки

 

технического

 

состояния

 

электро

-

сетевого

 

оборудования

 

сводится

 

к

 

задаче

 

иден

-

тификации

 

устойчивых

 

групп

  (

по

 

различному

 

набору

 

переменных

), 

каждая

 

из

 

которых

 

объ

-

единяет

 

в

 

себя

 

объекты

 

со

 

схожими

 

характери

-

стиками

Основная

 

проблема

 

идентификации

 

со

-

стояния

 

оборудования

 

заключается

 

не

 

столько

 

в

 

проблеме

 

определения

 

характерных

 

состояний

сколько

 

в

 

определении

 

объектов

 

с

 

нетипичным

 

набором

 

параметров

для

 

которых

 

не

 

очевид

-

на

 

принадлежность

 

к

 

тому

 

или

 

иному

 

состоянию

 

или

 

же

 

возможна

 

принадлежность

 

к

 

нескольким

 

состояниям

 

одновременно

Кроме

 

того

суще

-

ствует

 

проблема

 

низкого

 

качества

 

и

 

большого

 

объема

 

неинформативных

 

исходных

 

данных

используемых

 

для

 

идентификации

 

состояния

оборудования

.

В

 

данной

 

статье

 

были

 

разработаны

 

требова

-

ния

 

к

 

обучающей

 

выборке

 

для

 

распознавания

образов

 

состояния

 

силовых

 

масляных

 

выключа

-

телей

С

 

помощью

 

серии

 

расчетов

выполненных

на

 

основе

 

алгоритма

 XGBoost 

на

 

языке

 

програм

-

мирования

 Python 3, 

были

 

определены

 

зависи

-

мости

 

точности

 

классификации

 

от

 

объема

 

выбор

-

ки

а

 

также

 

от

 

энтропии

В

 

результате

 

были

 

опре

-

делены

 

следующие

 

требования

 

к

 

обучающей

 

вы

-

борке

:

1) 

использование

 

нормализированных

 

параметров

;

2) 

энтропия

 — 1;

3) 

минимальный

 

необходимый

 

объем

 

обучающей

 

выборки

 — 

не

 

менее

 400 

элементов

;

4) 

исключение

 

неинформативных

 

параметров

.

Разработанная

 

в

 

рамках

 

данного

 

исследова

-

ния

 

математическая

 

модель

 

интеллектуального

 

распознавания

 

образов

 

состояния

 

силовых

 

вы

-

ключателей

 

может

 

быть

 

использована

 

в

 

качестве

 

основы

 

для

 

автоматизированной

 

системы

 

под

-

держки

 

принятия

 

решений

 

с

 

целью

 

оптимизации