Статья опубликована в рамках: LXXVII Международной научно-практической конференции «Научное сообщество студентов XXI столетия. ТЕХНИЧЕСКИЕ НАУКИ» (Россия, г. Новосибирск, 13 мая 2019 г.)

Наука: Технические науки

Секция: Моделирование

Скачать книгу(-и): Сборник статей конференции

Библиографическое описание:
Кондрашкин А.А. ОБУЧЕНИЕ СИСТЕМЫ WINCC OA ПРЕДСКАЗЫВАНИЮ РЕЖИМА ГИДРОАГРЕГАТА ПРИ ПОМОЩИ АЛГОРИТМА СЛУЧАЙНОГО ЛЕСА // Научное сообщество студентов XXI столетия. ТЕХНИЧЕСКИЕ НАУКИ: сб. ст. по мат. LXXVII междунар. студ. науч.-практ. конф. № 5(76). URL: https://sibac.info/archive/technic/5(76).pdf (дата обращения: 23.09.2019)
Проголосовать за статью
Конференция завершена
Эта статья набрала 0 голосов
Дипломы участников
У данной статьи нет
дипломов

ОБУЧЕНИЕ СИСТЕМЫ WINCC OA ПРЕДСКАЗЫВАНИЮ РЕЖИМА ГИДРОАГРЕГАТА ПРИ ПОМОЩИ АЛГОРИТМА СЛУЧАЙНОГО ЛЕСА

Кондрашкин Антон Андреевич

студент 1 курса магистратуры, кафедра программных систем факультета Самарского Университета,

РФ, г. Самара

Научный руководитель Додонова Наталья Леонидовна

канд. физ.-мат. наук, доцент кафедры прикладной математики Самарского Университета,

РФ, г. Самара

Аннотация. В статье рассматривается алгоритм построения модели случайного леса, в ходе которого используются реальные данные гидроагрегата N. Первоначальный набор данных сначала разбивался на группы по схожим признакам, а затем записывался в базу данных. Затем значения из базы данных анализировались при помощи свободно распространяемого языка R, и на их основе была создана модель случайного леса, предсказывающая режим работы гидроагрегата по входным параметрам. Все действия с данными, за исключением непосредственного анализа, производятся в системе WinCC OA.

 

Ключевые слова: Моделирование, случайный лес, гидроагрегат, гидроэнергетика.

 

ВВЕДЕНИЕ

Гидроэлектростанции являются одним из основных источников электроэнергии в России, поскольку данная энергия является одной из самых дешёвых и наименее вредных для окружающей среды. В России присутствуют всевозможные виды ГЭС: начиная от малых (1 гидроагрегат (ГА), размещённый на горных речушках) и заканчивая крупнейшими (например, Саяно-Шушенская).

Но каких бы размера и мощности ни была ГЭС, на ней обязательно присутствует контроль различных параметров, таких как вибрации и температуры.

Одним из способов контроля параметров ГА является моделирование. Создаётся модель данного агрегата, после чего производится постоянное сравнение реальных данных с модельными. В случае расхождения результатов, производится анализ и либо доработка модели, либо вывод о возможной неисправности ГА.

Цель данной работы заключается в создании модели случайного леса, предсказывающей режим работы гидроагрегата.

Дано: файлы с данными гидроагрегата N с ГЭС Х. Данные имеют различную структуру и частоту архивирования, в них входят: различные вибрационные (вибрации секций подшипника и подпятника), температурные (температура внутри и снаружи турбины, температуры сегментов подшипника/подпятника), механические (частота вращения ротора, мощность на валу турбины) и электрические параметры (активная мощность, ток и напряжение по трём фазам).

Для достижения поставленной цели необходимо решить следующие задачи:

1. Рассортировать данные по группам, основываясь на схожей частоте архивации.

2. Перенести данные из файлов в базу данных (база данных Raima, встроенная в систему WinCC OA).

3. Выбрать несколько параметров, необходимых для конкретного определения режима работы ГА.

4. При помощи языка R создать модель случайного леса.

ОСНОВНЫЕ ПОНЯТИЯ И ИНСТРУМЕНТЫ

Рассмотрим некоторые понятия, связанные с исследованием:

Случайный лес – алгоритм машинного обучения, предложенный Лео Брейманом и Адель Катлер, заключающийся в использовании комитета (ансамбля) решающих деревьев [1].

Дерево решений – средство поддержки принятия решений, использующееся в машинном обучении, анализе данных и статистике. Структура дерева представляет собой «листья» и «ветки». На рёбрах («ветках») дерева решения записаны атрибуты, от которых зависит целевая функция, в «листьях» записаны значения целевой функции, а в остальных узлах — атрибуты, по которым различаются случаи. Чтобы классифицировать новый случай, надо спуститься по дереву до листа и выдать соответствующее значение [2].

Кластерный анализ – многомерная статистическая процедура, выполняющая сбор данных, содержащих информацию о выборке объектов, и затем упорядочивающая объекты в сравнительно однородные группы. Задача кластеризации относится к статистической обработке, а также к широкому классу задач обучения без учителя [3].

В качестве системы анализа данных был выбран язык R за его доступность, а также потому, что система WinCC OA, на которой функционируют несколько систем автоматизации на реальных ГЭС, имеет специальный аппарат для взаимодействия с языком R, названный SmartSCADA.

ЭТАП 1. ПЕРВИЧНАЯ ОБРАБОТКА ДАННЫХ

На этом этапе из всех параметров ГА (более 70-ти штук) были выбраны несколько основных, чьи значения будут использоваться при построении случайного леса, а именно: активная мощность (Р), частота вращения ротора (Period), степень открытия направляющего аппарата (Shtock_NA) и один произвольный вибрационный параметр (вибрация подпятника – S_zp). В скобках указаны имена, которыми были обозначены данные параметры в системе WinCC OA.

В ходе визуального просмотра графиков данных о работе ГА за месяц было выяснено, что рассматриваемые параметры архивировались на объекте с разной частотой. Например, температурные параметры архивировались раз в десять секунд, а вибрационные – раз в секунду.

Исходя из различий в данных была написана программа, сгруппировавшая исходные данные по группам с одинаковыми частотами архивации, после чего данные были записаны в базу данных, встроенную в систему WinCC OA.

Была проведена визуальная оценка линий трендов выбранных параметров. Во время данной оценки, помимо основного режима работы (в дальнейшем – «нормальный режим»), были выделены следующие режимы:

Останов – Закрытие НА

На рисунке 1 между отметками 1 и 2 располагается промежуток времени, выделенный как режим «Закрытие НА». Во время данного режима НА закрывается до максимума, чтобы остановить приток воды к турбине.

Останов – Торможение турбины

На рисунке 1 между отметками 2 и 3 располагается промежуток времени, выделенный как режим «Торможение турбины». Во время данного режима генератор отключается от сети, и турбина начинает останавливаться вплоть до полной остановки. Остановка ГА завершается.

Пуск – Холостой ход турбины

Во время пуска можно выделить временной интервал 1-2, названный «Холостой ход турбины». Во время данного режима шток НА открывается, но генератор к сети не подключён.

 

Рисунок 1. Останов ГА (отметки 1-3)

 

Пуск – Открытие НА

На промежутке 2-3 можно выделить режим «Открытие НА», где направляющий аппарат постепенно открывается, выводя агрегат в режим нормальной работы. Также можно было бы выделить режим «Холостой ход генератора», однако на графике данный режим явно обнаружен не был.

 

Рисунок 2. Пуск ГА (отметки 1-3)

 

ЭТАП 2. КЛАСТЕРНЫЙ АНАЛИЗ

Данные были загружены в систему Smart Scada (данный инструмент является одним из встроенных в WinCC OA инструментов), и произведено несколько расчётов кластеров. Оказалось, что 10 – наименьшее число кластеров, при котором сохраняются необходимые для решения задачи области.

Далее будут рассмотрены все кластеры по порядку, начиная с внешнего.

 

 

Рисунок 3. Диаграмма кластеров

 

Описания будут даваться по номеру кластера и его цвету, как показано на рисунке 3.

Внешний синий кластер (№1) относится к максимальным значениям всех четырёх параметров (P>110, Period = 100 %). Данный кластер можно выделить в отдельный режим «Верхняя граница мощности».

Кластеры №3, 5, 7, 8 (фиолетовый, розовый, зелёный и серый) относится к нормальному режиму работы (P<110 & P>60).

Голубой (№10) кластер (P<56) может относиться к нескольким режимам работы: режиму «Нижней границы мощности» (который был выделен по аналогии с режимом верхней границы), режимом закрытия штока и режимом открытия направляющего аппарата (подрежимы пуска и останова ГА). На первом этапе кластеризации ему будет присвоено обозначение режима нижней границы. При дальнейшем исследовании модель необходимо будет точечно модернизировать.

С жёлтым кластером под номером 9 (P<40) схожий случай, поскольку есть промежутки времени в исследуемой области, когда ГА разгружался настолько, что его активная мощность падает ниже 40 МВт. На первом этапе ему будет присвоено обозначение режима нижней границы мощности. Впоследствии модель будет модернизирована.

Также необходимо отметить, что система Smart Scada отследила, что при понижении активной мощности ниже определённого значения (примерно ниже 56 МВт) значение вибрации возрастает на 2 мкм, как показано на рисунках 4 и 5.

 

Рисунок 4. Кластеры нижней границы мощности

 

Рисунок 5. Таблица граничных значений кластеров с низкой мощностью

 

Таким образом, данные кластеры характеризуются не только низкой мощностью, но и более высокой вибрацией.

Похожая ситуация наблюдается при повышении активной мощности выше определённого значения (P>100MВт) наблюдает рост вибраций, но на меньшее значение, как показано на рисунках 6 и 7.

 

Рисунок 6. Диаграмма кластера для режима «Верхняя граница мощности»

 

Рисунок 7. Таблица граничных значений для кластеров с высокой мощностью

 

Далее рассмотрим красный кластер (№4). Его однозначно можно отнести к режиму холостого хода турбины, потому что только во время холостого хода можно увидеть ситуацию, когда активная мощность равна нулю, и при этом НА открыт, а частота вращения ротора не равна 100 %.

Далее следует коричневый кластер (№6). Его также можно однозначно соотнести с режимом торможения турбины, поскольку только там можно наблюдать ситуацию, когда турбина вращается, но при этом НА закрыт, активной мощности нет и вибрации понижены.

Оранжевый кластер №2 соотносится с режимом «Стоп».

ЭТАП 3. ФОРМИРОВАНИЕ МОДЕЛИ СЛУЧАЙНОГО ЛЕСА

После формирования кластеров, представленных в предыдущем отчёте, было проведено автоматизированное формирование случайного леса. На рисунке 8 представлен скриншот таблицы с исходными данными для построения случайного леса.



 

Рисунок 8. Формирование случайного дерева

 

В каждой строчке написаны конкретные значения каждого из параметров, сочетания которых соответствуют конкретному режиму работы, записанному в правом столбце. Данные значения берутся из исходной выборки с шагом в одну секунду.

После постройки таблицы была проведена ручная модернизация (некоторые режимы, несоответствующие значениям в строке, были заменены на нужные), после чего было запущено формирование модели случайного леса.

ЭТАП 4. РАЗРАБОТКА ДОПОЛНИТЕЛЬНОЙ ПАНЕЛИ ДЛЯ НАБЛЮДЕНИЯ

Для упрощения проверки модели был написан сценарий, имитирующий поток входных данных на основе уже имеющихся исторических. Он работает постоянно, однако значения поступают в базу данных только при включенном флаге, которым пользователь управляет со специальной панели. Она представлена на рисунке 6.

Для определения режима необходимо посмотреть на график и выяснить число, которое предсказала система. После этого необходимо свериться с подсказкой в верхней части экрана и узнать название режима.



 

Рисунок 6. Панель наблюдения и управления потоком данных

 

Пользователь может приостанавливать и запускать процесс поступления данных и регулировать скорость их поступления. В правом верхнем углу отражается текущий режим работы, который выдаёт система (на самом деле она выдаёт число типа float, которое уже интерпретируется во внутреннем сценарии).

На графике внизу можно наблюдать изменения не только основных исследуемых параметров, но и предсказанных значений.

При помощи данной панели будет проводиться дальнейшее исследование.

ВЫВОД

В данной статье были достигнуты следующие результаты:

1. Данные были рассортированы по группам.

2. Перенести данные из файлов в базу данных (база данных Raima, встроенная в систему WinCC OA).

3. Были выбраны параметры для исследования.

4. Были сформированы и описаны кластеры, на основе которых были обозначены режимы работы ГА.

5. Была создана модель случайного леса, при помощи которой автоматически определяется режим работы ГА.

6. Для облегчения работы была разработана специальная панель для наблюдения за результатами предсказания.

В дальнейшем планируется провести тестирование разработанной модели.

 

Список литературы:

  1. Статья из Википедии «Random forest» [Электронный ресурс]. URL: https://ru.wikipedia.org/wiki/Random_forest (дата обращения: 01.04.2019).
  2. Статья из Википедии «Дерево решений» [Электронный ресурс]. URL: https://ru.wikipedia.org/wiki/Дерево_решений (дата обращения: 01.04.2019).
  3. Статья из Википедии «Кластерный анализ» [Электронный ресурс]. URL: https://ru.wikipedia.org/wiki/Кластерный_анализ (дата обращения: 01.04.2019).
  4. Документация по WinCC OA [Электронный ресурс]. Справочная система.
Проголосовать за статью
Конференция завершена
Эта статья набрала 0 голосов
Дипломы участников
У данной статьи нет
дипломов

Оставить комментарий