Статья опубликована в рамках: XXVIII Международной научно-практической конференции «Вопросы технических и физико-математических наук в свете современных исследований» (Россия, г. Новосибирск, 24 июня 2020 г.)
Наука: Информационные технологии
Секция: Теоретические основы информатики
Скачать книгу(-и): Сборник статей конференции
дипломов
АДАПТИВНЫЙ ГЕНЕТИЧЕСКИЙ АЛГОРИТМ НА ОСНОВЕ ПРОИЗВОЛЬНОЙ ОЦЕНКИ КОМПЛЕКСА ИНФОРМАТИВНЫХ ПРИЗНАКОВ
В работе предлагается гибкий генетический алгоритм на основе произвольной оценки комплекса информативных признаков, различающих объекты классов при первичной обработке данных в области кардиологии, которые сформированы медицинскими специалистами.
1. Постановка задачи. Пусть учебная выборка, сформированная на основе исходных данных, выделена в классы, которые имеют следующий вид:
... .
Это можно представить в общем виде:
Здесь и учебная выборка выражаются в виде , которые состоят из непараллельных классов, т.е. даны условия .
Кроме того, компоненты объекта состоят из - действительных чисел: j – признак i – больного, который относится к p – классу. Здесь ; и r – общее количество заданных классов, - общее количество больных в p–классе и N – общее количество признаков.
В нашей задаче каждый класс рассматривается как вид заболевания, т.е. – класс “Прогрессирующая стенокардия”, – класс “Острый инфаркт миокарда”, - класс “Аритмическая форма”. При этом каждый комплекс признаков, характеризующих каждый класс (вид заболевания), сформирован специалистами отрасли, в каждый класс входит 62 характеризующих признака.
Задача. Требуется выбрать комплекс информативных признаков , характеризующих отличия между объектами класса . Здесь является заданным числом, меньшим чем 62.
2. Алгоритм решения поставленной прикладной задачи:
Пусть на основе эталонной таблицы при классификации объектов учебной выборки погрешность результата составит , т.е. количество объектов, не соответствующих своему классу, относительно общего количества будет .
Пусть механизм действия алгоритма “А” определяется следующим образом. Используя функцию приближения, предложенную авторами [1-4], можно определить уровни значимости всех признаков по отдельности. В соответствии с этим на основе произвольной выборки из эталонной таблицы удаляется столбец выбранного признака. Если классы всех объектов, принимающих участие в вычислении в финале процесса, определяются как минимум , в этом случае удаленный из таблицы столбец не восстанавливается в таблице, иначе столбец возвращается на свое место, другой столбец на основе произвольной выборки удаляется из эталонной таблицы и процесс повторяется. Предложенный процесс продолжается до количества признаков. Если в процессе классификации объекты находят другие классы в своих классов (при переходе к другому классу), то признак исключенный по проивольному выбору возвращается на свое место. Данный процесс осуществляется между признаками N, в заключении процесса из оставшихся на своем месте признаков выделяются информативные признаки.
Таким образом, основной целью осуществляемой на данном этапе работы является выбор наиболее полезных из множества признаков, характеризующих исследуемые объекты, т.е. решить вопрос выбора средства информативных признаков.
Дано следующее: – количество признаков средства признаков, необходимых выбрать; необходимая вероятность убрать один признак из средства признаков компонентов вектора ). В начале берется , т.е. вероятность удаления произвольного признака взаимно равно.
Шаг 1. В разрезе всех признаков заданной учебной выборки осуществляется алгоритм “А”. На основе результата определяется коэффициент погрешности . Как правило для определения коэффициента погрешности количество неправильно определенных объектов делится на общее количество объектов.
Шаг 2. Случайным образом с вероятностью из множества признаков выбирается один признак и удаляется из комплекса. Затем в разрезе признаков запускается алгоритм “А”. В результате выявляется коэффициент погрешности для признаков .
Шаг 3. Если , то переходим к Шагу 2. Этот процесс повторяется раз. Если же выполняется уравнение возврата процесса переходим к следующему шагу. Соответственно если не выполняется уравнение, то процесс продолжается пока не будут рассмотрены все признаки. После рассмотрения всех признаков переходим к следующему шагу.
Шаг 4. Пусть , в этом случае с вероятностью из множества признаков выбирается один признак и исключается из комплекса. Как и в Шаге 2 процесс повторяется, только отличаются между собой вероятности между признаками, произвольно выбранными ранее, которые остались в системе и были исключены из нее. Затем в разрезе признаков вводится в действие алгоритм “А”. В результате выявляется коэффициент погрешности для признаков .
Шаг 5. Если , то переходим к Шагу 4. Данный процесс повторяется раз и т.д.
Таким образом, Таким образом, основной целью данного алгоритма является выбор наиболее полезных из множества признаков, характеризующих исследуемые объекты, т.е. решить вопрос оценки комплекса информативных признаков.
В процессе реализации алгоритмического обеспечения для выявлены 7 десятичных информативных признака с одним результатом. Результат приводится в Таблице 1.
Таблица 1.
Используя комплекс выбранных информативных признаков, в соответствии с результатом классификации выявлено, что 100% объектов эталонной таблицы нашли свои классы.
Предложенный алгоритм состоит из двух важных частей: в первой части – определяется средство признаков , влияющих на наследственность мутированных объектов, вторая часть - адаптивный алгоритм на основе произвольного выбора нового комплекса.
Список литературы:
- Журавлев Ю.И. Избранные научные труды. –М: Издательство Магистр, 1998. – 420с.
- Nishanov А.Kh., Djurayev G.P., Kasanova М.Kh. Improved algorithms for calculating evaluations in processing medical data // National Institute of Science Communication and Information Resources (NISCAIR)-India, 2019,-3158-3165.
- Kamilov M., Nishanov A., Beglerbekov R. Modified stages of algorithms for computing estimates in the space of informative features // International Journal of Innovative Technology and Exploring Engineering (2019) 8(6)
- Nishanov А.Kh., Jurayev G.P., Narziyev N.B., Adaptable genetic algorithm for primary processing of medical data based on random search // Шестая Международная научно-практическая конференция «BIG DATA and Advanced Analytics. BIG DATA и анализ высокого уровня», Минск, Республика Беларусь, 20-21 мая 2020 года
дипломов
Оставить комментарий