Статья опубликована в рамках: XXIII-XXIV Международной научно-практической конференции «Вопросы технических и физико-математических наук в свете современных исследований» (Россия, г. Новосибирск, 24 февраля 2020 г.)
Наука: Информационные технологии
Секция: Теоретические основы информатики
Скачать книгу(-и): Сборник статей конференции
дипломов
ОБ ОДНОМ АЛГОРИТМЕ КЛАССИФИКАЦИИ С ИСПОЛЬЗОВАНИЕМ ε- ПОРОГ
При решении задачи классификации большое значение имеет правиьный выбор первоначальных значений . Фактически, во многих практических задач количество определяет размерность признакового пространства.
В данной работе использованы -порог признаков при опредлении размерность признаков изучаемых объектов в распознавании образов. Изучены малые обучающие выборки для решения задачи классификации с использованием алгоритмов вычисления оценов посредством выбранных -порогов признаков.
Обучающая выборка, сформированная на основе сведений, которые предоставлены специалистами отрасли, при решении задач в непосредственной связи с малых объемов обучающей выборкой, которые состоит из объектов 3 классов. Здесь -класс состоит из 10 объектов, -класс из 6 и -класс из 8 объектов. Объекты каждого класса обладают 12 признаками. При этом, основной проблемой является нарушение взаимодействия между объектами обучающей выборки и комплекса признаков. Например, в исследованиях [6] авторов, если рассматриваются 3 признака в обучающей выборке, то требуется, чтобы в обучающей выборке рассматривалось не менее 100 объектов исследования. В исследовании обоснована пропорциональность количества признаков количеству объектов в обучающей выборке.
1. Постановка задачи. Пусть комплекс обучающых выборок будет выражен в виде . Здесь - вектор пространства N-признаков, каждый объект , рассматривается в пространстве -признаков, , выражает комплекс классов, который состоит из объектов в количестве . Обобщенная выборка выражается , в которой количество объектов равно . Не нарущая общности объекты выборки могут быть представлены в следующем виде:
Требуется решить следующие задачи:
Задача 1. Определить -порог в разрезе признаков, характеризующих объекты класса , позволяющих их оценить;
Задача 2. На основе выявленных порог признаков необходимо решить вопрос принадлежности объектов обобщенной выборки своему классу, т.е. определить принадлежность выделенных объектов своему или другому классу.
2. Алгоритм решения поставленных прикладных задач:
Шаг 1. Для решения поставленной задачи определяются -порог для каждого признака, характеризующего объекы класса , процесс вычисления же осуществляется с помощью следующей формулы:
Здесь При этом должны быть найдены -порог для каждого признака 3 классов. Результаты отображаются в диаграмме №1.
Диаграмма 1. Графическое представление значений -порог для каждого признака
Шаг 2. При помощи приведенной ниже формулы вычисляется функция схожести между количественными признаками объектов класса с использованием -порог для признака, выявленных относительно каждого признака объектов класса :
Здесь , – установленное предельное значение для j-количественного признака. Приведенное выше выражение понимается как голоса, представленные объектами в разрезе признака объекта. Если подан голос то =1, иначе будет принято значение. В финальной части процесса сравнения значения , ;; признаков , каждого из объектов классов переводятся в матрицу параметром , состоящую из непрерывных количественных элементов в виде 0 или 1. Здесь количество матриц тоже будет , поскольку в обобшенной обучающей выборке возникает отдельная матрица с параметром для каждого объекта. При этом в выборке не участвует собственно рассматриваемый объект.
Шаг 3. Решение задачи по классификации объектов класса , т.е. определяется принадлежность каждого объекта своему или другому классу. При этом последовательное сопоставление каждого объекта, относящегося к классу с объектами собственного и других классов, функции схожести между объектами класса объекта в пространстве информативных признаков для всех вычисляются следующим образом
Сравнительное оценивание вычисляется по каждому классу, максимальные средние значения полученных сумм означают принадлежность объекта к данному классу. Например, для каждого объекта заданного класса осуществляется вычисление . Затем решается задача максимизации
и по ее результатам определяется принадлежность [3-5].
В начале рассматривается вопрос переклассификации выделенных по классам объектов. Этот процесс проводится в 2 этапа, осуществляется в разрезе Шага 3 и представляется собой следующую последовательность:
1 этап. Переклассификация осуществляется до достижения максимального результата путем последовательного исключения признаков принадлежности объектов собственному или другому классам относительно признаков, характеризующих объекты класса. При этом стоит учитывать, что нельзя исключить 100% признаков, поскольку посредством исключения 100% признаков невозможно определить собственный класс объектов класса. В этом случае следует перейти ко 2 этапу.
На первом этапе определяются информативные признаки, на основе полученных результатов количество признаков сократилось с 12 до 7. Первоначальный результат в разрезе полученных информативных признаков представлен в таблице №1.
Таблица 1.
Представлен первоначальный результат в разрезе признаков
2 этап. На этом этапе решается задача классификации и объекты, у которых не определены свои классы исключаются из обучающей выборки. Объекты, которые не нашли свой класс на основе результатов, последовательно исключаются из собственного класса. Данный процесс продолжается до полного 1005 определения собственных классов объектами. В результате сформированная следующая эталонная выборка, которая представлена в диаграмме №2.
Диаграмма 2. Результаты классификации эталонной выборки
На основе приведенные выше диаграммы №2 сведения об объектах каждого класса даны в трех столбцах, в первом столбце приводится количество первоначальных объектов (10). Во втором столбце отображены объект, которые правильно определили свой класс (9), и в третьем столбце показаны количество объектов, относщихся к другому классу (1) и т.д. Данные результаты приведены в диаграмме №2 и для объектов других классов.
В заключении следует отметить, что в первом классе эталонной выборки отражены 9 объектов, вов втором классе – 4, и наконец, в третьем классе – 8 объектов. Следовательно, в данной статье в первую очередь осуществлена выборка комплекса информативных признаков, в которой количество информативных признаков сокращено с 12 до 4. Затем решена задача по классификации полученных результатов, сформирована эталонная выборка, состоящая из трех классов, количество объектов в которой снизилось с 24 до 21.
Список литературы:
- Журавлев Ю.И. Избранные научные труды. – М: Издательство Магистр, 1998. – 420с.
- Камилов М.М., Хамроев А.Ш., Мингликулов З.Б. Баҳоларни ҳисоблаш алгоритмларида е-бўсағавий параметрлар қийматларини генетик алгоритм асосида оптималлаштириш. Бошқарувда ахборот технологияларини қўллашнинг замонавий ҳолати ва ютуқлари: Республика илмий-техник анжумани. – Тошкент, 2015. – 331-336 б.
- Камилов М.М., Нишанов А.Х., Джураев Г.П. Алгоритм классификации медицинских данных в пространстве информативных признаков с использованием функции дальности и близости // Химическая технология. Контроль и управления. - Ташкент, 2018, №1-2. - 143-150.
- Нишанов А.Х., Жўраев Ғ.П., Нарзиев Н.Б. Баҳоларни ҳисоблаш алгоритмларини миокард инфаркти касаллигига қўлланилиши// Муҳаммад ал-Хоразмий авлодлари.- Ташкент, 2018, №2.- 40-44.
- Nishanov А.Kh., Djurayev G.P., Kasanova М.Kh. Improved algorithms for calculating evaluations in processing medical data // National Institute of Science Communication and Information Resources (NISCAIR)-India, 2019,-3158-3165.
- Вапник В.Н., Чевоненкис А.Я. Теория распознавания образов. –М.:Наука, 1974.- 416с.
дипломов
Оставить комментарий