Статья опубликована в рамках: LXV Международной научно-практической конференции «Научное сообщество студентов XXI столетия. ТЕХНИЧЕСКИЕ НАУКИ» (Россия, г. Новосибирск, 14 мая 2018 г.)
Наука: Информационные технологии
Скачать книгу(-и): Сборник статей конференции
дипломов
МЕТОДЫ ФАКТОРНОГО КЛАСТЕРНОГО АНАЛИЗА ДЛЯ РЕАЛИЗАЦИИ КЛАССИФИКАЦИИ УЧЕНИКОВ ПО УСПЕВАЕМОСТИ В АВТОМАТИЗИРОВАННОЙ СИСТЕМЕ УЧИТЕЛЯ АНГЛИЙСКОГО ЯЗЫКА
По результатам анализа информационных процессов предметной области строится функциональная модель по методологии SADT в стандарте IDEF0 (рисунок 1).
Рисунок 1. Функциональная модель IDEF0
Более наглядно стадии деятельности учителя английского языка представлены на диаграмме декомпозиции модели в виде IDEF0 (рисунок 2).
На рисунке 2 наглядно показано, что для решения задачи классификации учеников по успеваемости нужно использовать математический метод, а именно методы факторного и кластерного анализа.
Рисунок 2. IDEF0-диаграмма декомпозиции
Одна из задач автоматизированной системы учителя английского языка является классификация учащихся по их успеваемости. Необходимо разбить учащихся на группы, например, «Обучающиеся на 5», «Обучающиеся на 4», «Обучающиеся на 3» и «Группа риска» (те, у кого много пропусков и низких оценок).
Решение такой задачи нужно для того, чтобы учитель мог понять, кому стоит уделить больше внимания на уроке, а кому давать более усложненные варианты индивидуальных заданий, это улучшит эффективность обучения на уроке.
Кластерный анализ – это многомерная статистическая процедура, выполняющая сбор данных, которые содержат информацию о выборке объектов, а затем упорядочивающая эти объекты в сравнительно однородные группы (кластеры) [1, с. 10].
Кластер – это группа элементов, которая характеризуется общим свойством [1, с. 10].
Существуют много методов кластерного анализа, перечислим некоторые из них:
1) Метод к-средних.
2) Метод Ворда.
3) Метод максимального локального расстояния.
4) Метод полных связей и др.
В классе обучается 20 человек. В учебном году, как всем известно, 4 учебных четверти.
Задача кластерного анализа заключается в следующем [1, с. 7]:
Пусть имеется множество объектов I = и множество признаков Z = , которыми обладают объекты из множества I. Результат i характеристики объекта будем обозначать вектором . Тогда на основании данных вектора X, нужно разбить объект I на k кластеров (k ≠ n) так, чтобы каждый объект принадлежал одному и только одному подмножеству разбиения. Объекты одного и того же кластера должны быть сходными, а объекты разных кластеров должны быть разными.
В классе обучается 20 учеников. Нам требуется разделить детей на четыре группы «Обучающиеся на 5», «Обучающиеся на 4», «Обучающиеся на 3» и «Группа риска» так, чтобы они были максимально различны. Такой тип задачи решает алгоритм метода к-средних.
Для того чтобы найти количество кластеров, на которые можно разбить исходные данные, нужно найти основные компоненты, воспользовавшись методом факторного анализа.
Допустим, имеется 4 четверти в году у каждого класса, входные данные будут иметь следующий вид:
Х=
Где X – это процент правильности выполнения i учеником j задания.
Для нахождения количества факторов воспользуемся следующим алгоритмом:
После нахождения числа кластеров k, разбиваем наше наблюдение n=20 на эти кластеры, при этом каждое наблюдение относится к тому кластеру, к центру (центроиду) которого оно ближе всего [12].
В качестве меры близости, для кластеризации, используем евклидово расстояние [2, с. 9]:
,i= , j= (1)
где: , – значения k-й переменной i-го и j-го объекта;
, , – векторы значений переменных у i-го и j-го объектов.
Алгоритм метода:
Если мера близости до центроида определена, то разбиение объектов на кластеры сводится к определению центроидов этих кластеров.
Рассмотрим первоначальный набор k-средних в кластерах . На первом этапе центроиды кластеров выбираются случайно.
Относим наблюдения к тем кластерам, чье среднее (центроид) к ним ближе всего. Каждое наблюдение принадлежит только к одному кластеру, даже если его можно отнести к двум и более кластерам.
Затем центроид каждого i-го кластера вычисляется заново по следующему правилу:
Алгоритм k-средних заключается в постоянном перевычислении (на каждом шаге) центроида для каждого кластера, полученного на предыдущем шаге, и останавливается, когда значения перестанут изменяться:
Следовательно, благодаря факторному анализу и методу к-средних можно реализовать классификацию учащихся по их успеваемости, это улучшит эффективность обучения на уроке и адаптирует автоматизированную систему для учителя английского языка.
Список литературы:
- Барковский С.С., Захаров В.М., Лукашов А.М., Нурутдинова А.Р., Шалагин С.В. Многомерный анализ данных методами прикладной статистики: Учеб. пособие. Казань: Изд. КГТУ, 2010. – 126 с.
- Боровиков В.П. Кластеризация: метод k-средних. // Портал знаний. [Электронный ресурс] – Режим доступа. – URL: http://statistica.ru/theory/klasterizatsiya-metod-k-srednikh/? (Дата обращения 04.03.18).
- Колесников В.Н., Семенов В.А. Политический анализ и прогнозирование: учеб. пособие. СПб.: Питер, 2014. – 432 с.
дипломов
Оставить комментарий