Статья опубликована в рамках: XXXIV Международной научно-практической конференции «Научное сообщество студентов: МЕЖДИСЦИПЛИНАРНЫЕ ИССЛЕДОВАНИЯ» (Россия, г. Новосибирск, 04 декабря 2017 г.)
Наука: Информационные технологии
Скачать книгу(-и): Сборник статей конференции
дипломов
МЕТОДЫ ФАКТОРНОГО И КЛАСТЕРНОГО АНАЛИЗА ДЛЯ РЕАЛИЗАЦИИ АДАПТИВНОГО ОБУЧЕНИЯ ПРИ ПОДГОТОВКЕ К ЕГЭ ПО ИНФОРМАТИКЕ
Технологию обучения в адаптивной информационной образовательной системе можно представить следующим образом (рисунок 1):
Рисунок 1. Технология обучения в АИОС
ИС – измерение состояний ОУ (какие ЗУН у объекта есть).
ИО – индивидуальные особенности ОУ (аудиал или визуал).
Z – перечень ЗУН, которые нужно приобрести ОУ.
U – перечень ЗУН, которые приобрести ОУ.
Модель обучаемого учитывает текущее состояние ОУ и его предысторию обучения.
Данная технология заключается в том, что перед началом работы в данной среде, определяются начальные знания, умения и навыки, а также индивидуальные особенности объекта управления и сохраняет данные в «модель обучаемого».
В зависимости от ИС и ИО система классифицирует ресурсы и передает ОУ только нужный теоретический и практический материал. После изучения, вновь проходит проверка знаний, умений и навыков. Если не все ЗУН усвоены АИОС вновь обращается к ресурсам, передает нужный материал ОУ и все повторяется вновь.
Цель исследования: создать электронное учебное пособие с интерактивными технологиями адаптивного обучения для подготовки к ЕГЭ по информатике.
Задачи:
- создать автоматизированную информационную систему для подготовки к ЕГЭ по информатике;
- реализовать построение статистики эффективности получение ЗУН;
- реализовать построение мониторинга успешности прохождения выбранных тестов по выбранным учащимся или по всему классу.
- реализовать построение адаптивного плана подготовки к ЕГЭ от самой легкой теме, к самой сложной индивидуально для каждого учащегося, а также проводить классификацию сложности решения заданий по блокам из ЕГЭ по всем выбранным учащимся, что позволит выносить на общее обсуждение наиболее важные темы.
Для решения этой задачи должен быть реализован кластерный анализ.
Кластерный анализ – это многомерная статистическая процедура, выполняющая сбор данных, которые содержат информацию о выборке объектов, а затем упорядочивающая эти объекты в сравнительно однородные группы (кластеры). Кластер – это группа элементов, которая характеризуется общим свойством [2, с. 175].
Задача кластерного анализа заключается в следующем [1, с. 7,8]:
Пусть имеется множество объектов I = и множество признаков Z = , которыми обладают объекты из множества I. Результат i характеристики объекта будем обозначать вектором . Тогда на основании данных вектора X, нужно разбить объект I на k кластеров (k ≠ n) так, чтобы каждый объект принадлежал одному и только одному подмножеству разбиения. Объекты одного и того же кластера должны быть сходными, а объекты разных кластеров должны быть разными.
Существуют следующие методы кластерного анализа:
- Метод полных связей.
- Метод максимального локального расстояния.
- Метод Ворда.
- Метод к-средних и др.
В едином государственном экзамене по информатике 23 задания в первой части. Нам требуется разделить эти задания на три группы «Слабое решение заданий», «Среднее решение заданий», «Уверенное решение заданий» так, чтобы они были максимально различны. Такой тип задачи решает алгоритм метода к-средних.
В ходе эксперимента возник вопрос о том, что не все задания попали в один из трех классов, следовательно, можно сделать вывод о том, что кластеров может быть больше.
Для того чтобы найти количество кластеров, на которые можно разбить исходные данные, нужно найти основные компоненты, воспользовавшись методом факторного анализа.
Допустим, имеется 5 учеников решивших задачи ЕГЭ, входные данные будут иметь следующий вид:
Х=
Где X – это процент правильности выполнения i учеником j задания.
Для нахождения количества факторов воспользуемся следующим алгоритмом:
- Задаем критерий окончания поиска главного компонента 0 < ε1 < 1, критерий окончания поиска главных компонентов 0 < ε2 < 1, отцентрированная матрица , i1=1 – номер главной компоненты.
- Берется – вектор-столбец, k - шаг алгоритма, j - любой столбец.
- Вектор транспонируется.
- нормируется.
- Считаем новый
- Если || < ε1, то и – вектора весов и нагрузок соответственно для i-ой главной компоненты. Иначе и идем к пункту 3.
- Если |< ε, то все компоненты найдены, иначе переходим к пункту 2.
После нахождения числа кластеров k, разбиваем наше наблюдение n=23 на эти кластеры, при этом каждое наблюдение относится к тому кластеру, к центру (центроиду) которого оно ближе всего [3].
В качестве меры близости, для кластеризации, используем евклидово расстояние [1, с. 9]:
,i= , j= (1)
где , – значения k-й переменной i-го и j-го объекта;
, , – векторы значений переменных у i-го и j-го объектов
Алгоритм метода:
Если мера близости до центроида определена, то разбиение объектов на кластеры сводится к определению центроидов этих кластеров.
Рассмотрим первоначальный набор k-средних (центроидов) в кластерах . На первом этапе центроиды кластеров выбираются случайно.
Относим наблюдения к тем кластерам, чье среднее (центроид) к ним ближе всего. Каждое наблюдение принадлежит только к одному кластеру, даже если его можно отнести к двум и более кластерам.
Затем центроид каждого i-го кластера перевычисляется по следующему правилу:
Алгоритм k-средних заключается в перевычислении на каждом шаге центроида для каждого кластера, полученного на предыдущем шаге, и останавливается, когда значения перестанут изменяться:
Таким образом, благодаря факторному анализу и методу к-средних можно реализовать классификацию сложности решения заданий по блокам из ЕГЭ по конкретному ученику, а также по всем выбранным учащимся, что улучшит эффективность обучения на уроке, а также адаптирует интерфейс электронного учебного пособия для учащихся.
Список литературы:
- Барковский С.С., Захаров В.М., Лукашов А.М., Нурутдинова А.Р., Шалагин С.В. Многомерный анализ данных методами прикладной статистики: Учеб. пособие. Казань: Изд. КГТУ, 2010. – 126 с.
- Колесников В.Н., Семенов В.А. Политический анализ и прогнозирование: учеб. пособие. СПб.: Питер, 2014. – 432 с.
- Боровиков В.П. Кластеризация: метод k-средних. // Портал знаний. [электронный ресурс] – Режим доступа. – URL: http://statistica.ru/theory/klasterizatsiya-metod-k-srednikh/? (дата обращения 08.05.17)
дипломов
Оставить комментарий