Статья опубликована в рамках: Научного журнала «Студенческий» № 3(341)
Рубрика журнала: Информационные технологии
Скачать книгу(-и): скачать журнал часть 1, скачать журнал часть 2, скачать журнал часть 3, скачать журнал часть 4, скачать журнал часть 5
РАЗРАБОТКА МЕТОДА ФОРМИРОВАНИЯ АДАПТИВНЫХ ОБРАЗОВАТЕЛЬНЫХ ТРАЕКТОРИЙ ДЛЯ ИТ-СПЕЦИАЛИСТОВ ПРОМЫШЛЕННОГО ПРЕДПРИЯТИЯ НА ОСНОВЕ АНАЛИЗА ВАКАНСИЙ И ДЕНОТАТИВНОГО МОДЕЛИРОВАНИЯ
АННОТАЦИЯ
В статье предложен новый метод автоматизированного формирования адаптивных образовательных траекторий для ИТ-специалистов промышленных предприятий, основанный на анализе слабоструктурированных данных вакансий с применением обработки естественного языка (NLP) и денотативного моделирования. Разработана формальная модель требований работодателя на основе нечётких множеств ключевых компетенций, а также метод построения взвешенного денотативного графа, отражающего семантические связи между понятиями предметной области. Научная новизна заключается в интеграции NLP, нечёткой логики и графовых моделей для динамического выявления актуальных компетенций и генерации структурированных рекомендаций по обновлению учебных программ. Апробация метода на реальных данных (корпус 520 000 вакансий) и его внедрение в образовательный процесс ПНИПУ позволили выявить 37 новых востребованных компетенций, интегрировать их в учебные планы и повысить соответствие выпускников требованиям регионального рынка труда на 25–40%. Результаты подтверждают эффективность предложенного подхода для сокращения кадрового разрыва в высокотехнологичных отраслях промышленности.
Ключевые слова: адаптивные образовательные траектории, анализ вакансий, денотативный граф, нечёткие множества, обработка естественного языка, ИТ-кадры, промышленное предприятие.
1. ВВЕДЕНИЕ
Динамика цифровизации промышленности и реализация национальной программы «Цифровая экономика Российской Федерации» [5] обострили проблему дефицита квалифицированных ИТ-специалистов, чьи компетенции зачастую не соответствуют реальным требованиям предприятий [13]. Традиционные механизмы актуализации образовательных программ, основанные на экспертных опросах или анализе нормативных документов (ФГОС, профстандарты) [9, 10], обладают низкой гибкостью и не успевают за быстро меняющимся технологическим стеком [6].
В то же время, основной источник актуальной информации о требованиях рынка — тексты вакансий на агрегаторах — остаётся слабоструктурированным и труднообрабатываемым вручную из-за больших объёмов и постоянной изменчивости [7]. Существующие методы анализа вакансий часто ограничиваются частотным анализом ключевых слов и не позволяют выявлять глубинные семантические связи между компетенциями [1, 2].
Цель исследования — разработка метода автоматизированного формирования адаптивных образовательных траекторий для ИТ-специалистов на основе интеграции анализа вакансий, нечётких множеств и денотативных графов, обеспечивающего динамическое соответствие учебных программ потребностям промышленных предприятий.
Научная новизна заключается в:
Предложении формальной модели требований работодателя на основе нечётких множеств [3], учитывающей не только наличие, но и степень важности компетенций.
Разработке метода построения взвешенного денотативного графа, отражающего семантические и логические связи между компетенциями, что позволяет выявлять скрытые, фундаментальные знания [15].
Создании алгоритма интеллектуального обогащения модели компетенций за счёт внешних источников (образовательные стандарты, онлайн-курсы) и генерации структурированных рекомендаций для учебных программ.
2. МЕТОДОЛОГИЯ
2.1. Общая схема метода
Метод реализует конвейер обработки данных, состоящий из пяти этапов:
- Сбор данных: автоматический парсинг вакансий для ИТ-специалистов с региональных агрегаторов.
- Предобработка и векторизация: очистка текста, лемматизация с использованием доменного словаря ИТ-терминов, извлечение ключевых сущностей (технологии, языки программирования) и их векторизация с помощью модифицированной метрики TF-IDF [12].
- Построение модели требований работодателя (модель соискателя): кластерный анализ вакансий для выявления профессиональных направлений; для каждого кластера строится модель на основе нечётких множеств, где каждой компетенции присваивается вес принадлежности
[3].
- Построение онтологии предметной области (модель выпускника): обогащение выявленных компетенций за счёт внешних источников и построение взвешенного ориентированного денотативного графа
, отражающего связи типа «является частью», «требует предварительного знания» [11, 14].
- Формирование рекомендаций: генерация линейно упорядоченного списка понятий для изучения на основе графа модели выпускника и весов из модели соискателя.
2.2. Формальная постановка задачи
Задача оптимизации формулируется как максимизация сходства между моделью соискателя
и моделью выпускника
:
(1)
Сходство рассчитывается как мера покрытия ключевых понятий модели соискателя понятиями модели выпускника. Пусть
— множество ключевых понятий модели соискателя,
— множество понятий модели выпускника
. Тогда:
(2)
где
, если
, иначе 0.
Модель профессионального направления в модели соискателя описывается нечётким множеством:
(3)
где
— функция принадлежности понятия
к направлению
рассчитываемая на основе его частоты в вакансиях кластера [3, 12].
3. РЕАЛИЗАЦИЯ И АПРОБАЦИЯ
3.1. Экспериментальная апробация
Апробация метода проводилась совместно с АО «Сарапульский электрогенераторный завод» и кафедрой информационных технологий ПНИПУ. На основе корпуса из 520 000 вакансий по ИТ-специальностям за 33 месяца была построена региональная модель, выделившая 12 профессиональных направлений и 127 уникальных ключевых компетенций.
Для направления «Java-разработчик» алгоритм сформировал обогащённую модель, включившую 129 понятий и 493 смысловые связи между ними. В результате были выявлены 37 новых ключевых компетенций (таких как «Apache Kafka», «Spring Boot», «Docker»), ранее слабо отражённых в учебных планах, но востребованных региональными работодателями.
3.2. Оценка эффективности
Внедрение скорректированных учебных программ и проведение интенсивных курсов для студентов показали:
- рост уровня владения актуальным технологическим стеком на 60%;
- повышение общего соответствия выпускников требованиям работодателей на 25–40% по оценкам экспертов предприятий-партнёров.
Данные результаты подтверждают, что предложенный метод позволяет не только выявлять актуальные компетенции, но и эффективно интегрировать их в образовательный процесс, сокращая разрыв между вузовской подготовкой и запросами индустрии.
3.3. Сравнение с существующими подходами
В отличие от традиционных методов, основанных на экспертных опросах [6] или частотном анализе [2], предложенный подход обеспечивает:
- динамичность за счёт автоматического мониторинга вакансий;
- глубину анализа благодаря использованию денотативных графов;
- формальную обоснованность рекомендаций на основе нечётких множеств и меры сходства моделей.
4. ЗАКЛЮЧЕНИЕ
Разработанный метод формирования адаптивных образовательных траекторий на основе анализа вакансий и денотативного моделирования позволяет динамично синхронизировать содержание учебных программ с реальными требованиями промышленных предприятий. Научная новизна метода подтверждена формальными моделями и алгоритмами, а практическая эффективность — результатами апробации, показавшими значительное повышение соответствия компетенций выпускников запросам рынка труда.
Перспективными направлениями дальнейших исследований являются:
- интеграция метода с системами управления обучением (LMS) для персонализации траекторий;
- применение глубокого обучения для более точного извлечения и классификации компетенций;
- расширение подхода на другие высокотехнологичные отрасли.
Список литературы:
- Яруллин Д.В., Файзрахманов Р.А. Интеллектуальная система управления подготовкой ИТ-специалистов на основе денотативной аналитики // Прикладная математика и вопросы управления. 2022. № 3. С. 141–164.
- Yarullin D.V., Faizrakhmanov R.A., Fominykh P.Y. A Web-Data Driven HR Decision Support System Based on the IT Specialist Vector Model // Proceedings of 2021 24th International Conference on Soft Computing and Measurements (SCM). 2021. P. 225–228.
- Zadeh L.A. Fuzzy sets // Information and Control. 1965. Vol. 8, no. 3. P. 338–353.
- Jurafsky D., Martin J.H. Speech and Language Processing. 3rd ed. 2020.
- Национальная программа «Цифровая экономика Российской Федерации». Утверждена президиумом Совета при Президенте РФ по стратегическому развитию и национальным проектам, протокол №16 от 24 декабря 2018 г.
- Подвесовский А.Г., Бурцева Е.Т. Моделирование компетенций ИТ-специалиста на основе анализа рынка труда // Информационные технологии. 2020. Т. 26. № 5. С. 290–298.
- Feldman R., Sanger J. The Text Mining Handbook: Advanced Approaches in Analyzing Unstructured Data. Cambridge Univ. Press, 2007.
- Cormen T.H. et al. Introduction to Algorithms. 3rd ed. MIT Press, 2009.
- Профессиональный стандарт «Специалист по информационным системам». Приказ Минтруда России № 866н от 05.12.2016.
- ФГОС ВО по направлению 09.04.04 «Программная инженерия» (магистратура). Утв. приказом Минобрнауки России.
- Newman M.E.J. Networks. 2nd ed. Oxford Univ. Press, 2018.
- Pedregosa F. et al. Scikit-learn: Machine Learning in Python // JMLR. 2011. Vol. 12. P. 2825–2830.
- Тамбовцев В.Л. Оценка потребности в кадрах для цифровой экономики // Вопросы экономики. 2019. № 5. С. 5–23.
- Borgatti S.P. et al. Network analysis in the social sciences // Science. 2009. Vol. 323, no. 5916. P. 892–895.
- Клесов А.А., Ландэ Д.В. Поиск знаний в Internet. М.: ДМК Пресс, 2017.


Оставить комментарий