Статья опубликована в рамках: Научного журнала «Студенческий» № 8(178)

Рубрика журнала: Информационные технологии

Скачать книгу(-и): скачать журнал часть 1, скачать журнал часть 2, скачать журнал часть 3, скачать журнал часть 4

Библиографическое описание:

Мамаев А.Н. МЕТОДЫ ВЫЧЛЕНЕНИЯ КЛЮЧЕВЫХ СЛОВ ПРИ ОЦЕНКЕ ПОЛЬЗОВАТЕЛЬСКИХ ИНТЕРФЕЙСОВ ПРОГРАММ // Студенческий: электрон. научн. журн. 2022. № 8(178). URL: https://sibac.info/journal/student/178/242594 (дата обращения: 15.07.2026).

МЕТОДЫ ВЫЧЛЕНЕНИЯ КЛЮЧЕВЫХ СЛОВ ПРИ ОЦЕНКЕ ПОЛЬЗОВАТЕЛЬСКИХ ИНТЕРФЕЙСОВ ПРОГРАММ

Мамаев Александр Николаевич

магистрант, кафедра прикладной математики и информатики, Тольяттинский государственный университет,

РФ, г. Тольятти

Панюкова Екатерина Владимировна

научный руководитель,

канд. пед. наук. Тольяттинский государственный университет,

РФ, г. Тольятти

АННОТАЦИЯ

В статье описывается применение метода вычленения ключевых слов для исследования параметров оценки интерфейсов и алгоритмы, используемые для вычленения ключевых слов.

Ключевые слова: алгоритмы, анализ текста, вычленение ключевых слов,оценка пользовательского интерфейса.

Проблема оценки качества пользовательского интерфейса всегда стояла остро перед разработчиками, начинаю с первого программного обеспечения. На сегодняшний день можно выделить следующие методы оценки качества интерфейсов:

субъективный метод,
метод анкетирования пользователей,
метод быстрого прототипирования,
метод анализ задач,
экспертная оценка.

Данные методики не подходят для оценки интерфейсов программ для стартапов или программ для реализации научных задач, так как. предполагают оценку пользователей.

В рамках данной статьи будет предложена новая методика оценки интерфейсов до внедрения, т.е. до активного использования пользователями. А также на сегодняшний день ни одна предложенная методика оценки пользовательских интерфейсов не учитывает текстовую составляющую интерфейсов, а сегодня текстовая составляющая интерфейса становится не менее важной, чем и графическая, и даже появились профессии, которые отвечают за этот параметр интерфейсов:

SEO-копирайтеры, которые пишут тексты для поискового продвижения сайтов, учитывая требования к объёму, содержанию и ключевым словам, чтобы страницы сайта хорошо ранжировались по запросам.
SMM-копирайтеры, задача которых написание коротких, ёмких и цепляющих текстов для социальных сетей.
UX-редакторы, или редакторы интерфейсов, которые отвечают за то, чтобы все тексты в программном продукте (на сайте, лендинге или в приложении) максимально хорошо помогали пользователю достигать цели использования этого приложения.

Рассмотрим ключевые сущности предлагаемой системы.

Основными классами являются:

Эксперт
Оценка экспертов
Аналитик
Интерфейс
Количественные параметры интерфейсов
Тексты интерфейсов
Отчеты
Роли
Администратор

От класса Роли наследуются три класса:

Администратор
Эксперт
Аналитик

Администратор – имеет доступ ко всем элементам программы.

Эксперт – имеет возможность поставить оценку, т.е. оценить интерфейс с качественной точки зрения.

Аналитик – получает доступ к результатам работы системы и может работать с отчетами.

Рисунок 1. Диаграмма классов системы для оценки пользовательских интерфейсов

Класса Интерфейс включает следующие классы:

Оценка экспертов
Тексты интерфейса
Количественные параметры интерфейсов

В классе Оценка экспертов – хранятся оценки, полученные интерфейсом у эксперта. Один эксперт может оценить множество интерфейсов, и один интерфейс может быть оценен множеством Экспертов.

В классе Тексты интерфейса хранятся ключевые слова и тексты кнопок. Наличие данного класса позволит собирать и анализировать текстовую составляющую интерфейсов и на основе (базы знаний по другим интерфейсам, которые признаны лучшими) делать прогноз и оценку по качеству интерфейса, предложенного на оценку.

Класс Количественные параметры интерфейсов – позволит собирать информацию о количественных метриках. Наиболее распространенными эргономическими показателями качества пользовательского интерфейса являются показатели Шнейдермана:

1) скорость работы пользователя в программе до получения результата;

2) количество человеческих ошибок, допущенных пользователем в интерфейсе до получения результата;

3) субъективная удовлетворенность пользователя интерфейсом;

4) скорость обучения навыкам оперирования интерфейсом.

Класс Отчет – использует данные класса Интерфейсы и через него получает все количественные и качественные показатели.

Рассмотрим работу по выделению ключевых слов интерфейса. Ключевыми словами называются слова, обладающие рядом признаков:

Слова, которые наиболее часто встречаются в тексте
Слова, с помощью которых можно примерно представить смысл всего текста
В рамках статьи, ключевыми словами так же будут слова кнопок и элементов интерфейса.

На текущий момент существует достаточно много различных методов разбиения текста на ключевые слова. Можно выделить два основных вида алгоритмов:

статистические
гибридные.

Рассмотрим каждый метод более подробно.

Статистический метод основан на статистике, он предполагает ранжирования всех лексем по частоте. Фильтрация заключается в отборе в качестве ключевых определенного количества наиболее частотных лексем. Этот метод является первым методом автоматического извлечения ключевых слов [1]. Данный метод наиболее прост в реализации. Недостатком данного метода, являться то, что частота употребления слова в тексте является не главным параметром.

Гибридный алгоритм – это комбинация статистического метода с лингвистическими процедурами (синтаксическим, лингвистическим, морфологическим анализом). Гибридный алгоритм включает поиск в тексте документа базовых именных групп (БИГ) с использованием морфо-синтаксического анализа на основе словарей и вычисление релевантности БИГ[2].

Существуют методы извлечения ключевых слов на основе графов [3]. Эти методы используют взвешенные графы, в вершинах у которого находятся лексемы кандидаты в ключевые слова, а вес дуг зависит от того, на сколько кандидаты близки по смыслу. Для выбора кандидатов в ключевые слова используются различные алгоритмы из теории графов. Основным отличием этих методов является применение разных методов определения кандидатов в ключевые слова и определения близости между ними. Гибридные методы дают более точные результаты, чем статистические, но при этом они более сложные.

Заключение

Сравнивая количество совпадений ключевых слов между используемым в оценки интерфейса и словами интерфейсов наиболее популярных программы, набравшими больше всего положительных оценок у экспертов или количество скачиваний на он-лайн площадках, можно примерно определить на сколько успешным будет разрабатываемый интерфейс. На основе полученных данных формируется перспектива разработки информационной системы, которая позволила бы в значительной степени повысить эффективность работы SEO-копирайтеров, SMM-копирайтеров и UX-редакторы.

Список литературы:

Luhn H.P. A Statistical Approach to Mechanized Encoding and Searching of Literary Information. IBM Journal of Research and Development. 1957, pp. 309-310.
Barker K. Cornacchia N. Using Noun Phrase Heads to Extract Document Keyphrases. Advances in Artificial Intelligence. 2000, pp. 40.
Girish K.P. Keyword Extraction from a Single Document Using Centrality Measures. Pattern Recognition and Machine Intelligence. Springer Berlin Heidelberg, 2007, pp. 503-504.
Шереметьева, С.О. Методы и модели автоматического извлечения ключевых слов / С.О. Шереметьева, П.Г. Осминин // Вестник ЮУрГУ. Серия «Лингвистика». – 2015. – Т. 12, № 1. – С. 76–81