Статья опубликована в рамках: Научного журнала «Студенческий» № 8(178)
Рубрика журнала: Информационные технологии
Скачать книгу(-и): скачать журнал часть 1, скачать журнал часть 2, скачать журнал часть 3, скачать журнал часть 4
МЕТОДЫ ВЫЧЛЕНЕНИЯ КЛЮЧЕВЫХ СЛОВ ПРИ ОЦЕНКЕ ПОЛЬЗОВАТЕЛЬСКИХ ИНТЕРФЕЙСОВ ПРОГРАММ
АННОТАЦИЯ
В статье описывается применение метода вычленения ключевых слов для исследования параметров оценки интерфейсов и алгоритмы, используемые для вычленения ключевых слов.
Ключевые слова: алгоритмы, анализ текста, вычленение ключевых слов,оценка пользовательского интерфейса.
Проблема оценки качества пользовательского интерфейса всегда стояла остро перед разработчиками, начинаю с первого программного обеспечения. На сегодняшний день можно выделить следующие методы оценки качества интерфейсов:
- субъективный метод,
- метод анкетирования пользователей,
- метод быстрого прототипирования,
- метод анализ задач,
- экспертная оценка.
Данные методики не подходят для оценки интерфейсов программ для стартапов или программ для реализации научных задач, так как. предполагают оценку пользователей.
В рамках данной статьи будет предложена новая методика оценки интерфейсов до внедрения, т.е. до активного использования пользователями. А также на сегодняшний день ни одна предложенная методика оценки пользовательских интерфейсов не учитывает текстовую составляющую интерфейсов, а сегодня текстовая составляющая интерфейса становится не менее важной, чем и графическая, и даже появились профессии, которые отвечают за этот параметр интерфейсов:
- SEO-копирайтеры, которые пишут тексты для поискового продвижения сайтов, учитывая требования к объёму, содержанию и ключевым словам, чтобы страницы сайта хорошо ранжировались по запросам.
- SMM-копирайтеры, задача которых написание коротких, ёмких и цепляющих текстов для социальных сетей.
- UX-редакторы, или редакторы интерфейсов, которые отвечают за то, чтобы все тексты в программном продукте (на сайте, лендинге или в приложении) максимально хорошо помогали пользователю достигать цели использования этого приложения.
Рассмотрим ключевые сущности предлагаемой системы.
Основными классами являются:
- Эксперт
- Оценка экспертов
- Аналитик
- Интерфейс
- Количественные параметры интерфейсов
- Тексты интерфейсов
- Отчеты
- Роли
- Администратор
От класса Роли наследуются три класса:
- Администратор
- Эксперт
- Аналитик
Администратор – имеет доступ ко всем элементам программы.
Эксперт – имеет возможность поставить оценку, т.е. оценить интерфейс с качественной точки зрения.
Аналитик – получает доступ к результатам работы системы и может работать с отчетами.
Рисунок 1. Диаграмма классов системы для оценки пользовательских интерфейсов
Класса Интерфейс включает следующие классы:
- Оценка экспертов
- Тексты интерфейса
- Количественные параметры интерфейсов
В классе Оценка экспертов – хранятся оценки, полученные интерфейсом у эксперта. Один эксперт может оценить множество интерфейсов, и один интерфейс может быть оценен множеством Экспертов.
В классе Тексты интерфейса хранятся ключевые слова и тексты кнопок. Наличие данного класса позволит собирать и анализировать текстовую составляющую интерфейсов и на основе (базы знаний по другим интерфейсам, которые признаны лучшими) делать прогноз и оценку по качеству интерфейса, предложенного на оценку.
Класс Количественные параметры интерфейсов – позволит собирать информацию о количественных метриках. Наиболее распространенными эргономическими показателями качества пользовательского интерфейса являются показатели Шнейдермана:
1) скорость работы пользователя в программе до получения результата;
2) количество человеческих ошибок, допущенных пользователем в интерфейсе до получения результата;
3) субъективная удовлетворенность пользователя интерфейсом;
4) скорость обучения навыкам оперирования интерфейсом.
Класс Отчет – использует данные класса Интерфейсы и через него получает все количественные и качественные показатели.
Рассмотрим работу по выделению ключевых слов интерфейса. Ключевыми словами называются слова, обладающие рядом признаков:
- Слова, которые наиболее часто встречаются в тексте
- Слова, с помощью которых можно примерно представить смысл всего текста
- В рамках статьи, ключевыми словами так же будут слова кнопок и элементов интерфейса.
На текущий момент существует достаточно много различных методов разбиения текста на ключевые слова. Можно выделить два основных вида алгоритмов:
- статистические
- гибридные.
Рассмотрим каждый метод более подробно.
Статистический метод основан на статистике, он предполагает ранжирования всех лексем по частоте. Фильтрация заключается в отборе в качестве ключевых определенного количества наиболее частотных лексем. Этот метод является первым методом автоматического извлечения ключевых слов [1]. Данный метод наиболее прост в реализации. Недостатком данного метода, являться то, что частота употребления слова в тексте является не главным параметром.
Гибридный алгоритм – это комбинация статистического метода с лингвистическими процедурами (синтаксическим, лингвистическим, морфологическим анализом). Гибридный алгоритм включает поиск в тексте документа базовых именных групп (БИГ) с использованием морфо-синтаксического анализа на основе словарей и вычисление релевантности БИГ[2].
Существуют методы извлечения ключевых слов на основе графов [3]. Эти методы используют взвешенные графы, в вершинах у которого находятся лексемы кандидаты в ключевые слова, а вес дуг зависит от того, на сколько кандидаты близки по смыслу. Для выбора кандидатов в ключевые слова используются различные алгоритмы из теории графов. Основным отличием этих методов является применение разных методов определения кандидатов в ключевые слова и определения близости между ними. Гибридные методы дают более точные результаты, чем статистические, но при этом они более сложные.
Заключение
Сравнивая количество совпадений ключевых слов между используемым в оценки интерфейса и словами интерфейсов наиболее популярных программы, набравшими больше всего положительных оценок у экспертов или количество скачиваний на он-лайн площадках, можно примерно определить на сколько успешным будет разрабатываемый интерфейс. На основе полученных данных формируется перспектива разработки информационной системы, которая позволила бы в значительной степени повысить эффективность работы SEO-копирайтеров, SMM-копирайтеров и UX-редакторы.
Список литературы:
- Luhn H.P. A Statistical Approach to Mechanized Encoding and Searching of Literary Information. IBM Journal of Research and Development. 1957, pp. 309-310.
- Barker K. Cornacchia N. Using Noun Phrase Heads to Extract Document Keyphrases. Advances in Artificial Intelligence. 2000, pp. 40.
- Girish K.P. Keyword Extraction from a Single Document Using Centrality Measures. Pattern Recognition and Machine Intelligence. Springer Berlin Heidelberg, 2007, pp. 503-504.
- Шереметьева, С.О. Методы и модели автоматического извлечения ключевых слов / С.О. Шереметьева, П.Г. Осминин // Вестник ЮУрГУ. Серия «Лингвистика». – 2015. – Т. 12, № 1. – С. 76–81
Оставить комментарий