Статья опубликована в рамках: LXVI Международной научно-практической конференции «Вопросы технических и физико-математических наук в свете современных исследований» (Россия, г. Новосибирск, 23 августа 2023 г.)

Наука: Информационные технологии

Секция: Системный анализ, управление и обработка информации

Скачать книгу(-и): Сборник статей конференции

Библиографическое описание:

Файзрахманов Р.А., Бакунов Р.Р. ТЕХНОЛОГИИ СНИЖЕНИЯ РАЗМЕРНОСТИ ДАННЫХ В ИНТЕРФЕЙСАХ МОЗГ-КОМПЬЮТЕР // Вопросы технических и физико-математических наук в свете современных исследований: сб. ст. по матер. LXVI междунар. науч.-практ. конф. № 8(57). – Новосибирск: СибАК, 2023. – С. 5-10.

Проголосовать за статью

Дипломы участников

У данной статьи нет
дипломов

ТЕХНОЛОГИИ СНИЖЕНИЯ РАЗМЕРНОСТИ ДАННЫХ В ИНТЕРФЕЙСАХ МОЗГ-КОМПЬЮТЕР

Файзрахманов Рустам Абубакирович

проф., д-р экон. наук, зав. кафедрой информационных технологий и автоматизированных систем, Пермский национальный исследовательский политехнический университет,

РФ, г. Пермь

Бакунов Роман Раисович

ст. преподаватель кафедры информационных технологий и автоматизированных систем, Пермский национальный исследовательский политехнический университет,

РФ, г. Пермь

DATA DIMENSIONALITY REDUCTION TECHNOLOGIES IN BRAIN-COMPUTER INTERFACES

Rustam Fayzrakhmanov

Prof., Dr. of Economic Sciences, Head of the Department of Information Technologies and Automated Systems, Perm National Research Polytechnic University,

Russia, Perm

Roman Bakunov

Senior Lecturer, Department of Information Technologies and Automated Systems, Perm National Research Polytechnic University,

Russia, Perm

АННОТАЦИЯ

Функционирование интерфейсов «мозг-компьютер» основано на обработке данных большой размерности, что является препятствием для эффективного применения этих систем. В данной статье рассматриваются подходы, нацеленные на решение обозначенной проблемы: линейный дискриминантный анализ и авторский гибридный метод обработки данных.

ABSTRACT

The functioning of brain-computer interfaces is based on the processing of high-dimensional data, which poses a challenge for the effective application of these systems. This article examines approaches aimed at addressing the highlighted issue: linear discriminant analysis and a proprietary hybrid data processing method.

Ключевые слова: интерфейс «мозг-компьютер», снижение размерности данных, линейный дискриминантный анализ, машинное обучение.

Keywords: brain-computer interface, data dimensionality reduction, linear discriminant analysis, machine learning.

Введение

Интерфейс "мозг-компьютер" (ИМК) представляет собой набор технологий, позволяющих осуществлять прямое взаимодействие между мозгом и компьютером, минуя традиционные каналы ввода информации, такие как клавиатура или мышь [1]. Применение этих технологий находится на передовой научных исследований в области нейронаук, робототехники и компьютерного моделирования.

Одной из ключевых проблем, возникающих при работе с ИМК, является обработка и анализ огромного объема данных, генерируемых мозгом в реальном времени. Регистрируемые электрические сигналы мозга (электроэнцефалограмма, ЭЭГ) представляют собой сложные многомерные временные ряды [2]. С учетом "проклятия размерности", стандартные методы анализа и классификации данных могут быть неэффективными или даже неприменимыми.

Основы снижения размерности данных

Снижение размерности данных является одним из подходов к решению этой проблемы. Применение различных методов дает возможность извлечь наиболее информативные характеристики из данных, тем самым упростив и ускорив дальнейшие процессы анализа и классификации [3].

Сокращение количества признаков в данных позволяет решить целый ряд проблем:

- «Проклятие размерности»: с ростом размерности данных эффективность многих алгоритмов ухудшается.

- Визуализация: представление многомерных данных на двухмерном или трехмерном графике становится возможным только после снижения размерности.

- Устранение шума: снижение размерности может помочь выделить основные компоненты данных и устранить шумовые или менее важные признаки.

Среди наиболее популярных методов снижения размерности можно выделить метод главных компонент (PCA, Principal Component Analysis), линейный дискриминантный анализ (Linear Discriminant Analysis, LDA) и т.д.

Их применение способствует более глубокому и эффективному анализу данных и поэтому является неотъемлемой частью современных исследований в области машинного обучения.

Линейный дискриминантный анализ

Линейный дискриминантный анализ (LDA) — это метод статистического анализа, используемый для нахождения линейных комбинаций признаков, которые наилучшим образом разделяют два или более множества объектов или событий.

LDA направлен на максимизацию отношения межклассовой дисперсии к внутриклассовой дисперсии в данных, чтобы достичь наилучшего разделения классов. Иными словами, LDA стремится минимизировать разброс внутри каждого класса и максимизировать разброс между разными классами.

Применение LDA обычно включает в себя следующие этапы:

- Вычисление внутриклассовой и межклассовой дисперсии.

- Определение дискриминантных векторов.

- Проекция данных на новое пространство с использованием этих векторов.

В контексте ИМК, где данные часто имеют высокую размерность, LDA может быть использован для выделения наиболее значимых характеристик, облегчая таким образом последующий анализ и классификацию сигналов ЭЭГ как во временной, так и в частотной областях.

Несмотря на широкое применение LDA в ИМК, этот метод не лишен недостатков и ограничений, которые могут влиять на его эффективность и точность:

- Одним из ключевых предположений LDA является нормальное распределение данных внутри каждого класса. Однако в реальных системах ИМК сигналы могут не всегда следовать этому распределению, что может привести к снижению эффективности последующей классификации.

- LDA предполагает, что классы имеют идентичные ковариационные матрицы. Это может не быть верным для многих реальных сценариев в ИМК, особенно когда данные представляют собой разнородные сигналы мозга.

- LDA идеально подходит для задач, где классы линейно разделимы. Однако, в случае сложных и переплетенных распределений данных, LDA может не давать оптимальных результатов.

- При наличии малого количества данных и большого числа признаков LDA может столкнуться с проблемой переобучения. Это означает, что модель может стать слишком специфичной к обучающим данным и плохо обобщать на новых данных.

- LDA может быть чувствителен к шумам и артефактам в данных, особенно когда исходные сигналы слабые по амплитуде, что является типичным для ЭЭГ.

Важно отметить, что ЛДА является одним из самых быстрых методов снижения размерности данных в задачах обработки сигналов ЭЭГ [4]. Однако его реализация все равно требует достаточно производительного вычислительного устройства.

Таким образом, возникает потребность в новых быстрых методах снижения размерности данных, обрабатываемых в системах ИМК.

Гибридный метод

Один из путей решения указанной проблемы детально описан в работе [5]. Представлен метод уменьшения размерности данных, который базируется на концепциях коэффициента корреляции и расстояния между векторами. Этот метод можно эффективно использовать в связке с LDA, что значительно ускоряет процесс снижения размерности данных.

Предложенный гибридный подход схематично изображен на рисунке 1.

Рисунок 1. Предлагаемый гибридных подход к обработке данных

Эксперименты показывают, что данная схема позволяет сокращать размерность данных за меньшее время, чем при использовании исключительно LDA (рисунок 2). При этом сохраняются все преимущества LDA, который успешно применяется в системах ИМК.

Рисунок 2. Сравнение производительности LDA и предложенного метода

На приведенной диаграмме фигурирует параметр «Размер сегмента». Сегменты – это то, на что разбиваются исходные сигналы ЭЭГ для выполнения быстрого преобразования Фурье (БПФ). Таким образом, они могут состоять из определенного количества выборок, являющихся степенью числа «2». На основе БПФ отдельных сегментов вычисляется усредненный спектр амплитуд для каждого сигнала, который и участвует в дальнейших процессах обработки данных (если сигналы ЭЭГ требуется рассматривать в частотной области). Количество спектральных компонентов в усредненных спектрах амплитуд и определяют исходную размерность пространства признаков.

В процессе проведенных экспериментов большая размерность пространства признаков (64, 128 и т.д.) сокращалась до 2. При этом сохранялись существенные межклассовые и малые внутриклассовые отличия данных, что контролировалось с помощью специальных критериев качества кластеризации.

Заключение

В статье были рассмотрены ключевые аспекты снижения размерности данных в ИМК. Рассмотрен линейный дискриминантный анализ (LDA), его преимущества, а также возможные проблемы и ограничения. Описано авторское исследование в направлении разработки гибридных моделей, объединяющих LDA с другими методами обработки данных.

В будущем можно ожидать взаимной интеграции более сложных и адаптивных методов машинного обучения, которые могут автоматически настраиваться в зависимости от специфики задачи и особенностей сигналов ЭЭГ каждого индивида.

Список литературы:

Wolpaw J.R., Birbaumer N., McFarland D.J., Pfurtscheller G., Vaughan T.M. "Brain–computer interfaces for communication and control". Clinical neurophysiology 113.6 (2002): 767-791.
Niedermeyer E., da Silva F.L. "Electroencephalography: Basic Principles, Clinical Applications, and Related Fields". Lippincott Williams & Wilkins, 2004.
Martinez A.M., Kak A.C. "PCA versus LDA". IEEE transactions on pattern analysis and machine intelligence 23.2 (2001): 228-233.
Lan T., Black L., Van Santen J., Erdogmus D. A comparison of different dimensionality reduction and feature selection methods for single trial ERP detection // 2010 Annual International conference of the IEEE engineering in medicine and biology society EMBC'10. 2010. P. 6329−6332.
Бакунов Р. Р. Метод снижения размерности данных в интерфейсных системах «мозг-компьютер» // Информационно-измерительные и управляющие системы. – 2018. – Т. 16. № 9. – С. 9-14.

Проголосовать за статью

Дипломы участников

У данной статьи нет
дипломов

ТЕХНОЛОГИИ СНИЖЕНИЯ РАЗМЕРНОСТИ ДАННЫХ В ИНТЕРФЕЙСАХ МОЗГ-КОМПЬЮТЕР

Оставить комментарий