Поздравляем с Новым Годом!
   
Телефон: 8-800-350-22-65
WhatsApp: 8-800-350-22-65
Telegram: sibac
Прием заявок круглосуточно
График работы офиса: с 9.00 до 18.00 Нск (5.00 - 14.00 Мск)

Статья опубликована в рамках: LIII Международной научно-практической конференции «Научное сообщество студентов XXI столетия. ТЕХНИЧЕСКИЕ НАУКИ» (Россия, г. Новосибирск, 31 мая 2017 г.)

Наука: Информационные технологии

Скачать книгу(-и): Сборник статей конференции

Библиографическое описание:
Чернов Р.В., Болдырев А.С. ТЕОРЕТИЧЕСКИЕ ОСНОВЫ БЕЗОПАСНОСТИ И КОНФИДЕНЦИАЛЬНОСТИ ИНФОРМАЦИИ ПРИ РАЗРАБОТКЕ СИСТЕМ BIG DATA // Научное сообщество студентов XXI столетия. ТЕХНИЧЕСКИЕ НАУКИ: сб. ст. по мат. LIII междунар. студ. науч.-практ. конф. № 5(52). URL: https://sibac.info/archive/technic/5(52).pdf (дата обращения: 01.01.2025)
Проголосовать за статью
Конференция завершена
Эта статья набрала 0 голосов
Дипломы участников
У данной статьи нет
дипломов

ТЕОРЕТИЧЕСКИЕ ОСНОВЫ БЕЗОПАСНОСТИ И КОНФИДЕНЦИАЛЬНОСТИ ИНФОРМАЦИИ ПРИ РАЗРАБОТКЕ СИСТЕМ BIG DATA

Чернов Роман Вячеславович

студент 4 курса, кафедра геоинформатики и информационной безопасности, Самарский университет,

РФ, г. Самара

Болдырев Артем Сергеевич

студент 4 курса, кафедра геоинформатики и информационной безопасности, Самарский университет,

РФ, г. Самара

Додонов Михаил Витальевич

научный руководитель,

канд. пед. наук, доцент кафедры программных систем, Самарский университет,

РФ, г. Самара

Из-за технологического развития объем данных, генерируемых посредством сети Интернет, социальных сетей, различных и приложений и Интернета вещей, день ото дня увеличивается. Весь огромный объем данных, полученных из различных источников в разных форматах с очень высокой скоростью, называется большими данными (big data). Под обобщающим термином «большие данные» принято понимать любые наборы данных, достаточно большие и сложные для того, чтобы их можно было обработать традиционными средствами работы с данными [1, с. 18].

В данной работе будут затронуты проблемы конфиденциальности и безопасности этапов работы с big data.

Жизненный цикл Big Data.

Жизненный цикл big data состоит из создания, хранения и обработки данных [2].

На этапе формирования данных для защиты конфиденциальности используются методы ограничения доступа, а также методы фальсификации данных.

Подходы к защите конфиденциальности на этапе хранения данных, как правило, основаны на процедурах шифрования. Методы, основанные на шифровании, можно дополнительно разделить на шифрование на основе идентификации (IBE), шифрование на основе атрибутов (ABE) и шифрование пути хранения.

Этап обработки данных включает себя, так называемые, методы публикации сохраненных конфиденциальных данных (PPDP) и методы извлечения необходимой информации из данных. В PPDP для защиты конфиденциальности данных используются методы анонимизации, такие как обобщение и подавление. Эти механизмы можно далее подразделить на кластеризацию, классификацию и методы определения правил, основанные на правилах ассоциаций. В то время как кластеризация и классификация разделяют входные данные на различные группы, методы, основанные на методах связывания правил, находят полезные связи и тенденции во входных данных.

Вопросы конфиденциальности и безопасности.

Важным вопросом является конфиденциальность и безопасность в отношении больших данных. Модель безопасности big data не предполагается в случае сложных приложений, из-за которых она по умолчанию отключается. Однако в её отсутствие данные всегда легко могут быть скомпрометированы.

Конфиденциальность информации – это привилегия иметь некоторый контроль над тем, как собирается и используется личная информация, способность отдельного лица или группы ограничить информацию о себе. Серьёзной проблемой конфиденциальности пользователей является идентификация личной информации во время передачи через Интернет.

Безопасность – это практика защиты информационных ресурсов посредством использования технологий, процессов с помощью уполномоченного доступа, раскрытия, разрыва, модификации, инспекции, регистрации и разрушения.

Конфиденциальность vs. безопасность. Конфиденциальность данных сосредоточена на использовании и управлении отдельными данными – таких, как настройка политик для обеспечения сбора, совместного использования персональных данных потребителей соответствующим образом. Безопасность больше концентрируется на защите данных от вредоносных атак и злоупотреблении украденными данными для получения прибыли. Хотя безопасность является фундаментальной для защиты данных, этого недостаточно для решения проблемы конфиденциальности.

Требования конфиденциальности в Big Data.

Аналитики big data привлекаются в различные организации; большая часть из них решает не использовать критерии конфиденциальности из-за отсутствия стандартных средств защиты. Структура возможных стратегий обновлений больших платформ данных с помощью возможностей защиты конфиденциальности должна поддерживать:

1. Спецификацию политик конфиденциальности, управляющих доступом к данным, хранящимся в целевых больших платформах данных

2. Создание эффективных контролёров, следящих за соблюдением этих политик

3. Интеграцию в целевые аналитические платформы. Методы принудительного применения, предлагаемые для традиционных СУБД, кажутся неадекватными для большого контекста данных из-за строгого выполнения требований, необходимых для обработки больших объемов данных, гетерогенности данных и скорости, с которой данные должны анализироваться.

Рассмотрим стадии жизненного цикла big data с позиции конфиденциальности более подробно.

Конфиденциальность данных на стадии их генерации. Этап генерирования может быть классифицирован, как активное генерирование данных и создание пассивных данных. При активном формировании мы имеем в виду, что владелец данных предоставит их третьей стороне, в то время как пассивное формирование относится к обстоятельствам, при которых данные создаются операциями владельца данных (например, просмотр). Владелец может не знать о том, что данные собираются третьей стороной. Минимизация риска нарушения конфиденциальности происходит за счёт вышеупомянутых методов, а именно ограничение доступа и фальсификации данных.

Конфиденциальность данных на стадии их хранения. Хранение big data не является серьезной проблемой из-за продвижения технологий, например, в облачных вычислениях. Если система хранения big data скомпрометирована, она может быть иметь разрушительный характер, так как личная информация людей может быть раскрыта. В распределенной среде приложение может нуждаться в нескольких наборах данных из различных дата-центров, и поэтому оно сталкивается с проблемой защиты конфиденциальности.

Отвечая на специфику хранения аналитики big data, инфраструктура хранения должна быть масштабируемой. Она должна иметь возможность динамического конфигурирования для различных приложений. Одной из перспективных технологий для удовлетворения этих требований является виртуализация систем хранения данных, основанная на появляющейся парадигме облачных вычислений. Виртуализация хранилищ - это процесс, в котором многочисленные сетевые устройства хранения объединены в то, что создает впечатление единого устройства хранения. SecCloud является одной из моделей безопасности данных в облаке, которая совместно рассматривает безопасность данных и безопасность аудита вычислений.

Конфиденциальность данных на стадии их обработки. Обработка big data классифицирует все системы обработки на пакетные, поточные, графические и системы машинного обучения. Защиту конфиденциальности в части обработки данных можно разделить на две фазы. На первом этапе цель состоит в защите информации от не запрошенного раскрытия, поскольку собранные данные могут содержать конфиденциальную информацию владельца данных. На втором этапе целью является извлечение значимой информации из данных без нарушения конфиденциальности.

Заключение.

В заключение стоит отметить, что, по мнению экспертов, использование больших объёмов данных с каждым годом увеличивается, а значит, перед big data открываются большие перспективы как в использовании, так и в изучении этого комплекса технологий, в том числе в сфере информационной безопасности.

 

Список литературы:

  1. Силен Д., Мейсман А., Али М. Основы Data Science и Big Data. Python и наука о данных. — СПб.: Питер, 2017. — 336 с.
  2. Jain P., Gyanchandani M., Khare N. Big data privacy: a technological perspective and review. // Journal of Big Data — [электронный ресурс] — URL: https://journalofbigdata.springeropen.com/articles/10.1186/s40537-016-0059-y
Проголосовать за статью
Конференция завершена
Эта статья набрала 0 голосов
Дипломы участников
У данной статьи нет
дипломов

Оставить комментарий