Телефон: 8-800-350-22-65
WhatsApp: 8-800-350-22-65
Telegram: sibac
Прием заявок круглосуточно
График работы офиса: с 9.00 до 18.00 Нск (5.00 - 14.00 Мск)

Статья опубликована в рамках: LXXI Международной научно-практической конференции «Научное сообщество студентов XXI столетия. ТЕХНИЧЕСКИЕ НАУКИ» (Россия, г. Новосибирск, 15 ноября 2018 г.)

Наука: Информационные технологии

Скачать книгу(-и): Сборник статей конференции

Библиографическое описание:
Кузьмин Д.В., Семенова А.А. СПОСОБЫ ОРГАНИЗАЦИИ РАСПРЕДЕЛЕННЫХ ИНФОРМАЦИОННЫХ СИСТЕМ С АРХИТЕКТУРОЙ МНОГОКЛАСТЕРНЫХ ВЫЧИСЛИТЕЛЬНЫХ КОМПЛЕКСОВ // Научное сообщество студентов XXI столетия. ТЕХНИЧЕСКИЕ НАУКИ: сб. ст. по мат. LXXI междунар. студ. науч.-практ. конф. № 11(70). URL: https://sibac.info/archive/technic/11(70).pdf (дата обращения: 23.04.2024)
Проголосовать за статью
Конференция завершена
Эта статья набрала 0 голосов
Дипломы участников
У данной статьи нет
дипломов

СПОСОБЫ ОРГАНИЗАЦИИ РАСПРЕДЕЛЕННЫХ ИНФОРМАЦИОННЫХ СИСТЕМ С АРХИТЕКТУРОЙ МНОГОКЛАСТЕРНЫХ ВЫЧИСЛИТЕЛЬНЫХ КОМПЛЕКСОВ

Кузьмин Дмитрий Владимирович

магистрант 3 курса, факультет повышения квалификации и переподготовки, Московский технический университет связи и информатики,

РФ, г. Москва

Семенова Анна Анатольевна

магистрант 3 курса, факультет повышения квалификации и переподготовки, Московский технический университет связи и информатики,

РФ, г. Москва

Воронцов Юрий Алексеевич

научный руководитель,

д-р техн. наук, профессор, заведующий кафедрой Информационных систем МТУСИ,

РФ, г. Москва

Культура организации четвертой индустриальной революции, введение новейших способов коммуникации и информационного влияния, регулирование и ограничение распространения цифрового контента, а также принудительный захват собственности повлекли создание системы адаптации на нежелательные воздействия. Способы ведения современного цифрового бизнеса предъявляют требования к его устойчивости в среде сопротивления указанным факторам. Собственники распределенных информационных систем, средствами и продуктом труда которых является информация, прибегают к развертыванию космополитических моделей проектов. [5] Так, уже недостаточно иметь единственную локацию вычислительного кластера. Необходимо, чтобы такая локация была неоднократно реплицирована и разнесена географически. Вопрос синхронизации пользовательских данных при этом решается рядом оригинальных способов: от постоянной взаимной синхронизации реплицируемых ресурсов, до построения соподчиненной многокластерной архитектуры с единой точкой входа и бекендом копий, способных подменять точку входа при необходимости. Ключевым и фундаментальным элементом такого вида бизнеса являются мощные средства криптографической защиты информации, позволяющие поддерживать внутреннюю информационную целостность и безопасность внешних коммуникаций. [3]

Высокая скорость развития и постоянный рост спроса на организацию многокластерных вычислительных комплексов (МКВК) с распределенной информационной архитектурой уже сейчас позволяет отметить следующие "классические" способы организации [2]:

распределенные информационные системы (РИС) с равноправными кластерами;

РИС с иерархической кластерной организацией.

Необходимо отметить, что чем выше стоимость рисков и доходность ведения цифрового бизнеса, тем более собственники и управленцы склонны принимать решения о развертывании в составе каждого из вычислительных кластеров многомашинного вычислительного комплекса. Такой подход позволяет обеспечивать "горячие" замены аппаратно-программных средств без портирования исполняемого функционала на другие кластеры. Поэтому в случае, когда сам бизнес или производимый контент не испытывает затруднений, то указанный способ существенно экономит оперативные трудозатраты, частично освобождает коммутационные ресурсы зеркалирования трафика и позволяет решать техническую задачу локально. Одновременно обеспечивается экономия трудовых и накладных ресурсов на географически удаленных кластерах.

С учетом распространенности моделей предоставления сервисных уровней обслуживания (IaaS, PaaS, SaaS и проч.) способы организации РИС с архитектурой МКВК представляю достаточно гибкий набор решений. [7] Так, организация РИС с равноправными кластерами может осуществляться на подготовленной (несобственной) инфраструктуре, аппаратной платформе (с учетом операционной программной среды) или уже адаптированного под типичные задачи прикладного программного обеспечения (ПО). Проведенный опрос анонимных респондентов из 26 стартапов, развивающихся и крупнейших российских и зарубежных ИТ-компаний показывает, что в случае начального этапа развития бизнеса подбирается дешевое и максимально готовое решение. Такие проекты реализовываются, как привило, локально и на малых мощностях, не располагают географическим разнесением и используют модель SaaS-сервисов, а в случае их успешного развития производится замена арендованного основного или прикладного ПО на собственное и проект переводится на модель обслуживания PaaS. В случае наличия у проекта ценных перспектив или состоятельных инвесторов, как правило, выбирается колокейшн-решение собственных серверов с собственным ПО в рамках модели IaaS. При этом фактор независимости владения и результатов ведения бизнеса предполагает использование географически разнесенных кластеров по разрозненным государственным юрисдикциям.

С архитектурной точки зрения может быть выбрана модель организации облачной платформы. Часть кластеров такой платформы состоит из равноправных взаимозаменяемых серверов, при этом другая часть может служить резервным зеркалом по отношению к основной. По сути, указанная архитектура является избыточной, но исключительно надежной и, если издержки и прибыльность позволяют организовать такое решение, то выбирается именно эта архитектура. Следующим способом организации РИС с архитектурой МКВК по степени ослабления параметра резервирования является создание многокластерной равноправной модели без бекенда дублирующих серверов. Необходимо особенно тщательно учитывать многофакторность рисков при существенной географической разнесенности. Так, в связи с перебоями обеспечения связи и электроснабжения одновременно могут произойти отказы более двух площадок. В связи с этим кластеризацию следует обеспечивать в центрах с пониженными техническими рисками, а РИС должна насчитывать более трех кластеров. Проблемным функционально-архитектурным моментом является обеспечение синхронизации пользовательских данных. Решением указанной проблемы является многофакторное распределение отправляемой и поступающей информации при одновременной коммутации с выделенными портами и каналами внутреннего контура (в целях синхронизации). Современные средства синхронизации позволяют обеспечить актуальность данных с периодичностью порядка 10 мс при кардинальной географической удаленности (более 3000 км) и около 3 мс при средних величинах (до 3000 км). [4] Например, компания Google при организации кластера интернет-сервиса YouTube использует разноплановые технические решения для хранения и обработки данных (от мейнфреймов до комплексов полупрофессиональных серверов в стойках), но при любых конфигурациях межсерверная коммутация обеспечивается избыточным числом каналов связи. Так, средний пользователь (житель города-миллионника) подобных интернет-сервисов использует порядка 5 Гбайт трафика в месяц, из которых 3,5 - 4 приходятся на download, а остальные 1 - 1,5 на upload. Следовательно, ежесуточный объем трафика будет составлять около 164 Мбайт, а ежесекундный - 1,9 Кбайт. Указанный пользователь в среднем постоянно оперирует с 3 - 5 популярными интернет-ресурсами, в связи с этим средняя ежесекундная нагрузка от одного пользователя для таких ресурсов составляет от 380 до 633 байт, соответственно нагрузка за 3 мс будет составлять 1,14 - 3,17 байт, а за 10 мс - от 3,8 до 6,3 байт. При одновременном пользовательском потоке в 5 млн физических адресов нагрузка трафика составит от 19 до 31,5 Мбайт в указанное время. При условии разнесения трафика по сервисам или географическим локациям указанные величины являются вполне приемлемыми, а потеря данных - некритичной и возобновляемой уже на уровне эхо-запроса протоколов технического уровня. Однако интернет-компании, позиционирующие себя как надежных поставщиков цифрового контента, вынуждены организовывать архитектурные параметры по модели продолжительных экстремальных условий. Исходя из приведенного примера такими стресс-условиями можно считать превышение пиковой нагрузки трафика в 100 раз и более (особенно в обеденное время будних дней с 12:30 до 16:30, а также в вечернее время с 20:00 до 23:30). Средствами преодоления таких нагрузок являются вышеописанные подходы архитектурной организации с проведением инженерных расчетов по запасу вычислительны возможностей серверов и пропускной способности каналов связи (обычно до двух основных и трех резервных физически гетерогенных каналов от разных провайдеров на один крупный системный кластер).

Следующим способом организации РИС с архитектурой МКВК является иерархически организованная кластеризация. Как и у предыдущей архитектуры она может располагать в составе каждого из кластеров резервными мощностями, однако в остальном имеет принципиальные отличия. Такая архитектура выстроена по пирамидальному принципу. Важнейшим звеном является центральный управляющий кластер, который обычно располагают в максимально стабильных условиях, как с технической, так и с организационно-правовой стороны. Часто на общедоступных схемах указывается, что центральный управляющий кластер выполняет роль звена, взаимодействующего с пользователями, однако на практике это совсем не так. [1] Бизнес не станет рисковать важнейшим, поэтому такой кластер не обременяется пользовательским взаимодействием, а обеспечивает роль командно-распределительного пункта. Взаимодействие с пользователями обеспечивает синхронизируемая "юбка" второстепенных кластеров, которые оснащаются избыточными каналами связи и прочими средствами синхронизации. Собственно, основным отличием распределенного от иерархического способа организации РИС является именно этот центральный элемент (кластер) управления. При прочих равных условиях именно принцип иерархической организации имеет существенные преимущества в случаях экстремальных условий (в том числе DDOS-атак), а также соблюдения политик и прав управления. Главной инженерной задачей является распределение числа политик и прав управления между центральным кластером, а также кластерами подчиненных уровней. На примере организации интернет-сервисов компании YouTube необходимо отметить, что все географически распределенные кластеры имеют строгую иерархическую подчиненность управляющему центру, который практически не влияет на операции по обслуживанию пользователями, хотя и обладает возможностями непосредственного вмешательства. Главным удобством является состояние пограничной самостоятельности и необходимости курирования возникающих нагрузок, подозрительная часть которых снимается средствами защиты каналов связи, перепортированием пакетной коммутации, а также тестированием физических адресов "умными" задачами (капчи, символы и т.п.).

Дополнительно целесообразно выделить новейший способ организации РИС с архитектурой МКВК - скрытый способ организации. Отличительной особенностью работы таких систем является их недоступность для коммутации посредством стандартных протоколов обмена информацией или реализация непубличного пирингового взаимодействия с доверенным кругом пользователей. Такие модели могут реализовываться, в том числе на персональных компьютерах, а потребителями контента, как правило, выступают эпизодически коммутирующие клиенты. В основном скрытая архитектурная организация используется международными террористическими группировками, наркодилерами и иными распространителями противоправного контента. [6] Основной уязвимостью этих "защищенных" способов обмена информации является самораскрываемость источников публикации, а также применение средств трекинга в отношении таких источников (например, сниферов портов подозрительных физических устройств). Достоинством является отсутствие организованных атак и процедур подавления обмена трафиком.

В заключении следует отметить, что указанные системные организации в наименьшей степени подвержены регуляторно-правовым, управленческим и нелегальным видам рисков. К немногим архитектурно-организационным уязвимостям таких систем следует отнести информационную безопасность и доходность от ведения бизнеса.

 

Список литературы:

  1. Архитектура Поиска Яндекса. Лекция для Малого ШАДа.: [Эл. ресурс]. URL: https://habrahabr.ru/company/yandex/blog/204282/ (дата обращения 02.03.2018).
  2. Обзор распределенных систем.: [Эл. ресурс]. URL: http://www.masters.donntu.org/2008/fvti/prihodko/library/dist2.htm (дата обращения 02.03.2018).
  3. Jakobsen J.B., A practical cryptanalysis of the Telegram messaging protocol.: [Эл. ресурс]. URL: https://nourbakhsh.ir/wp-content/uploads/2015/11/jakobsen-master-thesis-telegram.pdf (дата обращения 02.03.2018).
  4. On the scalability of data synchronization protocols for PDAs and mobile devices.: [Эл. ресурс]. URL: http://ieeexplore.ieee.org/document/1020232/ (дата обращения 02.03.2018).
  5. Telegram Messenger LLP, Telegram LLC.: [Эл. ресурс]. URL: https://telegram.org/ (дата обращения 02.03.2018).
  6. The Darknet and the Future of Content Distribution.: [Эл. ресурс]. URL: http://www.bearcave.com/misl/misl_tech/msdrm/darknet.htm (дата обращения 02.03.2018).
  7. Using Cloud Solutions for Translation: Yes or No?: [Эл. ресурс]. URL: https://www.iapti.org/articles/art34-using-cloud-solutions-for-translation-yes-or-no.html (дата обращения 02.03.2018).
Проголосовать за статью
Конференция завершена
Эта статья набрала 0 голосов
Дипломы участников
У данной статьи нет
дипломов

Оставить комментарий

Форма обратной связи о взаимодействии с сайтом
CAPTCHA
Этот вопрос задается для того, чтобы выяснить, являетесь ли Вы человеком или представляете из себя автоматическую спам-рассылку.