Телефон: 8-800-350-22-65
WhatsApp: 8-800-350-22-65
Telegram: sibac
Прием заявок круглосуточно
График работы офиса: с 9.00 до 18.00 Нск (5.00 - 14.00 Мск)

Статья опубликована в рамках: Научного журнала «Студенческий» № 38(124)

Рубрика журнала: Информационные технологии

Скачать книгу(-и): скачать журнал часть 1, скачать журнал часть 2, скачать журнал часть 3, скачать журнал часть 4

Библиографическое описание:
Юдаева М.В., Дроздова В.В. ВИТРИНА ДАННЫХ // Студенческий: электрон. научн. журн. 2020. № 38(124). URL: https://sibac.info/journal/student/124/193276 (дата обращения: 26.04.2024).

ВИТРИНА ДАННЫХ

Юдаева Маргарита Вячеславовна

студент, кафедра «Защита информации», Институт комплексной безопасности и специального приборостроения, Российский Технологический Университет,

РФ, г. Москва

Дроздова Владлена Владимировна

студент, кафедра «Защита информации», Институт комплексной безопасности и специального приборостроения, Российский Технологический Университет,

РФ, г. Москва

На рынке, где доминируют большие данные и аналитика, витрины данных являются одним из ключевых факторов эффективного преобразования информации в инсайты. Хранилища данных обычно имеют дело с большими наборами данных, но для анализа данных требуется легко найти и легко доступные данные.

Витрина данных (Data Mart) – это предметно-ориентированная база данных, которая часто является секционированным сегментом корпоративного хранилища данных. Подмножество данных, хранящихся в витрине данных, обычно соответствует определенной бизнес-единице, такой как отдел продаж, финансов или маркетинга. Витрины данных ускоряют бизнес-процессы, предоставляя доступ к соответствующей информации в хранилище данных или оперативном хранилище данных в течение нескольких дней, а не месяцев или дольше. Поскольку витрина данных содержит только те данные, которые применимы к определенной области бизнеса, это экономичный способ быстро получить полезную информацию.

Существует три типа витрин данных:

  • Зависимые.
  • Независимые.
  • Гибридные.

Они классифицируются на основе их отношения к хранилищу данных и источникам данных, которые используются для создания системы.

Зависимые витрины данных создается из существующего корпоративного хранилища данных. Это нисходящий подход, который начинается с хранения всех бизнес-данных в одном центральном месте, а затем извлекает четко определенную часть данных, когда это необходимо для анализа.

Чтобы сформировать хранилище данных, определенный набор данных агрегируется (формируется в кластер) из хранилища, реструктурируется, а затем загружается в витрину данных, где его можно запросить. Это может быть логическое представление или физическое подмножество хранилища данных:

  • Логическое представление – виртуальная таблица, представление, которое логически, но не физически отделено от хранилища данных.
  • Физическое подмножество – извлечение данных, которое представляет собой физически отдельную базу данных от хранилища данных.
  • Гранулированные данные – самый низкий уровень данных в целевом наборе – в хранилище данных служат единой точкой отсчета для всех создаваемых зависимых витрин данных.

Независимые витрины данных – это автономная система, созданная без использования хранилища данных, которая фокусируется на одной предметной области или бизнес-функции. Данные извлекаются из внутренних или внешних источников данных (или из обоих), обрабатываются, а затем загружаются в репозиторий витрин данных, где хранятся до тех пор, пока они не понадобятся для бизнес-аналитики.

Независимые витрины данных нетрудно спроектировать и разработать. Они полезны для достижения краткосрочных целей, но могут стать громоздкими в управлении – каждый со своим собственным инструментом ETL и логикой по мере расширения и усложнения бизнес-потребностей.

Гибридные витрины данных объединяют данные из существующего хранилища данных и других операционных систем-источников. Они объединяют скорость и ориентацию на конечного пользователя нисходящего подхода с преимуществами интеграции метода "снизу вверх" на уровне предприятия.

Подобно хранилищу данных, витрина данных может быть организована с использованием звезды, снежинки, хранилища или другой схемы элементов. ИТ-команды обычно используют звездную схему, состоящую из одной или нескольких таблиц фактов (набор метрик, относящихся к определенному бизнес-процессу или событию), ссылающихся на таблицы измерений (первичный ключ, присоединенный к таблице фактов) в реляционной базе данных.

Преимущество звездной схемы заключается в том, что при написании запросов требуется меньше соединений, так как нет зависимости между измерениями. Это упрощает процесс запроса ETL, облегчая аналитикам доступ и навигацию.

Витрины данных обладают следующими преимуществами:

  • Управление большими данными и получение ценной бизнес-информации.
  • Эффективный доступ. Витрина данных – это экономящее время решение для доступа к определенному набору данных для бизнес-аналитики.
  • Недорогая альтернатива хранилищу данных.
  • Повышение производительности хранилища данных.

 

Список литературы:

  1. Витрина данных — Википедия [Электронный ресурс]. – Режим доступа: https://ru.wikipedia.org/wiki/Витрина_данных (дата обращения 13.11.2020)
  2. Учебник по Data Mart [Электронный ресурс]. – Режим доступа: https://coderlessons.com/tutorials/bolshie-dannye-i-analitika/teoriia-khraneniia-dannykh/13-uchebnik-po-data-mart (дата обращения 13.11.2020)
  3. Витрины данных - Информационные системы в экономике [Электронный ресурс]. – Режим доступа: https://studref.com/361520/ekonomika/vitriny_dannyh (дата обращения 14.11.2020)

Оставить комментарий

Форма обратной связи о взаимодействии с сайтом
CAPTCHA
Этот вопрос задается для того, чтобы выяснить, являетесь ли Вы человеком или представляете из себя автоматическую спам-рассылку.