Статья опубликована в рамках: Научного журнала «Студенческий» № 38(124)
Рубрика журнала: Информационные технологии
Скачать книгу(-и): скачать журнал часть 1, скачать журнал часть 2, скачать журнал часть 3, скачать журнал часть 4
ВИТРИНА ДАННЫХ
На рынке, где доминируют большие данные и аналитика, витрины данных являются одним из ключевых факторов эффективного преобразования информации в инсайты. Хранилища данных обычно имеют дело с большими наборами данных, но для анализа данных требуется легко найти и легко доступные данные.
Витрина данных (Data Mart) – это предметно-ориентированная база данных, которая часто является секционированным сегментом корпоративного хранилища данных. Подмножество данных, хранящихся в витрине данных, обычно соответствует определенной бизнес-единице, такой как отдел продаж, финансов или маркетинга. Витрины данных ускоряют бизнес-процессы, предоставляя доступ к соответствующей информации в хранилище данных или оперативном хранилище данных в течение нескольких дней, а не месяцев или дольше. Поскольку витрина данных содержит только те данные, которые применимы к определенной области бизнеса, это экономичный способ быстро получить полезную информацию.
Существует три типа витрин данных:
- Зависимые.
- Независимые.
- Гибридные.
Они классифицируются на основе их отношения к хранилищу данных и источникам данных, которые используются для создания системы.
Зависимые витрины данных создается из существующего корпоративного хранилища данных. Это нисходящий подход, который начинается с хранения всех бизнес-данных в одном центральном месте, а затем извлекает четко определенную часть данных, когда это необходимо для анализа.
Чтобы сформировать хранилище данных, определенный набор данных агрегируется (формируется в кластер) из хранилища, реструктурируется, а затем загружается в витрину данных, где его можно запросить. Это может быть логическое представление или физическое подмножество хранилища данных:
- Логическое представление – виртуальная таблица, представление, которое логически, но не физически отделено от хранилища данных.
- Физическое подмножество – извлечение данных, которое представляет собой физически отдельную базу данных от хранилища данных.
- Гранулированные данные – самый низкий уровень данных в целевом наборе – в хранилище данных служат единой точкой отсчета для всех создаваемых зависимых витрин данных.
Независимые витрины данных – это автономная система, созданная без использования хранилища данных, которая фокусируется на одной предметной области или бизнес-функции. Данные извлекаются из внутренних или внешних источников данных (или из обоих), обрабатываются, а затем загружаются в репозиторий витрин данных, где хранятся до тех пор, пока они не понадобятся для бизнес-аналитики.
Независимые витрины данных нетрудно спроектировать и разработать. Они полезны для достижения краткосрочных целей, но могут стать громоздкими в управлении – каждый со своим собственным инструментом ETL и логикой по мере расширения и усложнения бизнес-потребностей.
Гибридные витрины данных объединяют данные из существующего хранилища данных и других операционных систем-источников. Они объединяют скорость и ориентацию на конечного пользователя нисходящего подхода с преимуществами интеграции метода "снизу вверх" на уровне предприятия.
Подобно хранилищу данных, витрина данных может быть организована с использованием звезды, снежинки, хранилища или другой схемы элементов. ИТ-команды обычно используют звездную схему, состоящую из одной или нескольких таблиц фактов (набор метрик, относящихся к определенному бизнес-процессу или событию), ссылающихся на таблицы измерений (первичный ключ, присоединенный к таблице фактов) в реляционной базе данных.
Преимущество звездной схемы заключается в том, что при написании запросов требуется меньше соединений, так как нет зависимости между измерениями. Это упрощает процесс запроса ETL, облегчая аналитикам доступ и навигацию.
Витрины данных обладают следующими преимуществами:
- Управление большими данными и получение ценной бизнес-информации.
- Эффективный доступ. Витрина данных – это экономящее время решение для доступа к определенному набору данных для бизнес-аналитики.
- Недорогая альтернатива хранилищу данных.
- Повышение производительности хранилища данных.
Список литературы:
- Витрина данных — Википедия [Электронный ресурс]. – Режим доступа: https://ru.wikipedia.org/wiki/Витрина_данных (дата обращения 13.11.2020)
- Учебник по Data Mart [Электронный ресурс]. – Режим доступа: https://coderlessons.com/tutorials/bolshie-dannye-i-analitika/teoriia-khraneniia-dannykh/13-uchebnik-po-data-mart (дата обращения 13.11.2020)
- Витрины данных - Информационные системы в экономике [Электронный ресурс]. – Режим доступа: https://studref.com/361520/ekonomika/vitriny_dannyh (дата обращения 14.11.2020)
Оставить комментарий