Телефон: +7 (383)-202-16-86

Статья опубликована в рамках: XXII Международной научно-практической конференции «Технические науки - от теории к практике» (Россия, г. Новосибирск, 11 июня 2013 г.)

Наука: Технические науки

Секция: Информатика, вычислительная техника и управление

Скачать книгу(-и): Сборник статей конференции

Библиографическое описание:
Григорович А.Г. АРХИТЕКТУРА ХРАНИЛИЩ ДАННЫХ С НЕНОРМАЛИЗОВАННЫМИ ОТНОШЕНИЯМИ // Технические науки - от теории к практике: сб. ст. по матер. XXII междунар. науч.-практ. конф. – Новосибирск: СибАК, 2013.
Проголосовать за статью
Дипломы участников
У данной статьи нет
дипломов
Статья опубликована в рамках:
 
Выходные данные сборника:

 

АРХИТЕКТУРА ХРАНИЛИЩ ДАННЫХ С НЕНОРМАЛИЗОВАННЫМИ ОТНОШЕНИЯМИ

 

Григорович Андрей Геннадиевич

старший преподаватель Дрогобычского государственного педагогического университета им.И. Франко, г. Дрогобыч, Украина

E-mail:

 

THE ARCHITECTURE OF DATA WAREHOUSE WITH UNNORMALIZED RELATIONS

Grygorovych Andrey

senior lecturer of Drohobych State Pedagogical University named after Ivan Franko, Drohobych, Ukraine

 

АННОТАЦИЯ

Построена трехуровневая архитектура хранилища данных с ненормализованными отношениями. Предложен метод представления ненормализованных отношений гиперкубом данных. Предложенная архитектура использована при реализации хранилища данных «Поликлиника» + «Участковый терапевт».

ABSTRACT

There is built the three-level architecture data warehouse with unnormalized relations. We propose a method of presenting unnormalized relations by hypercube data. There is proposed the architecture used in the realization of data warehouse "clinic" + " district therapist".

 

Ключевые слова: ненормализованные отношения; вложенные отношения; хранилище данных; архитектура; гиперкуб данных.

Keywords: unnormalized relations; nested relations; data warehouse architecture; data hypercube.

 

В связи с массовым внедрением ИТ-средств во все сферы деятельности человечества, проблема автоматизации и оптимизации процессов обработки разнотипных данных, которые хранятся в разных системах с разными методами доступа, относится к наиболее актуальным проблемам. Этим вопросам посвящено множество как теоретических, так и прикладных исследований. Но до этого времени не решенным остается значительное количество задач, посвященных исследованию методов и средств представления, хранения и поиска объектов с учетом их структуры, связей и составных частей. В частности, проблема представления сложных объектов в хранилищах данных (ХД) с ненормализованными отношениями (ННО).

Понятие ННО впервые было введено в [4]. В [5] дано интуитивное определение ННО: «везде, где разрешены атомарные значения, разрешены также отношения, то есть допускаются отношения в составе отношений». Разработкой архитектуры ХД занимались W. Inmon, R. Kimball, С. Асадуллаев [2, 3, 1]. Статья посвящена решению задачи построения архитектуры ХД с ННО.

При построении ХД на основе ННО используем трехуровневую архитектуру (рис. 1).

 

Рисунок 1. Архитектура ХД с ННО

 

На первом уровне находятся источники данных и справочные системы. Второй уровень включает хранилище оперативных данных и хранилище агрегированных данных. Хранилище оперативных данных выполняет две основные функции: 1 — оно содержит данные из источников данных первого уровня, которые после соответствующей обработки загружают в хранилище агрегированных данных, 2 — является источником оперативной информации для витрин данных (ВД), которые решают задачи оперативного управления. Хранилище агрегированных данных содержит агрегированные данные, которые вычисляют на основе данных хранилища оперативных данных. На третьем уровне — предметно-ориентированные ВД. В зависимости от специфики задач, которые решают с помощью ВД, для одних ВД источником информации является хранилище агрегированных данных, для других — хранилище оперативных данных. Данные в ХД представляют гиперкубом данных, который содержит ННО, что решает задачу представления в ХД сложных объектов.

Разработанная архитектура реализована в ХД «Поликлиника» + «Участковый терапевт» (рис. 2).

 

Рисунок 2. Архитектура ХД «Поликлиника» + «Участковый терапевт»

 

Архитектура ХД «Поликлиника» + «Участковый терапевт» является трехуровневой. На первом уровне размещены источники данных (клинико-диагностические лаборатории, регистратура, манипуляционные кабинеты и т. д.). На втором уровне — хранилище оперативных данных (с оперативными и историческими детализированными данными) и хранилище агрегированных данных. На третьем уровне поместим ВД — предметно-ориентированные срезы ХД. ВД «Участковый терапевт» построим как срезы по номеру участка хранилища оперативных данных. ВД, предназначенные для анализа и отчетности, построим как срезы хранилища агрегированных данных.

Разделим ХД «Поликлиника» + «Участковый терапевт» на две функциональные части: стационарную и мобильную. Такое разделение вызвано спецификой деятельности участкового терапевта, так как прием пациентов врач осуществляет в поликлинике и на вызовах по месту жительства пациентов. Итак, в мобильную часть ХД включим ВД «Участковый терапевт». ВД «Участковый терапевт» оперирует данными о пациентах конкретного участка, полученными от хранилища оперативных данных. К стационарной части ХД — «Поликлиника» — отнесем источники данных, хранилище оперативных данных, хранилище агрегированных данных и ВД, образующих подсистему отчетности и анализа данных. Хранилище оперативных данных оперирует данными о пациентах. Хранилище оперативных данных используем как промежуточную область хранения данных из источников информации и ВД «Участковый терапевт». После соответствующей обработки данные из хранилища оперативных данных заносим в хранилище агрегированных данных. Модель данных для хранилища строим на основе требований к решению задач по формированию отчетов и анализа данных.

Построенная архитектура требует решения задач представления ненормализованных отношений в гиперкубах данных. С этой целью предлагаем метод представления ненормализованного отношения гиперкубом данных, в котором измерениями гиперкуба данных являются атомарные атрибуты как ненормализованного, так и вложенных отношений.

Метод 1. Для ненормализованного отношения R(x1, …, xn, S(y1, …, yk)) с вложенным отношением S(y1, …, yk) гиперкуб данных имеет n+k-1 или n+k измерений. Если мерой гиперкуба есть один из атрибутов вложенного отношения S(y1, …, yk) и его значения будут в ячейках гиперкуба, то гиперкуб имеет n+k–1 измерений V = { x1, …, xn , y1, …, yk-1 }, мера а = yk .

Если мерой гиперкуба есть количественная характеристика, которой нет в начальном ненормализованном отношении R(x1, …, xn, S(y1, …, yk)), то она вычисляется при формировании гиперкуба, гиперкуб имеет n+k измерений V = { x1, …, xn , y1, …, yk} и меру а = Φ(R(x1, …, xn, S(y1, …, yk))), где Φ(R(x1, …, xn, S(y1, …, yk))) — функция агрегации.

Построенная трехуровневая архитектура ХД позволяет упростить доступ к оперативным и агрегированным данным путем создания витрин данных на основе хранилища оперативных данных и хранилища агрегированных данных, расширяет функциональность и повышает эффективность эксплуатации ХД.

 

Список литературы:

1.Асадуллаев С. Архитектуры хранилищ данных — 1. — 2009. [Электронный ресурс] — Режим доступа. — URL: http://www.ibm.com/developerworks /ru/library/sabir/axd_1/ (дата обращения 10.05.2013).

2.Inmon W.H. Building the Data Warehouse, 4th Edition. — Hoboken, NJ:Wiley, 2005. — 576 p.

3.Kimball R., Ross M. The Data Warehouse Toolkit: The Complete Guide to Dimensional Modeling, second edition. — Wiley, 2002. — 421 с.

4.Makinouchi A. A consideration on normal form of not-necessarily-normalized relation in the relational data model. //Proceedings of the third international conference on Very large data bases — Volume 3. — Tokyo, 1977. — P. 447—453.

5.Silberschatz A. Database System Concepts: 5th Edition /A. Silberschatz, Henry F. Korth, S.  Sudarshan. — McGraw-Hill, August 9, 2005. [Электронный ресурс] — Режим доступа. — URL: http://codex.cs.yale.edu/avi/db-book/db5/slide-dir/ch9.ppt (дата обращения 10.05.2013).

Проголосовать за статью
Дипломы участников
У данной статьи нет
дипломов

Оставить комментарий

Уважаемые коллеги, издательство СибАК с 30 марта по 5 апреля работает в обычном режиме