Студопедия

Главная страница Случайная страница

КАТЕГОРИИ:

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Модели хранилищ данных и основные компоненты хранилищ данных.






Модели хранилищ данных:

- схема «звезда». Такая схема состоит из двух типов таблиц: одной таблицы фактов – центр «звезды» и нескольких таблиц измерений по числу измерений в модели данных – лучи «звезды». Таблица фактов является основной таблицей хранилищ данных и содержит сведения об объектах или событиях, совокупность которых будет в дальнейшем анализироваться, а также содержит уникальный составной ключ, объединяющий первичные ключи таблиц измерений.

Четыре наиболее часто встречающиеся типа фактов:

1. факты, связанные с транзакциями – основаны на отдельных событиях (типичными примерами которых являются телефонный звонок или снятие денег со счета с помощью банкомата).

2. факты, связанные с «моментальными снимками», - основаны на состоянии объекта (например, банковского счета) в определенные моменты времени, например, на конец дня или месяца. Типичными примерами таких фактов являются объем продаж за день или дневная выручка.

3. факты, связанные с элементами документа, - основаны на том или ином документе (например, счете за товар или услуги) и содержат подробную информацию об элементах этого документа (например, количестве, цене, проценте скидки).

4. факты, связанные с событиями или состоянием объекта, - представляют возникновение события без подробностей о нем (например, просто факт продажи или факт отсутствия таковой без иных подробностей).

Пример «звезды».

- схема «снежинка». Данная схема получила свое название за форму отображения логической схемы таблиц в многомерной БД. Так же как и в схеме «звезда», схема «снежинка» представлена централизованной таблицей фактов, связанной с таблицами измерений. Отличием является то, что в ней таблицы измерений нормализованы с рядом других связанных измерительных таблиц, в то время как в схеме «звезда» таблицы измерений полностью денормализованы с каждым измерением. Чем больше степень нормализации таблиц измерений, тем сложнее выглядит структура схемы «снежинка». Создаваемый «эффект снежинки» затрагивает только таблицы измерений и не применим к таблицам фактов. Схема «снежинка», так же как и схема «звезда», наиболее часто встречается в таких ХД, для которых скорость получения данных более важна, чем эффективность их манипуляции.



Схема «снежинка» более подходит для среды с множеством запросов сложной структуры».

Пример «снежинки».

- ER-диаграмма.

Основные компоненты хранилищ данных:

-оперативные источники данных;

-средства переноса и трансформации данных;

-метаданные;

-реляционное хранилище;

-OLAP-хранилище и OLAP-клиенты;

-средства доступа и анализа данных.

Назначение перечисленных компонентов таково. Оперативные данные собираются из различных источников. Поступившие оперативные данных очищаются, интегрируются и складываются в реляционные хранилища. Они уже доступны для анализа при помощи средств построения отчетов. Затем дынные (полностью или частично) подготавливаются с использованием средств переноса и трансформации данных для OLAP-анализа. При этом они могут быть загружены в специальную базу данных OLAP или оставаться в реляционном хранилище.

Важнейшим элементов хранилища являются метаданные, т.е. данные о структуре, размещении, трансформации данных, которые используются любыми процессами хранилища. Метаданные могут быть востребованы для различных целей, например, извлечения и загрузки данных, обслуживании хранилища и запросов. Метаданные для различных процессов могут иметь различную структуру, т.е. для одного и того же элемента данных может существовать несколько вариантов метаданных.

Таким образом, хранилища данных являются структурированными. Они содержат базовые данные, которые образуют единый источник для обработки данных во всех системах поддержки принятия решений. Элементарные данные, присутствующие в хранилищах, могут быть представлены в различной форме. Хранилища данных исключительно велики, поскольку в них содержатся интегрированные и детализированные данные.

 

31. Технология OLAP, OLAP-куб – основные понятия.



OLAP (Online Analytical Processing) – технология оперативной аналитической обработки данных, использующая методы и средства для сбора, хранения и анализа многомерных данных в целях поддержки процессов принятия решений.

Основное назначение OLAP-систем – поддержка аналитической деятельности, произвольных запросов пользователей – аналитиков.

Цель OLAP-анализа – проверка возникающих гипотез.

Возможность анализа зависимостей между различными параметрами предполагает возможность представления данных в виде многомерной модели – гиперкуба, или OLAP-куба.

Осями многомерной системы координат служат основные атрибуты анализируемого бизнес-процесса. На пересечениях осей изменений (Dimensions) находятся данных, количество характеризующие процесс меры (Measures).

Факт – это числовая величина, которая располагается в ячейках гиперкуба.

Измерение (dimension)- это множество объектов одного или нескольких типов, организованных в виде иерархической структуры и обеспечивающих информационный контекст числового показателя. Объекты, совокупность которых и образует измерение, называются членами измерений (members).

Ячейка (cell) – атомарная структура куба, соответствующая полному набору конкретных значений измерений.

Иерархия – группировка объектов одного измерения в объекты более высокого уровня. Например, день-месяц-год. Иерархии в измерениях необходимы для возможности агрегации и детализации значений показателей согласно их иерархической структуре.

Базовые операции, выполняемые над OLAP-кубом:

-срез (slice-and-dice) – формируется подмножество многомерного массива данных, соответствующее единственному значению одного или нескольких элементов измерений, не входящих в это подмножество.

-вращение – изменение расположения измерений, представленных в отчете или на отображаемой странице. Например, операция вращения может заключаться в перестановке местами строк или столбцов таблицы. Кроме того, вращением куба данных является перемещение внетабличных измерений на место измерений, представленных на отображаемой странице, и наоборот.

-консолидация (roll-up/drill up) и детализация (drill-down) – операции, которые определяют переход вверх по направлению от детального представления данных к агрегированному и наоборот, соответственно.

 



mylektsii.su - Мои Лекции - 2015-2022 год. (0.014 сек.)Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав Пожаловаться на материал