![]() Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
OLAP – технологии и хранилища данных
В основе концепции OLAP лежит принцип многомерного представления данных. В 1993 г. Е. Ф. Кодд рассмотрел недостатке реляционной модели, в первую очередь указав на невозможность «объединять, просматривать и анализировать данные с точки зрения множественности измерений, т. е. самым понятным для корпоративных аналитиков способом», и определил общие требования к системам OLAP, расширяющим функциональность реляционных СУБД и включающим многомерный анализ как одну из своих характеристик. Аббревиатурой OLAP иногда обозначается не только многомерный взгляд на данные, но и хранение самих данных в многомерной БД. Однако Кодд отмечал, что «...реляционные БД были, есть и будут наиболее подходящей технологией для хранения корпоративных данных. Необходимость существует не в новой технологии БД, а, скорее, в средствах анализа, дополняющих функции существующих СУБД и достаточно гибких, чтобы предусмотреть и автоматизировать разные виды интеллектуального анализа, присущие OLAP». Для выполнения аналитических запросов могут быть использованы приложения, написанные специально для решения тех или иных практических задач. При этом для решения задач аналитической обработки используются данные, характер и организация которых несколько отличается от того, как это принято в системах, ориентированных на оперативную обработку. Использование концепции хранилища данных (ХД) позволяет обеспечить: • своевременное обеспечение аналитиков всей информацией, необходимой для выработки решений; • создание единой модели данных организации; • создание интегрированного источника данных, предоставляющего удобный доступ к разнородной информации из различных подсистем (единый источник). Для хранилищ данных характерны следующие основные свойства: • ориентация на предметную область — хранилище в первую очередь отражает специфику предметной области, а не приложений; • интегрированность — информация, загружаемая в хранилище из баз, ориентированных на частные прикладные задачи, должна быть приведена к единому синтаксическое семантическому виду. Важно также провести проверку И ступающих данных на целостность и непротиворечиво Чтобы при выполнении аналитических запросов избеэк выполнения операций группирования, данные должны обобщаться (агрегироваться) при загрузке хранилища; • неизменяемость данных — хранилищам свойственна ретп спективность: объем накопленных данных должен бьт достаточным для решения аналитических задач с требур мым качеством. Поэтому важное отличие аналитических систем от систем операционной обработки состоит в том что данные после загрузки в них остаются неизменными внесение каких-либо изменений, кроме добавления записей, не предполагается; • поддержка хронологии — для выполнения большинства аналитических запросов необходим анализ тенденций развития явлений или характера изменения значений переменных во времени, что обычно достигается введением атрибутов типа дата/время; • многомерное концептуальное представление (multi-dimensional conceptual view) — множественная перспектива, состоящая из нескольких независимых измерений, вдоль которых могут быть проанализированы определенные совокупности данных. Одновременный анализ по нескольким измерениям определяется как многомерный анализ. Каждое измерение включает направления консолидации данных, состоящие из серии последовательных уровней обобщения, где каждый вышестоящий уровень соответствует большей степени агрегации данных по соответствующему измерению. Так, измерение Исполнитель может определиться направлением консолидации, состоящим из уровней обобщения предприятие—подразделение—отдел—служащий. Измерение Время может даже включать два направления консолидации — год—квартал—месяц—день и неделя—день, поскольку счет времени по месяцам и по неделям несовместим. В этом случае становится возможны произвольный выбор желаемого уровня детализации и формации по каждому из измерений. Операция спуска (drilling down) соответствует движению от высших ступен консолидации к низшим; напротив, операция подъема (rolling up) означает движение от низших уровней к высшим (рис 5.18). Кода определил 12 свойств, которыми должны обладать системы этого класса (табл. 5.6).
|