Главная страница
Случайная страница
КАТЕГОРИИ:
АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
Классификационные признаки систем аналитических исследований
Основание для классификации
| Классификационные признаки
| Способ хранения данных
| Многомерные OLAP-продукты (MOLAP – Multidimensional OLAP). Исходные и многомерные данные хранятся в многомерной БД или в многомерном локальном кубе. Это обеспечивает высокую скорость выполнения OLAP-операций. Но многомерная база в этом случае чаще всего будет избыточной. Куб, построенный на ее основе, будет во многом зависеть от числа измерений. При увеличении количества измерений объем куба будет экспоненциально расти. Это может привести к росту объема данных, замедляющему скорость выделения запросов пользователей.
Реляционные OLAP (ROLAP – Relational OLAP). Исходные данные хранятся в реляционных БД или в плоских локальных таблицах на файл-сервере. Агрегатные данные могут помещаться в служебные таблицы в той же БД. Преобразование данных из реляционной БД в многомерные кубы происходит по запросу OLAP-средства. При этом скорость построения куба будет находиться в зависимости от типа источника данных и приводить к увеличению времени отклика системы.
Гибридные OLAP (HOLAP – Hybrid ОLАР). Исходные данные остаются в реляционной базе, а агрегаты размещаются в многомерной. Построение OLAP-куба выполняется по запросу OLAP-средства на основе реляционных и многомерных данных. Это позволяет избежать взрывного роста данных и обеспечить минимизацию времени выполнения клиентских запросов.
| Место размещения OLAP- машины
| OLAP–серверы. Вычисления и хранение агрегатных данных выполняются сервером. Клиентское приложение получает результаты запросов к многомерным кубам, хранящимся на сервере. Некоторые OLAP-серверы поддерживают три способа хранения данных: MOLАР, ROLAP и HOLAP. Часто применяется OLAP-сервер корпорации Microsoft.
OLAP-клиенты. Построение многомерного куба и OLAP-вычисления выполняются в памяти клиентского компьютера. OLAP-клиенты также поддерживают три способа хранения ROLAP, MOLAP и HOLAP.
| Степень готовности к применению
| OLAP-компоненты. С их помощью разрабатываются клиентские OLAP-программы, они бывают двух типов: МOLAP-компонентами (служат инструментами генерации запросов к OLAP-серверу и обеспечивают визуализацию полученных данных) и ROLAp компонентами (содержат собственную OLAP-машину, которая о6еспечивает построение OLAP-кубов в оперативной памяти и отображает их на экране).
| Степень
готовности к применению
| Инструментальные OLAP-системы. Они предназначены для создания аналитических приложений и бывают системами для программирования (средой разработчика аналитических систем) и системами для быстрой настройки (визуальный интерфейс для создания OLAP-приложений без программирования).
Конечные OLAP-приложения. Это готовые прикладные решения для конечного пользователя, требующие только установки и настройки для анализа данных в различных отраслях и для решения различных аналитических задач.
| Инструменты добычи
данных
| Методы добычи данных (Data Mining) являются составной частью процесса поиска полезных знаний в разрозненных данных (KDD – Knowledge Discovery in Databases). KDD состоит из подготовки данных, выбора информативных признаков, очистки данных, применения методов Data Mining, обработки и интерпретации полученных результатов. Первый элемент добычи данных – фильтрация. Необходимость в фильтрации возникает, когда нужно отделить полезную информацию от искажающего ее шума за счет сглаживания, очистки, редактирования аномальных значений, устранения незначащих факторов, понижения размерности информации. Применение фильтрации в системах анализа данных относится к первичной обработке данных и позволяет повысить качество исходных данных и точность результатов анализа.
Дерево решений. Оно позволяет представлять правила в иерархической структуре, где каждому объекту соответствует единственный узел, дающий решение. Это может быть логическая конструкция «если то…». Элемент применяется при решении задач поиска оптимальных решений на основе описанной модели поведения.
Ассоциативные правила. Ассоциативные правила позволяют находить закономерности между связанными событиями. Например, если произошло событие А, то произойдет и событие В с вероятностью С. Впервые эта задача была предложена для нахождения типичных шаблонов покупок, совершаемых в супермаркетах, поэтому иногда ее еще называют анализом рыночной корзины (market basket analysis).
| Инструмент добычи данных
| Генетические алгоритмы. Генетические алгоритмы применяются при решении задач оптимизации. Они нужны для решения различных задач, в которых можно составить описание возможных вариантов решения в виде вектора параметров, и известен критерий, определяющий эффективность каждого варианта. Генетические алгоритмы применяются, например, для составления портфелей ценных бумаг, расписаний, выбора маршрутов движения, конфигурации оборудования заполнения контейнеров при перевозке грузов.
Нейронные сети. Нейронные сети реализуют алгоритмы обратного распространения ошибки, самоорганизующихся карт Кохонена, RBF-сетей, сетей Хэмминга и других алгоритмов анализа данных. Нейронные сети применяются для восстановления пропусков в данных, прогнозирования и поиска закономерностей.
| Средства построения хранилищ и витрин данных
| Средства проектирования хранилищ данных. Они входят в состав реляционных и многомерных СУБД Microsoft, Oracle, IBM и Sybase. После описания структур хранения данных специальными системными утилитами выполняется их генерация, что позволяет быстро построить индивидуальное хранилище или витрину.
Средства извлечения, преобразования и загрузки данных (ETL - extraction, transformation, loading). Они обеспечивают процессы при переносе данных из одного приложения или системы в другие. Примером ETL-системы может служить Ascential DataStage компании Ascential Software.
Готовые предметно-ориентированные хранилища данных. В них уже имеются механизмы построения хранилищ и витрин данных: процедуры извлечения, преобразования, очистки и загрузки данных, функции генерации баз данных и процедур обработки, механизмы построения выборок данных, интерфейсы просмотра и анализа данных. Однако если они ориентированы на одну область применения, их нельзя использовать в другой.
| Инструменты конечного пользователя для выполнения запросов и построения отчетов
| Инструменты выполнения запросов и построения отчетов (Query & Reporting) предназначены для формирования запросов к информационным системам в пользовательских терминах, их исполнения, просмотра полноценных отчетов. Эти системы могут быть встроены в состав OLAP-систем.
Инструменты в виде специализированных систем Query & Reporting, когда пользователь составляет запрос к источнику данных, используя заранее подготовленный программистом каталог терминов, получая таблицы, графики, диаграммы на экран или в виде распечатки.
|
Данная страница нарушает авторские права?
|