Классификация OLAP-систем. Основные требования к OLAP-системам

Классификация продуктов реализующих OLAP базируется на классификации модели данных СУБД, используемых этим продуктом.

1. Многомерная OLAP (MOLAP)

Работают только со своими собственными многомерными БД. Основываются на патентованных технологиях для МСУБД и являются наиболее дорогими.

Эти системы включают в себя интегрированный клиентский интерфейс, либо используют для связи с пользователем внешние программы работы с электронными таблицами. Для обслуживания таких систем как правило требуется специальный штат сотрудников, занимающихся установкой, сопровождением и формированием представлений данных для конечных пользователей.

Примеры: ESSBase (Arbor Software), Oracle Express, SAS System (SAS Institute) 

SAS System (наиболее мощная и дорогая) состоит из множества подсистем-модулей, которые позволяют проектировать готовые решения, расширенное администрирование ИС дополнительные функции OLAP и ИАД.
Благодаря такому подходу достигается компромисс между гибкостью настройки и простотой использования. Разработкой СППР занимается администратор на этапе проектирования, а аналитики работают с адаптированной для них системой.

2. Реляционная OLAP (ROLAP)

Возникли после программной статьи Кодда 1993 года. Осуществляют представление данных хранимых в классической реляционной базе в многомерной форме.
Примеры: DSS/Server, DSS/Agent (Micro Strategy); MetaCube (Informix); Decision Cube (Information Advantage).
ROLAP системы хорошо приспособлены для работы с крупными хранилищами.
3. Гибридные OLAP (HOLAP)
Разрабатывались с целью совмещения достоинств и минимизации недостатков присущих предыдущим классам.
Детализированная информация хранится в РБД, а предвычисленные агрегированные значения в МБД.
4. Инструменты генерации запросов и отчетов для настольных ПК дополненные реализациями фуекций OLAP или интегрированные с внешними средствами выполняющими такие функции
Эти системы осуществляют выборку данных из источников, преобразуют их и помещают в динамическую многомерную БД, функционирующую на клиентской станции конечного пользователя. Для работы с небольшими просто организованными базами эти средства подходят наилучшим образом.
Примеры: Business Objects (Business Objects), Brio Query (Brio Technology), Power Play (Cognes).

olap система

OLAP-система. Принципы работы системы анализа данных

Источник: http://kaidev.ru/Pages/Article.aspx?p=OlapSystem

Основные требования к OLLAP-системам

Для определения OLAP обычно используют набор свойств OLAP систем или требований к ним. Краткая формулировка требований к OLAP заключена в так называемом тесте FASMI (1995) - Fast Analisys of Shared Multidimentional Information.
1) Fast (быстрый)
Быстрой можно считать систему среднее время выдачи результатов обработки которой составляет порядка 5 с. Указываются также следующие показатели: время обработки наиболее простых запросов 1 с, наиболее сложных 20 с. Исследование реакции пользователей показывает, что неудачным считается время обработки запроса более 30 с. ИС, удовлетворяющая указанным требованиям производительности, однозначно будет воспринята пользователями лучше чем не удовлетворяющая даже более многофункциональная.
2) Analysis (анализ)
Система может справляться с любым логическим и статическим анализом, характерным для данной предметной области. Этим определением одновременно ограничивается какой-то класс необходимых задач анализа и расширяются возможности системы до размеров этого класса.
3) Shared (разделяемая)
ИС осуществляет все требования конфиденциальности и разделения доступа возможно до уровня ячейки.
4) Multidimensional (многомерный)
Система должна обеспечивать многомерное, концептуальное разделение данных включая полную поддержку для иерархий и множественных иерархий.
5) Information (информация)
По отношению к обрабатываемой в OLAP системе информации выделяют следующие специфические аспекты:
· Дублирование данных;
· Требуемая оперативная память;
· Требуемое дисковое пространство;
· Эксплуатационные показатели (например, временные);
· Возможности интеграции с различными источниками данных и информационными фондами.
Более подробно требования к OLAP системам были сформулированы Е. Ф. Коддом (1993). Первоначальные 12 правил были подвергнуты критике и критикуются до сих пор, поэтому в 95 г они были доработаны, дополнили еще 6 правил и разбили их на группы.
1. В - основные особенности
1.1 Многомерное концептуальное представление данных
Концептуальное представление модели данных должно способствовать выполнению аналитиком интуитивных операций с многомерными данными.
1.2 Интуитивное манипулирование данными
Манипуляции должны выполняться в интуитивно-понятном пользовательском интерфейсе.
1.3 Доступность
Инструментарий OLAP должен накладывать свою логическую схему на физические массивы данных и представлять их независимо от их организации.
1.4 Пакетное извлечение против интерпретации
Продукт в равной степени эффективно должен обеспечивать доступ как к собственным хранимым данным так и к внешним данным.
1.5 Модели анализа OLAP
OLAP продукт должен поддерживать все 4 основные модели анализа (категориальный анализ - формирование параметрически настраиваемых отчетов, толковательный анализ - формирование разрезов, агрегации и вращения, умозрительный - анализ в стиле «что если?», стереотипный - поиск целей, шаблонов, образов).
1.6 Архитектура клиент-сервер
Серверный компонент инструмента OLAP должен быть достаточно интеллектуальным и обладать способностью строить общую, концептуальную схему на основе обобщения и консолидации различных логических и физических схем БД для обеспечения эффекта прозрачности. Это достаточно жесткое требование, оно сильно занижает требования к функциональности клиентской части. На практике выполняется редко.
1.7 Прозрачность
Пользователь не должен знать о том какие конкретные средства используются для хранения и обработки данных, как данные организованы, т.е. независимо от источника данных пользователь должен видеть данные в формате электронной таблицы (например). Это означает, что продукт должен иметь и полнофункциональные электронные таблицы, и интерфейсы с гетерогенным источником данных. Большинство продуктов обе эти возможности сразу не поддерживают.
1.8 Поддержка многопользовательского режима
Несколько аналитиков должны иметь возможность одновременно работать с одной аналитической моделью или создавать различные модели на основе одних данных.
2. S - специальные особенности
2.1 Обработка ненормализованных данных
Должна иметься возможность интеграции между OLAP машиной и денормализованным источником данных. Модификации данных выполненные в среде OLAP не должны приводить к изменениям данных хранимых в исходных внешних системах. Требования конкретной ИС могут препятствовать выполнению этого требования. 
2.2 Сохранение результатов OLAP
Данные модифицированные в OLAP должны сохраняться отдельно от данных транзакции. Модификация данных в OLAP вступает в противоречия со свойством неизменности ХД. Данное правило направлено на преодоление этого противоречия.
2.3 Исключение отсутствующих значений
Все отсутствующие значения отбрасываются при хранении, т.е. отсутствующие значения должны отличаться от нулевых значений. Это важно только с точки зрения компактности хранения данных. Многие OLAP инструменты игнорируют это правило без больших потерь функциональности.
2.4 Обработка отсутствующих значений
Все отсутствующие значения игнорируются при обработке.
3. R - особенности представления отчета
3.1 Гибкость формирования отчетов
Должны поддерживаться различные способы визуализации данных в любой возможной ориентации измерений, т.е. должна иметься возможность размещения измерений в отчете так как это нужно пользователю.
3.2 Устойчивая производительность
С увеличением числа измерений и размеров БД аналитик не должен столкнуться с каким-либо уменьшением производительности. Увеличение числа измерений или размеров БД существенно не влияет на производительность в случаях БД с полными предварительными вычислениями.
3.3 Автоматическая настройка физического уровня (динамическая обработка разреженных данных)
Скорость доступа должна быть постоянной вне зависимости от расположения ячеек данных, моделей, числа измерений и т.д.
4. D - управление измерениями
4.1 Универсальность (равноправие) измерений
Все измерения данных должны быть равноправными. Дополнительные характеристики могут быть предоставлены любому измерению. Базовые структуры данных, формул и форматов отчетов не должны опираться на какое-то одно измерение.
Замечание 1: Опытом доказано, что это наиболее спорное правило, т.к. в абсолютном большинстве ситуаций измерение «время» специфично и не эквивалентно основным.
Замечание 2: Это правило следует рассматривать для универсального инструмента, но с более низким приоритетом и можно игнорировать для специфических приложений.
4.2 Неограниченное число измерений и уровней агрегации
Должны поддерживаться 15-20 измерений. Каждое из этих измерений должно допускать практически неограниченное количество определенных пользователем уровней агрегирования по любому направлению консолидации. Однако, большинство реальных приложений не требует более 8-10 измерений.
4.3 Неограниченность операций между размерностями 
Все виды операций должны быть дозволены для любых измерений и задаваться на функционально понятном языке.

 

Источник: http://isufavt.narod.ru/lekc/aso_3/page_47.html

Категории: 

Метки: