4.3.1. Основные понятия
Основные концепции СППР:
Хранилища данных (Data Warehouse).
Оперативная аналитическая обработка данных (On-Line Analytical Processing, OLAP).
Интеллектуальный анализ данных – ИАД (извлечение знаний – Data Mining).
Основные задачи СППР
Основные задачи СППР классифицируются в соответствии с обрабатываемыми данными (таблица 6).
СППР используется при решении задач:
определение и анализ тенденций (сфера закономерностей);
описание ключевых соотношений и слежение за ними (сфера агрегированных показателей);
детализирующий анализ (drill down analysis);
анализ альтернатив ("what if" analysis) (сфера закономерностей);
мониторинг задач (problem monitoring) (сфера агрегированных показателей).
Основные категории СППР
Для определенности классифицируем СППР по критерию режима анализа данных:
1)Статические.
2)Динамические.
Таблица 6 – Классификация сфер обрабатываемых данных и задач СППР | |||
Данные |
Задачи |
Средство |
Класс реализации |
Сфера детализированных данных. |
Поиск информации. |
Реляционные СУБД (РСУБД), SQL. |
Информационно-поисковые системы, обеспечивающие интерфейс конечного пользователя и используемые в качестве надстроек над СОД или над ХД. |
Сфера агрегированных показателей. |
Комплексная визуализация собранной в ХД информации, ее обобщение и агрегация, гиперкубическое представление и многомерный анализ. |
Многомерные СУБД (МСУБД), РСУБД. |
OLAP. |
Сфера закономерностей. |
Поиск функциональных и логических закономерностей в накопленной информации, построение моделей и правил, которые могут использоваться при прогнозировании. |
Многофункциональное и специализированное ПО обработки данных |
ИАД. |
Различия статических и динамических СППР проиллюстрированы таблицей 7. К приведенному в таблице добавим следующее. В число задач статических СППР входит стимулирование принятия решения руководителем, т.е., как правило, выбор одной из небольшого количества альтернатив в результате анализа большого количества данных. Эта цель достигается, главным образом, применением, таких методов, как агрегирование данных, т.е. предобработка с целью создания укрупненного портрета наблюдаемых явлений, и наглядная визуализация (трехмерные графики, цветовая индикация уровней показателей и т.д.). Использование статической СППР аналитиком и изучение им получаемых отчетов ведет, как правило, к возникновению новых вопросов, которые статическая СППР обработать не в состоянии. Вопросы, таким образом, переадресуются к сопровождающему программисту. На доработку СППР для реализации потребностей аналитика уходят недели и месяцы.
Поэтому нормальной практикой является первоначальная реализация статической СППР с последующей оценкой ее эффективности, а затем, в случае необходимости, реализация динамической СППР в качестве надстройки над статической. Возможно обособленное построение статической и динамической СППР, однако результаты работы аналитика с динамической СППР способны оказать значительное влияние на требования к статической СППР. Поэтому, при реализации статической СППР крайне желательно заложить в нее возможности дальнейшего развития в динамическую (или совместимости с ней). Основным приемом здесь является вынесение из кода и занесение в БД элементов, являющихся корректируемыми для динамической СППР – описаний форм отчетов, сценариев диалогов, ссылок на агрегаты данных и т.п. Жестко заданные значения соответствующих величин заносятся в БД. В случае миграции к динамической СППР потребуется реализовать интерфейсное средство модификации указанных БД.
Таблица 7 – Сравнительные характеристики статических и динамических СППР
Характеристика |
Статический анализ |
Динамический анализ |
Основное назначение |
Оперативное выполнение предопределенных запросов и формирование объемных отчетов фиксированного формата, включающих как частные (текущие), так и некоторые агрегированные показатели |
Неоперативное выполнение нерегламентированных (ad hoc) запросов и выдача отчетов вариабельного формата |
Основной потребитель |
Оператор, осуществляющий непосредственный контроль за штатностью протекающих процессов |
Аналитик, проводящий исследование наблюдаемых процессов |
Достоинство |
Простота применения |
Гибкость (многофункциональность) |
Недостаток |
Негибкость (функциональная ограниченность) |
Сложность применения |
Типы вопросов |
Сколько? Как? Когда? |
Почему? Что будет, если? |
Время отклика |
Не регламентируется |
Секунды |
Типичные операции |
Регламентированный отчет, диаграмма |
Последовательность интерактивных отчетов, диаграмм, экранных форм. Динамическое изменение уровней агрегации и срезов данных. |
Уровень аналитических требований |
Средний |
Высокий |
Тип экранных форм |
В основном, определенный заранее, регламентированный |
Определяемый пользователем |
Сфера агрегации данных |
Детализированные и агрегированные |
Агрегированные и закономерности |
Возраст данных |
Исторические (до года) и текущие |
Исторические (от года до десятков лет), текущие и прогнозируемые |
Типы запросов |
Регламентированные |
Непредсказуемые |
Типичный режим функционирования |
Регламентированная аналитическая обработка |
Многопроходный анализ, моделирование и построение прогнозов |
Частота обновления данных |
Высокая частота, малыми порциями |
Низкая частота, большими порциями |