Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

9306

.pdf
Скачиваний:
0
Добавлен:
25.11.2023
Размер:
2.5 Mб
Скачать

80

Принцип организации многомерного куба поясняется на рис. 3.2.

Рис. 3.2. Принцип организации многомерного куба

Рис. 3.3. Измерения и факты в многомерном кубе Многомерный взгляд на измерения Дата, Товар и Покупатель

представлен на рис. 3.3. Фактами в данном случае являются Цена, Количество,

81

Сумма. Выделенный сегмент содержит информацию о том, сколько плит, на какую сумму и по какой цене приобрела фирма ЗАО «Строитель» 3 ноября.

Визуализация OLAP-куба производится с помощью специального вида таблиц, которые строятся на основе срезов OLAP-куба, содержащих необходимую пользователю информацию. Срезы, в свою очередь, являются результатом выполнения соответствующего запроса к базе данных. Как правило, в процессе построения срезов пользователь с помощью мыши и клавиатуры манипулирует заголовками измерений, добиваясь наиболее информативного представления данных в кубе. В зависимости от положения заголовков измерений в таблице автоматически формируется запрос к базе или хранилищу данных. Запрос извлекает данные из базы или хранилища, после чего OLAP-ядро системы визуализирует их.

Общую схему работы настольной OLAP системы можно представить следующим образом:

Рис. 3.4. Технология OLAP Алгоритм работы следующий:

1.Получение данных в виде плоской таблицы или результата выполнения SQL запроса.

2.Кэширование данных и преобразование их к многомерному кубу.

3.Отображение построенного куба при помощи кросс-таблицы или диаграммы и т.п. В общем случае к одному кубу может быть подключено

произвольное количество отображений.

Отображения, используемые в OLAP системах, чаще всего бывают двух видов – кросс-таблицы и кросс-диаграммы. Кросс-таблица является основным и

82

наиболее распространенным способом отображения куба. Она отличается от обычной плоской таблицы наличием нескольких уровней вложенности (например, она допускает разбиение строк на подстроки, а столбцов – на подстолбцы). Кросс-диаграмма представляет собой диаграмму заданного типа (гистограмму, линейную диаграмму и т.д.), построенную на основе кросстаблицы. Основное отличие кросс-диаграммы от обычной диаграммы в том, что она однозначно соответствует текущему состоянию куба и при любых его изменениях (транспонирование, фильтрация по измерениям и т.д.) также синхронно изменяется.

OLAP-куб можно использовать не только как метод визуализации, но и как средство оперативного формирования отчетов и представления информации в нужном разрезе (так называемая аналитическая отчетность).

OLAP-куб позволяет анализировать данные сразу по нескольким измерениям, т.е. выполнять многомерный анализ. Пользователь, анализирующий информацию, может «резать» куб по разным направлениям, получать сводные (например, по годам) или, наоборот, детальные (по неделям) сведения и осуществлять прочие манипуляции, которые необходимы ему в процессе анализа. В анализе может использоваться любое число измерений, каждое из которых будет представлено новой осью. Конечно, для OLAP-куба с размерностью больше трех геометрическая интерпретация не имеет смысла (тем более что речь идет не о реальном, а об информационном пространстве).

Следует отметить, что задача расчета и визуализации куба с большим числом измерений, во-первых, может потребовать слишком больших вычислительных ресурсов, а во-вторых, ее содержательная интерпретация весьма затруднительна. Как правило, человек не способен анализировать больше 5-7 измерений одновременно. Поэтому сложные задачи, требующие анализа данных большой размерности, следует по возможности сводить к нескольким более простым.

83

3.3. Визуализация и отчеты в Deductor Studio

На верхнем уровне принятия решений значение имеет не точность цифр, а закономерности, поэтому визуализация результатов анализа в виде OLAP– отчетов, графиков, карт и диаграмм – наиболее оптимальный вариант отображения статистической информации, который позволяет на уровне простых обобщений получить агрегированные данные на текущий момент и спланировать динамику на ближайшее время.

В АП Deductor предусмотрены следующие способы визуализации данных: OLAP-кубы, диаграммы, графики, гистограммы, статистика, правила, матрицы классификации, диаграммы рассеяния, ретропрогноз, карты Кохонена, профили кластеров.

Визуализаторы общего назначения рассматривались в разделе «Базовые навыки работы Deductor Studio Academic». Визуализаторы для иллюстрации построения и оценки качества аналитических моделей будут использоваться в разделе «Модели Data Mining». Рассмотрим OLAP-кубы – визуализаторы, которые чаще всего используются в отчетах.

Аналитическая отчетность (отчеты) – это одно из средств визуализации и консолидации результатов анализа данных для конечного пользователя (для лиц, принимающих решения). Аналитическая отчетность обеспечивает быстрый доступ к результатам анализа, не требуя от пользователя навыков анализа данных и работы в АП Deductor. При работе с отчетами пользователь не видит сценарий анализа данных, ему доступны только конечные результаты (выдержки) из работы аналитика.

Для построения аналитической отчетности в АП Deductor предназначена

вкладка Отчеты, cпособ открытия: «Вид – Отчеты» или кнопка , после нажатия на которую в рабочей части экрана появится панель Отчеты.

Отчеты строятся в виде древовидного иерархического списка (рис. 3.5), каждым узлом которого является отдельный отчет или папка, содержащая несколько отчетов. Каждый узел дерева отчетности связан со своим узлом в

84

дереве сценария. Для каждого отчета настраивается свой способ отображения (таблица, гистограмма, кросс таблица, кросс диаграмма и т.п.). Это удобно, так как несколько отчетов могут быть связаны с одним узлом дерева сценария.

Рис. 3.5. Панель отчетов сценария «Мониторинг водных ресурсов» Чтобы добавить новый отчет, нужно щелкнуть по кнопке Добавить узел

или выбрать соответствующую команду из контекстного меню. В результате откроется окно Выбор узла, в котором следует выделить узел дерева сценария, где содержится нужная выборка данных, и щелкнуть по кнопке Выбрать.

Следует отметить, что операция добавления нового отчета доступна, только если выделена папка или корневой пункт Отчеты списка отчетов. Если выделить узел, содержащий отдельный отчет, команда создания нового отчета будет недоступна.

Чтобы добавить новую папку, нужно щелкнуть по кнопке Добавить папку или выбрать соответствующую команду в контекстном меню. В результате в списке отчетов появится новая папка с открытым полем имени, куда следует ввести имя папки. После ввода имени для его сохранения щелкнуть по любому узлу списка. Чтобы поместить отчет в папку, нужно перед вызовом команды Добавить узел выделить эту папку.

На рис. 3.5 представлены отчеты сценария «Мониторинг водных ресурсов», которые содержат в себе историю работы с данными и их анализа. Для перехода на ту или иную ветку сценария необходимо щелкнуть правой

85

кнопкой мыши по интересующему отчету и выбрать опцию Найти узел в сценарии, после чего откроется тот или иной узел.

Используя имеющиеся в Deductor OLAP-технологии, отчеты можно представить в виде OLAP-кубов и кросс-диаграмм. Примером является отчет «Динамика загрязнения объекта» (рис. 3.6). Он представляет собой сводную таблицу по измерениям «Дата» и «Створ» и кросс-диаграмму, которая показывает динамику загрязнения водного объекта (в данном случае реки Беленькая) для фонового и для контрольного створа конкретным загрязнителем (в данном случае ХПК) на протяжении всего периода проведения мониторинга.

Данный отчет является универсальным, так как здесь имеется возможность выбора любого другого водного объекта и загрязнителя для быстрого составления отчетности.

Рис. 3.6. Отчет «Динамика загрязнения объекта»

Рассмотрим порядок настройки OLAP-куба для отчета «Динамика загрязнения объекта» (рис. 3.6).

Чтобы построить OLAP-куб, пользователь должен активировать мастер визуализации и выбрать способ отображения данных в виде куба (рис. 3.7).

86

Рис. 3.7. Выбор способа отображения данных в виде куба На 3 и 4 шаге «Мастера настройки отображения» нужно указать системе,

какие измерения и факты включать в куб (рис. 3.8, 3.9).

Рис. 3.8. Настройка назначений полей куба

87

Рис. 3.9. Настройка размещений полей куба На последнем шаге нужно выбрать, какие факты нужно отображать в

кубе на пересечении измерений и варианты агрегации их значений (рис. 3.10).

Рис. 3.10. Настройка отображения фактов Для отображения фактов предусмотрено 8 способов объединения

(агрегирования):

Сумма – вычисляется сумма объединяемых фактов.

Минимум – среди всех объединяемых фактов в таблице отображается только минимальный.

88

Максимум - среди всех объединяемых фактов в таблице отображается только максимальный.

Среднее – вычисляется среднее значение объединяемых фактов.

Количество – в кубе будет отображаться количество объединенных фактов.

Стандартное отклонение.

Сумма квадратов.

Количество пропусков.

Кроме того, всегда присутствует факт Количество, который рассчитывает число записей, соответствующих совокупности измерений.

Врезультате для нашего примера получится многомерный отчет, представленный на рис. 3.6. Измерения в кубе изображаются специальными полями. Синие поля показывают измерения, участвующие в построении таблицы. Зелеными полями отображаются скрытые измерения, не участвующие

впостроении таблицы. Имеется возможность перестраивать таблицу с помощью мыши «на лету». Сделать это можно, если перетаскивать поля с заголовками измерений.

Изменять расположение измерений можно, используя операцию транспонирования таблицы. В результате транспонирования данные, ранее отображавшиеся в строках, отображаются в столбцах, а данные в столбцах преобразуются в строки. Транспонирование во многих случаях позволяет оперативно сделать таблицу более удобной для восприятия.

Куб можно сортировать как по измерениям, так и по фактам. В первом

случае на помощь приходит кнопка Сортировать значения измерений (по умолчанию значения измерений следуют в алфавитном порядке), во втором – щелчок мышью по заголовку факта.

89

Еще одной полезной возможностью является фильтрация. Чтобы осуществить фильтрацию по значениям измерений, нужно нажать кнопку в заголовке измерения. Раскроется список всех уникальных значений данного измерения, в котором при помощи флажков можно включить/отключить нужные (рис. 3.11). Если включены не все значения, заголовок измерения в кубе поменяет цвет с синего на красный.

Рис. 3.11. Фильтрация по значениям измерения Чтобы осуществить фильтрацию по значениям фактов необходимо во

всплывающем меню или на панели инструментов нажать кнопку , после чего будет открыто окно селектора (рис.3.12).

Рис. 3.12. Окно селектора Слева отображаются все измерения куба и поле Факты, означающие

фильтрацию по фактам.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]