Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
книги хакеры / DAMA_DMBOK_Свод_знаний_по_управлению_данными.pdf
Скачиваний:
18
Добавлен:
19.04.2024
Размер:
13.88 Mб
Скачать

 

 

 

 

hang

e

 

 

 

 

 

 

 

C

 

E

 

 

 

 

X

 

 

 

 

 

 

-

 

 

 

 

 

d

 

 

F

 

 

 

 

 

 

t

 

 

D

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

r

P

 

 

 

 

 

NOW!

o

 

 

 

 

 

 

 

 

 

 

 

 

BUY

 

 

 

 

 

 

to

 

 

 

 

 

w Click

 

 

 

 

 

m

 

 

 

 

 

 

w

 

 

 

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

o

 

 

.

 

 

 

 

 

.c

 

 

 

p

 

 

 

 

g

 

 

 

 

 

df

 

 

n

e

 

 

 

 

 

-xcha

 

 

 

 

 

 

 

 

 

hang

e

 

 

 

 

 

 

 

 

C

 

E

 

 

 

 

 

X

 

 

 

 

 

 

 

-

 

 

 

 

 

d

 

 

 

F

 

 

 

 

 

 

t

 

 

 

D

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

r

 

P

 

 

 

 

 

NOW!

o

 

 

 

 

 

 

 

 

 

 

 

 

 

 

BUY

 

 

 

 

 

 

 

to

 

 

 

 

 

 

w Click

 

 

 

 

 

m

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

o

 

 

 

 

 

 

 

 

 

 

 

 

 

.

 

 

 

 

 

.c

 

 

 

 

p

 

 

 

 

g

 

 

 

 

 

 

df

 

 

n

e

 

 

 

 

 

 

-x cha

 

 

 

 

Slice — срез: из многомерного массива (n-мерного куба) данных выделяется подмножество элементов с указанным значением по одному из измерений; в результате получается куб с n – 1 измерениями. Например, из трехмерного куба выделяется двумерный слой.

Dice — кубик: получается путем урезания куба данных по двум и более измерениям.

Drill down/up — переходы вниз/вверх по уровням детализации: позволяет аналитику углуб ляться в детали данных по любому измерению, начиная с верхнего, наиболее обобщенного уровня и вплоть до самого детализированного (низового) уровня.

Roll-up — свертка: рассчитываются все определенные для одного или нескольких измерений показатели или соотношения и отображаются вместо детализированных данных. Операция свертки возможна лишь в OLAP-модели, допускающей определение отношений или формул расчета неких обобщенных показателей (среднего, итога и т. п.).

Pivot — вращение: позволяет изменять пространственную ориентацию измерений в отчете или на странице/экране.

Классическими считаются три следующие архитектуры систем онлайновой аналитической обра ботки данных.

Реляционная (ROLAP): функционалы OLAP реализуются посредством моделирования мно гомерности через определение связей между атрибутами стандартных двумерных таблиц си стем управления реляционными базами данных. Стандартная схема модели данных в среде ROLAP — звездообразная.

Многомерная (MOLAP): поддержка OLAP в составе или с использованием коммерческих и специализированных многомерных баз данных.

Гибридная (HOLAP): сочетание ROLAP и MOLAP. Гибридные реализации позволяют хранить часть данных в MOLAP, а часть — в ROLAP. Реализации могут варьироваться в зависимости от имеющихся у проектировщика возможностей по контролю структуры разделов данных.

4. МЕТОДЫ

4.1 Прототипирование с целью уточнения требований

Прежде чем приступать к внедрению чего бы то ни было, нужно оперативно определить прио ритетные требования, а для этого создать демонстрационный набор данных и на нем отработать различные прототипы модели DW/BI совместно с будущими бизнес-пользователями. Достигну тый в последние годы прогресс в сфере технологий виртуализации данных существенно облегча ет задачи прототипирования.

Профилирование данных — неотъемлемый компонент прототипирования, тем более что оно снижает риск столкновения с непредсказуемыми по структуре или значениям данными на после дующих этапах. На этапе загрузки данных из систем-источников в DW чаще всего выявляются

506

Г Л А В А 11

 

 

 

 

hang

e

 

 

 

 

 

 

 

C

 

E

 

 

 

 

X

 

 

 

 

 

 

-

 

 

 

 

 

d

 

 

F

 

 

 

 

 

 

t

 

 

D

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

r

P

 

 

 

 

 

NOW!

o

 

 

 

 

 

 

 

 

 

 

 

 

BUY

 

 

 

 

 

 

to

 

 

 

 

 

w Click

 

 

 

 

 

m

 

 

 

 

 

 

w

 

 

 

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

o

 

 

.

 

 

 

 

 

.c

 

 

 

p

 

 

 

 

g

 

 

 

 

 

df

 

 

n

e

 

 

 

 

 

-xcha

 

 

 

 

 

 

 

 

 

hang

e

 

 

 

 

 

 

 

 

C

 

E

 

 

 

 

 

X

 

 

 

 

 

 

 

-

 

 

 

 

 

d

 

 

 

F

 

 

 

 

 

 

t

 

 

 

D

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

r

 

P

 

 

 

 

 

NOW!

o

 

 

 

 

 

 

 

 

 

 

 

 

 

 

BUY

 

 

 

 

 

 

 

to

 

 

 

 

 

 

w Click

 

 

 

 

 

m

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

o

 

 

 

 

 

 

 

 

 

 

 

 

 

.

 

 

 

 

 

.c

 

 

 

 

p

 

 

 

 

g

 

 

 

 

 

 

df

 

 

n

e

 

 

 

 

 

 

-x cha

 

 

 

 

проблемы с качеством как самих вводных данных, так и функций их обработки. Профилирование также помогает ранней диагностике разночтений или расхождений в структуре данных в систе- мах-источниках, которые могут создать серьезные препятствия на пути их интеграции. В каждой системе-источнике данные могут быть вполне высококачественными согласно внутрисистемным критериям, но вот различия в наборах критериев качества, используемых в разных источниках, способны серьезно осложнить процесс интеграции данных.

Предварительная экспертиза состояния исходных данных способствует более точной оценке экономической и технологической целесообразности их интеграции с точки зрения окупаемо сти затрат и усилий на приведение данных из первоисточника в соответствие с предъявляемыми требованиями. Такая экспертиза важна и для определения реалистичных ожиданий. Планируйте также сотрудничество с командами, отвечающими за обеспечение качества данных и руковод ство данными, равно как и со специалистами во всех предметных областях по вопросам уточне ния определений, устранения рассогласований и минимизации рисков (см. главу 13).

4.2 BI по принципу самообслуживания

Важнейшим принципом организации портфеля BI-приложений является самообслуживание (self-service) в части настроек представлений и выдач данных. Доступные пользователю действия обычно регулируются настройками профиля на портале доступа, где, в зависимости от привиле гий, можно выбирать, подключать/отключать и конфигурировать различные функциональности, уведомления, сообщения и предупреждения, периодичность просмотра производственных от четов, порядок взаимодействия с аналитическими отчетами, разрабатывать собственные отчеты

ипользоваться настройками и функциями приборной панели и картами показателей. Отчеты могут выдаваться на портал по стандартному расписанию, чтобы пользователи могли ознако миться с ними, когда это необходимо. Или же пользователи могут получать отчеты из хранилища с помощью запросов с портала. Наконец, порталы BI позволяют налаживать и обмен контентом между различными организациями.

Открытие доступа к средству совместной работы лицам, не входящим в узкий круг привиле гированных пользователей, бывает полезным с точки зрения тонкой дифференциации настроек самообслуживания и публикации сводок о статусе загрузки, общих рабочих показателей, уведом лений о готовящихся обновлениях, а также для ведения различных форумов. Согласуйте темы форумов по техническим каналам, модерируйте их контент, а по мере надобности назначайте

ипроводите групповые сеансы для заинтересованных пользователей через служебный канал.

Средства визуализации и статистического анализа позволяют быстро разведывать и извле кать нужные данные. Иногда в пакете BI имеются и средства самостоятельного модульного по строения пользовательских приборных панелей, ориентированных на бизнес. Их можно опера тивно публиковать, распространять, рецензировать, совместно дорабатывать и улучшать. Всё то, что некогда было всецело во власти айтишников и программистов: моделирование, структуриро вание и формирование выборок данных, расчетные формулы, средства объектного построения и визуализации данных, — в наши дни становится доступным бизнес-сообществу. Это, в свою

Ведение хранилищ данных и бизнес-аналитика

507