Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
книги хакеры / DAMA_DMBOK_Свод_знаний_по_управлению_данными.pdf
Скачиваний:
17
Добавлен:
19.04.2024
Размер:
13.88 Mб
Скачать

 

 

 

 

hang

e

 

 

 

 

 

 

 

C

 

E

 

 

 

 

X

 

 

 

 

 

 

-

 

 

 

 

 

d

 

 

F

 

 

 

 

 

 

t

 

 

D

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

r

P

 

 

 

 

 

NOW!

o

 

 

 

 

 

 

 

 

 

 

 

 

BUY

 

 

 

 

 

 

to

 

 

 

 

 

w Click

 

 

 

 

 

m

 

 

 

 

 

 

w

 

 

 

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

o

 

 

.

 

 

 

 

 

.c

 

 

 

p

 

 

 

 

g

 

 

 

 

 

df

 

 

n

e

 

 

 

 

 

-xcha

 

 

 

 

1.2 Цели

В рамках отдельно взятой организации управление данными преследует следующие цели.

 

 

 

 

hang

e

 

 

 

 

 

 

 

C

 

E

 

 

 

 

X

 

 

 

 

 

 

-

 

 

 

 

 

d

 

 

F

 

 

 

 

 

 

t

 

 

D

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

r

P

 

 

 

 

 

NOW!

o

 

 

 

 

 

 

 

 

 

 

 

 

BUY

 

 

 

 

 

 

to

 

 

 

 

 

w Click

 

 

 

 

 

m

 

 

 

 

 

 

w

 

 

 

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

o

 

 

.

 

 

 

 

 

.c

 

 

 

p

 

 

 

 

g

 

 

 

 

 

df

 

 

n

e

 

 

 

 

 

-x cha

 

 

 

 

Выявление и обслуживание информационных потребностей организации и заинтересован ных в ее развитии сторон, включая акционеров, клиентов, сотрудников и деловых партнеров.

Сбор, хранение, защита и обеспечение целостности данных.

Обеспечение качества данных и информации.

Обеспечение конфиденциальности и неразглашения данных, касающихся всех заинтересо ванных сторон.

Предотвращение несанкционированного доступа к данным и информации, а также их искажения, подтасовки или нецелевого использования.

Обеспечение эффективного использования данных, что генерировало бы дополнительную выгоду предприятию.

2. ОСНОВНЫЕ ПОНЯТИЯ И КОНЦЕПЦИИ

2.1 Данные

Устоявшиеся определения понятия данные подчеркивают их роль в представлении фактов об окружающем мире1. В сфере информационных технологий данные также понимаются как ин формация, сохраненная в цифровой форме (хотя в реальности данные не ограничиваются ис ключительно оцифрованной информацией, а принципы управления данными в равной степени применимы и к бумажным архивам, и к электронным базам данных). В связи с тем, что сегодня мы в состоянии фиксировать в электронном виде массу всевозможной информации, мы стали называть «данными» многие вещи, которые ранее так не назывались: например, имена, адреса, дни рождения, съеденный в субботу обед или недавно приобретенную книгу.

Подобные факты об отдельных людях можно агрегировать, анализировать, использовать в коммерческих целях, в нуждах здравоохранения или для оказания влияния на публичную по литику. Более того, растущие технологические возможности регистрации и замеров параметров

1 В «Новом оксфордском словаре американского английского» (New Oxford American Dictionary) данные определя ются как «факты и статистика, собранные вместе для анализа». Американское общество качества (ASQ) определяет данные как «подборку фактов» и описывает два типа численных данных: (1) измеримые, переменные или варьируе мые и (2) счетные или качественные. Международная организация по стандартизации (ISO) определяет данные как «многократно интерпретируемое представление информации, пригодное для передачи, интерпретации или обработки формализованным образом» (ГОСТ Р ИСО/МЭК 11179-1-2010). Последнее определение явным образом указывает на электронный характер данных и подразумевает (вполне справедливо), что данные требуют стандартизации, поскольку управляются посредством информационно-технологических систем. Однако в данном определении не упомянуты ни трудности непротиворечивой и однозначной формализации данных, передаваемых между несовместимыми система ми, ни понятие неструктурированных данных.

Управление данными

3

 

 

 

 

hang

e

 

 

 

 

 

 

 

C

 

E

 

 

 

 

X

 

 

 

 

 

 

-

 

 

 

 

 

d

 

 

F

 

 

 

 

 

 

t

 

 

D

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

r

P

 

 

 

 

 

NOW!

o

 

 

 

 

 

 

 

 

 

 

 

 

BUY

 

 

 

 

 

 

to

 

 

 

 

 

w Click

 

 

 

 

 

m

 

 

 

 

 

 

w

 

 

 

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

o

 

 

.

 

 

 

 

 

.c

 

 

 

p

 

 

 

 

g

 

 

 

 

 

df

 

 

n

e

 

 

 

 

 

-xcha

 

 

 

 

 

 

 

 

 

hang

e

 

 

 

 

 

 

 

 

C

 

E

 

 

 

 

 

X

 

 

 

 

 

 

 

-

 

 

 

 

 

d

 

 

 

F

 

 

 

 

 

 

t

 

 

 

D

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

r

 

P

 

 

 

 

 

NOW!

o

 

 

 

 

 

 

 

 

 

 

 

 

 

 

BUY

 

 

 

 

 

 

 

to

 

 

 

 

 

 

w Click

 

 

 

 

 

m

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

o

 

 

 

 

 

 

 

 

 

 

 

 

 

.

 

 

 

 

 

.c

 

 

 

 

p

 

 

 

 

g

 

 

 

 

 

 

df

 

 

n

e

 

 

 

 

 

 

-x cha

 

 

 

 

самых разных событий и проявлений человеческой жизнедеятельности (от отзвуков Большого взрыва до пульса отдельного человека), равно как сбора, хранения и анализа электронных версий всего того, что ранее данными вовсе не считалось (видео, фото, аудио, документов), скоро пре высят наши cпособности по объединению этих данных в пригодную для практического исполь зования информацию1. Чтобы использовать преимущества, которые открывает изобилие разно образных данных, и не растеряться при столкновении с объемом и скоростью их поступления, требуются надежные и масштабируемые практики управления данными.

Большинство людей полагает, что данные, как собрание фактов, отражают истинную карти ну мира, а потому должны согласовываться между собой. Но ведь и «факты» сами по себе вещь упрямая и далеко не всегда простая, однозначная и прямолинейная. Чего в таком случае ждать от данных, которые есть всего лишь средство представления фактов? Данные заслоняют и заме щают собой реальные вещи, которые описывают (Chisholm, 2010). Данные — это одновременно интерпретация представляемых ими предметов и, сами по себе, предметы, подлежащие интер претации (Sebastian-Coleman, 2013). Иными словами, в отрыве от контекста данные становятся бессмысленными. Для понимания их смысла необходимо знать контекст, который, можно ска зать, служит репрезентативной системой данных, а такая система должна обязательно включать общепринятую терминологию и набор связей между компонентами. Если принятые в такой си стеме соглашения нам известны, мы способны интерпретировать данные в ее рамках2. Подобные соглашения часто документируются отдельно в виде так называемых метаданных.

Однако, поскольку люди часто выбирают различные представления одних и тех же понятий, способы представления одного и того же перманентно множатся. Таким образом, одни и те же данные облекаются в различные формы. Для примера вообразите себе, сколько различных фор матов имеется для представления столь элементарных и неоспоримых данных, как календарные даты. А теперь можно предположить, что творится с понятиями более сложными по структуре (такими, к примеру, как «потребитель» или «продукт»), — тут и глубина, и уровень детализа ции информации, нуждающейся в представлении, далеко не очевидны. Это усложняет процесс представления данных, а со временем приводит и к тому, что процедуры управления данными обрастают массой нюансов (см. главу 10).

Даже в пределах одной организации одна и та же идея может облекаться в различные формы представления. Отсюда потребность и в архитектуре данных, и в моделировании, и в руководстве и распоряжении данными, и в управлении метаданными, и в управлении качеством данных, — всё это реально необходимо, чтобы помочь людям правильно понимать и использовать данные. На уровне же взаимодействия между несколькими организациями проблемы, обусловленные не однозначными представлениями, многократно множатся, что свидетельствует о необходимости единых стандартов представления данных и управления ими, без которых обеспечить их едино образие и сопоставимость нереально.

1 http://ubm.io/2c4yPOJ; http://bit.ly/1rOQkt1

2 Подробнее о конструируемости данных см.: Kent, Data and Reality (2012); Devlin, Business Unintelligence (2013).

4

Г Л А В А 1

 

 

 

 

hang

e

 

 

 

 

 

 

 

C

 

E

 

 

 

 

X

 

 

 

 

 

 

-

 

 

 

 

 

d

 

 

F

 

 

 

 

 

 

t

 

 

D

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

r

P

 

 

 

 

 

NOW!

o

 

 

 

 

 

 

 

 

 

 

 

 

BUY

 

 

 

 

 

 

to

 

 

 

 

 

w Click

 

 

 

 

 

m

 

 

 

 

 

 

w

 

 

 

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

o

 

 

.

 

 

 

 

 

.c

 

 

 

p

 

 

 

 

g

 

 

 

 

 

df

 

 

n

e

 

 

 

 

 

-xcha

 

 

 

 

 

 

 

 

 

hang

e

 

 

 

 

 

 

 

 

C

 

E

 

 

 

 

 

X

 

 

 

 

 

 

 

-

 

 

 

 

 

d

 

 

 

F

 

 

 

 

 

 

t

 

 

 

D

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

r

 

P

 

 

 

 

 

NOW!

o

 

 

 

 

 

 

 

 

 

 

 

 

 

 

BUY

 

 

 

 

 

 

 

to

 

 

 

 

 

 

w Click

 

 

 

 

 

m

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

o

 

 

 

 

 

 

 

 

 

 

 

 

 

.

 

 

 

 

 

.c

 

 

 

 

p

 

 

 

 

g

 

 

 

 

 

 

df

 

 

n

e

 

 

 

 

 

 

-x cha

 

 

 

 

Управлять данными организациям нужно было всегда, но технологические изменения новей шего времени не просто неизмеримо расширили спектр необходимых работ в этой области, но и в корне изменили само человеческое представление о том, что такое данные. Такие изменения теперь позволяют организациям использовать данные по-новому — для разработки продуктов, распространения информации, получения знаний и приумножения успехов в целом. Бурное раз витие технологий и обусловленное им лавинообразное нарастание человеческой способности производить, собирать и извлекать данные для осмысления пропорционально повысило и по требность в эффективном управлении ими.

2.2 Данные и информация

На описание взаимосвязи между данными и информацией было израсходовано много чернил,

врезультате чего данные окрестили «информационным сырьем», а информацию — «данными

вконтексте»1. Для описания взаимоотношений между ними часто используют четырехуровне вую пирамиду, в основании (фундаменте) которой лежат данные, а выше идут ярусы «информация», «знание» и «мудрость» (на самой вершине). Для осознания необходимости качественного управления данными образ такой пирамиды полезен, но столь упрощенное представление на практике влечет за собой ряд трудностей.

Во-первых, оно основано на гипотезе об объективном существовании данных. Но данных как таковых в природе попросту не существует. Данные создаются.

Во-вторых, линейная последовательность преобразования данных в мудрость через инфор мацию и знание игнорирует неоспоримый факт необходимости обладать знанием о том, как, для начала, хотя бы создавать данные, а затем перерабатывать их в информацию и т. д.

В-третьих, априори подразумевается, что данные и информация — вещи друг от друга от дельные и независимые, в то время как в действительности оба понятия тесно переплетены и по отдельности друг от друга (в чистом виде) не существуют. Данные — это форма инфор мации, а информация — это форма данных.

Внутри организации полезно проводить четкую границу между информацией и данными хотя бы в целях более ясного донесения требований и ожиданий по различным направлениям практи ческой работы до различных заинтересованных аудиторий. (Пример: «Предлагаем ознакомиться с отчетом о продажах за минувший квартал [информация]. Он составлен на основе данных на шего информационного хранилища [данные]. В следующем квартале эти результаты [данные] будут использованы для создания сравнительных показателей нашей работы по отношению к предыдущему кварталу [информация]».) Признание различий между данными и информаци ей, а также целями, для которых они могут быть использованы, служит основой стержневого постулата об управлении данными: предметом управления являются и данные, и информация;

1 English (1999); DAMA (2009).

Управление данными

5

 

 

 

 

hang

e

 

 

 

 

 

 

 

C

 

E

 

 

 

 

X

 

 

 

 

 

 

-

 

 

 

 

 

d

 

 

F

 

 

 

 

 

 

t

 

 

D

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

r

P

 

 

 

 

 

NOW!

o

 

 

 

 

 

 

 

 

 

 

 

 

BUY

 

 

 

 

 

 

to

 

 

 

 

 

w Click

 

 

 

 

 

m

 

 

 

 

 

 

w

 

 

 

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

o

 

 

.

 

 

 

 

 

.c

 

 

 

p

 

 

 

 

g

 

 

 

 

 

df

 

 

n

e

 

 

 

 

 

-xcha

 

 

 

 

 

 

 

 

 

hang

e

 

 

 

 

 

 

 

 

C

 

E

 

 

 

 

 

X

 

 

 

 

 

 

 

-

 

 

 

 

 

d

 

 

 

F

 

 

 

 

 

 

t

 

 

 

D

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

r

 

P

 

 

 

 

 

NOW!

o

 

 

 

 

 

 

 

 

 

 

 

 

 

 

BUY

 

 

 

 

 

 

 

to

 

 

 

 

 

 

w Click

 

 

 

 

 

m

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

o

 

 

 

 

 

 

 

 

 

 

 

 

 

.

 

 

 

 

 

.c

 

 

 

 

p

 

 

 

 

g

 

 

 

 

 

 

df

 

 

n

e

 

 

 

 

 

 

-x cha

 

 

 

 

при этом качество и того и другого возрастает лишь при согласованном управлении ими с учетом потребностей конечных потребителей. Поэтому в дальнейшем в DMBOK термины «информа ция» и «данные» используются как взаимозаменяемые синонимы.

2.3 Данные как актив организации

Под активом понимается имеющийся в собственности или контролируемый экономический ре сурс, содержащий в себе или производящий ценность. При этом он может быть конвертирован в деньги. Представление о данных как об активе предприятия на сегодняшний день вполне устоя лось, а вот понимание того, как управлять данными как активом, всё еще находится на стадии формирования. В начале 1990-х годов в ряде организаций ставили под сомнение возможность конвертации в денежные активы деловой репутации (гудвилла), а сегодня ее стоимость — стан дартная строка в отчете о прибылях и убытках компании. Аналогичным образом и монетизация данных всё чаще переходит в разряд реальных источников пополнения бюджета организаций. Вероятно, и она вскоре окажется в ряду прочих доходных статей публикуемых финансовых отче тов (см. главу 3).

В наши дни организации полагаются на свои информационные активы как на реальный ре сурс повышения эффективности и оптимизации работы. Компании используют данные, чтобы лучше понимать своих клиентов и их нужды, создавать новые продукты и услуги, а также повы шать операционную эффективность за счет снижения издержек и минимизации рисков. Госуч реждения, учебные заведения и некоммерческие организации также нуждаются в высококаче ственных данных для успешного ведения как своей текущей деятельности, так и планирования развития в кратко-, средне- и долгосрочной перспективе. Чем больше организации зависят от данных, тем отчетливее определяется роль информации как стратегически значимого актива.

Многие организации определяют себя как «управляемые на основе данных» (data-driven). У бизнеса, нацеленного на сохранение конкурентоспособности, нет иного выбора, кроме отказа от принятия решений (подсказанного «внутренним чутьем» или инстинктами руководителей) и перехода к применению аналитики в поисках действенных решений. Управление на основе дан ных подразумевает безусловное признание необходимости эффективного управления данными, вкупе с профессиональной выучкой и дисциплиной посредством оптимального сплава навыков высокоуровневого руководства бизнесом и технического опыта.

Более того, нарастающие темпы изменений в бизнес-среде в наши дни прямо указывают на то, что назревшие перемены в области управления данными отныне носят характер обязатель ных, а не факультативных. «Цифровой прорыв» (digital disruption) стал нормой, и для адекватной реакции на него бизнес должен кооперироваться с техническими специалистами по управлению данными с целью совместного создания информационных решений, в равной мере соответствую щих потребностям как самого бизнеса, так и его партнеров по каждому направлению. Они обя заны совместно планировать получение и управление данными, которые, по их общему понима нию, нужны для реализации бизнес-стратегии. А в дополнение к этому им необходимо осваивать все новые способы использования данных, чтобы извлекать из них максимальную пользу.

6

Г Л А В А 1