Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
СХОВИЩА-нов.doc
Скачиваний:
14
Добавлен:
20.08.2019
Размер:
131.07 Кб
Скачать

4. Архітектура сховищ даних

Розрізняють такі види сховищ даних: корпоративні і кіоски, або вітрини, даних.

Корпоративні сховища даних (enterprise data warehouses) вміщують інтегровану інформацію, зібрану з певної множини оперативних БД, яка характеризує всю корпорацію і необхідна для виконання консолідованого аналізу діяльності корпорації в цілому. Такі сховища охоплюють усі багаточисленні напрями діяльності корпорації і використовуються для прийняття як тактичних, так і стратегічних рішень. Розробка корпоративного сховища даних — дуже трудомісткий процес, який може тривати від одного до кількох років, а обсяги сховища можуть досягати від 50 Гбайт до кількох терабайт.

Кіоски, або вітрини, даних (data marts) — це певна підмножина корпоративних даних, які характеризують конкретний аспект діяльності корпорації, наприклад роботу конкретного підрозділу. Кіоск може вміщувати як агреговані, так і первинні дані певної предметної області. Кіоск може отримувати дані з корпоративного сховища даних (залежний кіоск) чи бути незалежним і тоді джерелом поповнення його даними будуть оперативні БД. Розробка кіоску даних потребує значно менше часу і в середньому займає приблизно 3—4 місяці.

Корпоративні сховища даних і кіоски будуються за подібними принципами та використовують практично одинакові технології.

Останнім часом з'явилось поняття глобального сховища даних, в якому сховище даних розглядається як єдине джерело інтегрованих даних для всіх вітрин даних.

Успіх розробки та впровадження сховища даних залежить від обґрунтованості вибору його архітектури. Щодо концептуальної архітектури сховищ даних, то сховища даних залежно від підходів до побудови їх архітектури поділяються на:

  • віртуальне СД;

  • СД на основі семантичної інтеграції предметних областей;

  • СД із системою управління запитами до предметних областей;

  • Монолітне сховище;

  • СД на основі стандартного архіву даних.

ТУТ 6 КАРТИНОК ИЗ ВНЕШНЕГО ФАЙЛА.

Зупинимося детальніше на характеристиці 1ї та 2ї архітектури як найбільш вживаних.

Віртуальне сховище даних. Основою віртуального сховища даних є репозитарій метаданих, який описує місце розташування даних в оперативних системах, структуру даних, методи агрегації та завантаження даних, відомості про структуру бізнес-понять та інші дані. Архітектурно віртуальне сховище даних складається з оперативних систем та системи управління запитами, що зберігає свій репозиторій метаданих

Коли користувач запускає на виконання запит, то засоби управління запитами, використовуючи метадані, виконують пошук та вибірку необхідних даних з оперативних систем. Потім ці дані об'єднуються необхідним чином і видаються користувачеві. Тобто при виконанні запитів щоразу дані об'єднуються з різних оперативних систем, тому системи, побудовані за цими принципами, характеризуються низькою продуктивність виконання запитів. Інший недолік такої архітектури — можливість отримання різних результатів на одні й ті ж запити, виконані у різний час, оскільки дані оперативних систем постійно змінюються і не зберігають історичних даних. Ще одна суттєва перепона, яка стоїть на шляху побудови такої архітектури, — це відсутність єдиної структури полів, кодів і ключів. Тому для організацій з розгалуженою організаційною структурою та наявністю великої кількості інформаційних систем, кожна з яких працює зі своєю базою даних, такий підхід до архітектури сховища даних не може бути прийнятним, оскільки кожного разу для виконання запитів потрібно буде об'єднувати дані з різних систем замість того, щоб це зробити один раз при створенні сховища даних.

Переваги цієї архітектури полягають у тому, що максимально використовується існуюче апаратне забезпечення і основне навантаження по виконанню запитів беруть на себе системи-джерела, а система управління запитами лише управляє результатом та надає його користувачеві. Така архітектура побудови сховища даних може бути рекомендована для організацій, інформаційні системи-джерела якої побудовані з урахуванням системного підходу. Тобто вхідні дані для виконання запитів характеризуються високою якістю, наявністю спільних ключів і систем класифікації та кодування. Крім того, інформаційні системи-джерела мають засоби обмежень ресурсів, які виділяються для виконання запитів, що надходять з віртуального сховища, щоб уникнути ефекту «затоплення» запитами сховища.

Архітектура сховища на основі семантичної інтеграції предметних областей. Сховище, побудоване за цією архітектурою, поділено на певні розділи, кожен з яких характеризує окрему предметну область, але проектуються вони за єдиними правилами, що гарантує легкість їх об'єднання. Тобто спочатку проектується єдина корпоративна модель сховища, яка забезпечує ідентичність структур полів, кодів і первинних ключів

При використанні цієї архітектури процес семантичної інтеграції і проміжне сховище заміняються стандартним архівом. Стандартний архів — це стаціонарне інтегроване сховище, що вміщує інформацію для всіх СППР, і яке можна використовувати для заповнення сховищ окремих предметних областей і вітрин даних. Недоліком цього типу архітектури є високі витрати на пам'ять та підвищені вимоги до супроводження. Великі витрати пам'яті пов'язані з тим, що дані у стандартному архіві повинні зберігатись в такому вигляді, щоб легко забезпечувати обробку опера­тивних деталізованих запитів до сховища даних.

Ще одним суттєвим недоліком архітектури цього типу є відсутність інтеграції окремих предметних областей. Тому включення додаткового блоку управління запитами підвищує зручність використання сховищ даних при виконанні інтегрованих запитів, для реалізації яких потрібні дані з кількох предметних областей.

Рис. 1. Структура інформаційної системи на основі сховищ даних

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]