Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Data Storage Lab Task.doc
Скачиваний:
24
Добавлен:
10.02.2016
Размер:
707.07 Кб
Скачать

4) Завантаження даних

Операцію завантаження даних можна розбити на наступні етапи:

а) пересилання перетворених і консолідованих даних у базу дані ППР;

Іноді, перш ніж буде виконане дійсне завантаження, дані перетворяться у внутрішній фізичний формат, необхідний для цільовий СУБД. Альтернативний і більше ефективний метод передбачає завантаження в робочі таблиці, склад яких відбиває структуру цільової схеми.

б) перевірка погодженості даних (тобто перевірка їхньої цілісності);

Більша частина процесу перевірки цілісності даних, що завантажують, може бути проведена ще до реального завантаження, без звертання до даних, що вже перебуває в сховищі даних. Однак деякі обмеження все-таки не можуть бути перевірені без звертання до існуючої бази даних. Наприклад, обмеження, що контролює унікальність значень, у загальному випадку повинне перевірятися під час реального завантаження (або, якщо завантаження виконується в пакетному режимі, після її завершення).

в) побудова всіх необхідних індексів.

Наявність індексів може різко сповільнити процес завантаження даних, оскільки більшість продуктів виконує відновлення індексів при вставці в таблицю кожного рядка. Тому іноді має сенс видаляти індекси перед завантаженням даних, а потім, після її завершення, створювати їх заново. Однак такий підхід не буде доцільним, якщо кількість нових даних стосовно вже існуючим досить мала; у цьому випадку витрати на створення індексів для всієї таблиці будуть істотно більше витрат на відновлення індексів. Більшість сучасних СКБД підтримує режим паралельного створення індексів, що дозволяє прискорити процеси завантаження даних і побудови індексів.

5) Відновлення даних

У більшості баз дані підтримки прийняття рішень потрібне періодичне відновлення даних для підтримки їхньої актуальності. Відновлення звичайно передбачає часткове завантаження, хоча для деяких системах ППР потрібне видалення всіх даних з бази і їхнє повне перезавантаження. При відновленні виникають ті ж проблеми, що й при завантаженні, і, крім того, може знадобитися, щоб відновлення виконувалося в той час, коли користувачі звертаються до БД.

Завдання

Побудувати на основі розробленої в лабораторній роботі №6 БД сховище даних (СД). При необхідності виконати денормалізацію.

Розробити процедуру перевантаження даних з вхідної БД у СД. При необхідності виконати перетворення й додаткові обчислення.

Створити для СД із п.1 багатомірний куб зі схемою "сніжинка". Куб повинен включати таблицю фактів з 2-3 мірами й не менш трьох вимірів. Хоча б один з вимірів повинне представлятися двома зв'язаними таблицями. Один вимір повинен відповідати виміру часу.

Зміст протоколу:

  1. Ціль роботи

  2. Скріпти з операторами SQL для завантаження БД СД.

  3. Функції перетворення даних.

  4. Скріншоти створення багатомірного кубу

  5. Висновок

Контрольні запитання

                1. Що таке денормалізація?

                2. Які види денормалізації Ви знаєте?

                3. Чому в СД можна необмежено застосовувати денормалізацію?

                4. Чому в СД можна необмежено використовувати індексацію?

                5. Які проблеми виникають при перенесені даних з вхідних джерел даних до СД?

                6. Як вирішуються проблеми очистки даних при завантаженні їх до СД?

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]