- •Лабораторна робота №1 Робота зі зведеними таблицями
- •Теоретичні основи
- •Завдання
- •Варіант 1
- •Варіант 2
- •Варіант 3
- •Варіант 4
- •Варіант 5
- •Лабораторна робота №2-3 Створення простих багатомірних olap кубів
- •Теоретичні основи
- •Завдання
- •Лабораторна робота №4 Побудова olap зрізів куба клієнтським засобом
- •Теоретичні основи
- •Завдання
- •Лабораторна робота №5 Підготовка реляційної бд як джерела даних для сховища даних
- •Теоретичні основи
- •Завдання
- •Варіанти
- •Лабораторна робота №6 Створення сховища даних на основі реляційної бд за заповнення його даними
- •Теоретичні основи
- •2) Очищення даних
- •3) Перетворення й консолідація даних
- •4) Завантаження даних
- •5) Відновлення даних
- •Завдання
- •Лабораторна робота №7-9 Мова багатомірних виражень mdx (Multi-Dimensional eXpressions)
- •Теоретичні основи
- •Завдання
- •Список літератури
4) Завантаження даних
Операцію завантаження даних можна розбити на наступні етапи:
а) пересилання перетворених і консолідованих даних у базу дані ППР;
Іноді, перш ніж буде виконане дійсне завантаження, дані перетворяться у внутрішній фізичний формат, необхідний для цільовий СУБД. Альтернативний і більше ефективний метод передбачає завантаження в робочі таблиці, склад яких відбиває структуру цільової схеми.
б) перевірка погодженості даних (тобто перевірка їхньої цілісності);
Більша частина процесу перевірки цілісності даних, що завантажують, може бути проведена ще до реального завантаження, без звертання до даних, що вже перебуває в сховищі даних. Однак деякі обмеження все-таки не можуть бути перевірені без звертання до існуючої бази даних. Наприклад, обмеження, що контролює унікальність значень, у загальному випадку повинне перевірятися під час реального завантаження (або, якщо завантаження виконується в пакетному режимі, після її завершення).
в) побудова всіх необхідних індексів.
Наявність індексів може різко сповільнити процес завантаження даних, оскільки більшість продуктів виконує відновлення індексів при вставці в таблицю кожного рядка. Тому іноді має сенс видаляти індекси перед завантаженням даних, а потім, після її завершення, створювати їх заново. Однак такий підхід не буде доцільним, якщо кількість нових даних стосовно вже існуючим досить мала; у цьому випадку витрати на створення індексів для всієї таблиці будуть істотно більше витрат на відновлення індексів. Більшість сучасних СКБД підтримує режим паралельного створення індексів, що дозволяє прискорити процеси завантаження даних і побудови індексів.
5) Відновлення даних
У більшості баз дані підтримки прийняття рішень потрібне періодичне відновлення даних для підтримки їхньої актуальності. Відновлення звичайно передбачає часткове завантаження, хоча для деяких системах ППР потрібне видалення всіх даних з бази і їхнє повне перезавантаження. При відновленні виникають ті ж проблеми, що й при завантаженні, і, крім того, може знадобитися, щоб відновлення виконувалося в той час, коли користувачі звертаються до БД.
Завдання
Побудувати на основі розробленої в лабораторній роботі №6 БД сховище даних (СД). При необхідності виконати денормалізацію.
Розробити процедуру перевантаження даних з вхідної БД у СД. При необхідності виконати перетворення й додаткові обчислення.
Створити для СД із п.1 багатомірний куб зі схемою "сніжинка". Куб повинен включати таблицю фактів з 2-3 мірами й не менш трьох вимірів. Хоча б один з вимірів повинне представлятися двома зв'язаними таблицями. Один вимір повинен відповідати виміру часу.
Зміст протоколу:
Ціль роботи
Скріпти з операторами SQL для завантаження БД СД.
Функції перетворення даних.
Скріншоти створення багатомірного кубу
Висновок
Контрольні запитання
Що таке денормалізація?
Які види денормалізації Ви знаєте?
Чому в СД можна необмежено застосовувати денормалізацію?
Чому в СД можна необмежено використовувати індексацію?
Які проблеми виникають при перенесені даних з вхідних джерел даних до СД?
Як вирішуються проблеми очистки даних при завантаженні їх до СД?