Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
2121.doc
Скачиваний:
139
Добавлен:
30.04.2015
Размер:
2.93 Mб
Скачать

5.4. Хранилище данных

Для менеджеров и аналитиков требуются такие системы, которые бы позволяли:

 анализировать информацию во времени;

 обрабатывать большие объемы данных;

 интегрировать (объединять) данные из различных регистрирующих систем.

Решением данной проблемы стала реализация технологии информационных хранилищ.

Хранилище данных(англ.Data warehouse) – предметно ориентированная информационная корпоративная БД, специально разработанная и предназначенная для подготовки отчетов, анализа бизнес-процессов с целью поддержки принятия решений в организации. Хранилище данных строится на базе клиент-серверной архитектуры, реляционной СУБД и утилит поддержки принятия решений. Например, в КИС «Галактика» загрузка информации из БД в хранилище осуществляется с помощью модуляЭкспорт в хранилище данных.

Основное назначение хранилищ данных– информационная поддержка принятия решений, а не оперативная обработка данных.

Технология информационного хранилища обеспечивает сбор информации из существующих БД организациии внешних источников (рис. 36). При этом в хранилище представлены не первичные данные, а агрегированные, обработанные данные. В процессе перемещения данных в хранилище выполняются следующие преобразования:

 Очищение данных – устранение ненужной для последующего анализа информации.

 Агрегирование данных – вычисление суммарных, средних, минимальных и других показателей.

 Преобразование в единый формат. Производится в том случае, если одинаковые по наименованию данные в разных источниках имеют различный формат представления (например, дату в США записывают не так, как в нашей стране; в этом случае необходимо все даты представить в одной форме записи).

 Согласование во времени – обеспечение соответствия данных определенному моменту времени.

Рис. 36. Куб метаданных для управленческого анализа, усл. ед.

Основные отличия корпоративной БД от информационного хранилища представлены в табл. 8.

Таблица 8. Отличия корпоративной базы данных от информационного хранилища

Признак

Корпоративная база данных

Хранилище данных

Данные, содержащиеся в системе

Оперативные данные организации

Внутренние данные организации плюс внешние данные из других источников

Модели данных

Поддерживается реляционная модель данных

Поддерживается многомерная модель данных

Выполняемые запросы

Запросы по оперативным данным организации, отражающим ситуацию на настоящий момент времени

Оперативные и ретроспективные запросы, содержащие данные организации (и внешних организаций) как на настоящий момент времени, так и за предыдущие периоды

Попав в хранилище, данные становятся доступными для анализа при помощи различных средств построения отчетов. При этом сервер корпоративной БД ориентирован только на решение оперативных задач с заданной производительностью и не перегружен обработкой аналитических запросов. Данные загружаются в хранилище с определенной периодичностью, поэтому их актуальность несколько отстает от OLTP-системы. Данные, поступающие в хранилище, становятся доступными только для чтения.

Хранилище данных обычно содержит большой их массив за длительный период. Свойства данных, содержащихся в информационном хранилище, представлены в табл. 9.

Таблица 9. Свойства данных в информационном хранилище

Свойство

Описание

Предметная ориентация

Данные организованы в соответствии со способом их представления в предметных областях

Целостность

Данные объединены едиными наименованиями, едиными единицами измерения и т. д.

Отсутствие временной привязки

В отличие от корпоративных баз данных, в информационном хранилище содержатся данные, накопленные за большой интервал времени (годы и десятилетия)

Согласованность во времени

Данные соответствуют определенному моменту времени

Неизменяемость

Данные в информационных хранилищах не изменяются, они считываются из различных источников и доступны только для чтения

Типичной формой представления информации о бизнес-процессах (например, поставках материалов, сбыте, производстве) в хранилище являются многомерные кубы.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]