Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
shpory1-9.doc
Скачиваний:
4
Добавлен:
23.09.2019
Размер:
110.59 Кб
Скачать

3. Требования, предъявляемые к базам данных в сппр.

Системы, ориентированные на оперативную обработку данных – системы оперативной обработки транзакций (OLTPOnLine Transaction Processing), не удовлетворяют требованиям, предъявляемым к СППР. Это объясняется различными требованиями, предъявляемыми к OLTP‑системам и СППР .

Характеристики, требования к которым отличаются в OLTP‑системах и СППР.

Цели использования системы – для OLTP-систем приоритетными является высокая производительность и доступность данных, т. к. работа с ними ведется в режиме реального времени. Для OLTP-систем характерны простейшие алгоритмы обработки. Для СППР характерна аналитическая обработка с целью поиска закономерностей, построения прогнозов и моделей.

Степень детализации хранимых данных – типичный запрос в OLTP‑системе выборочно затрагивает отдельные записи в базе данных, которые эффективно извлекаются с помощью индексов. В СППР требуется выполнять запросы сразу над большим кол-вом данных с широким применением группировок и обобщений (агрегирования) данных, например, вычисления сумм, средних значений, максимумов и минимумов.

Качество данных – OLTP-системы хранят инф-цию, вводимую непосредственно пользователями систем, что повышает вероятность ошибочных данных и может создать локальные проблемы в системе. При анализе ошибочные данные могут привести к неправильным выводам и принятию неверных стратегических решений.

Формат хранения данных – OLTP-системы, обслуживающие различные участки работы, мб не связаны между собой. Одни и те же данные в разных базах мб представлены в различном виде и могут не совпадать. В процессе анализа такое различие форматов чрезвычайно затрудняет совместный анализ этих данных. Поэтому к системам анализа предъявляется требование единого формата. Необходимо, чтобы этот формат был оптимизирован для анализа данных (нередко за счет их избыточности).

Допущение избыточных данных – базы данных, используемые в OLTP-системах, нормализуются. Тем самым уменьшается объем действий, необходимых для обновления информации. В аналитических системах данные практически не обновляются, производится лишь накопление данных и их чтение. В то же время использование нормализованных данных для анализа приводит к необходимости соединения многих таблиц, что замедляет выполнение анализа. Поэтому в СППР используются ненормализованные данные.

Хронологическая упорядоченность данных – реляционная модель данных не предполагает упорядоченности данных. Упорядочиваются только результаты поиска. Выполнение многих аналитических запросов, например, анализ тенденций и прогнозирование требуют хронологической упорядоченности данных. Поэтому в СППР для повышения скорости работы целесообразно хронологически упорядочивать данные.

Управление данными – основное требование к OLTP‑системам – обеспечить выполнение операций модификации баз данных. При этом предполагается, что модификации должны выполняться в реальном режиме, и часто очень интенсивно. В системах анализа данные меняются редко. Попав в систему, данные уже практически не изменяются. Ввод новых данных, как правило, носит эпизодический характер и выполняется в периоды низкой активности системы (например, раз в неделю в выходные).

Объем хранимых данных – как правило, системы анализа предназначены для анализа временных зависимостей, в то время как OLTP-системы обычно имеют дело с текущими значениями каких-либо параметров. Например, типичное складское приложение OLTP оперирует с текущими остатками товара на складе, в то время как в системе анализа может потребоваться анализ динамики продаж товара. По этой причине в OLTP-системах допускается хранение данных за небольшой период времени (например, за последний квартал). Для анализа данных, наоборот, необходимы сведения за максимально большой интервал времени. Поэтому аналитические базы имеют значительно больший объем, чем оперативные базы.

Время хранения данных – в OLTP-системах данные хранятся в пределах отчетного периода (как правило, в течение года). В СППР данные хранятся годы и десятилетия.

Характер запросов к данным – в OLTP-системах из-за нормализации БД составление запросов является достаточно сложной работой и требует определенной квалификации. Поэтому для таких систем заранее составляется некоторый ограниченный набор статических запросов к БД, необходимый для работы с системой (например, наличие товара на складе, размер задолженности покупателей и т. п.). Для СППР невозможно заранее определить необходимые запросы, поэтому к ним предъявляется требование обеспечить формирование произвольных запросов к БД аналитиками.

Время обработки обращений к данным – OLTP-системы работают в режиме реального времени, поэтому к ним предъявляются жесткие требования по времени обработки данных. В системах анализа обычно выдвигают значительно менее жесткие требования ко времени выполнения запроса. При анализе данных аналитик может потратить больше времени для проверки своих гипотез. Его запросы могут выполняться в диапазоне от нескольких минут до нескольких часов.

Характер вычислительной нагрузки на систему – работа с OLTP-системами выполняется в режиме реального времени. В связи с этим такие системы нагружены равномерно в течение всего интервала времени работы с ними. В аналитических системах при выполнении запросов степень загрузки системы высокая, т. к. обрабатывается большое количество данных, выполняются операции суммирования, группирования и т. п. Но обращения к БД в аналитических системах выполняются неравномерно в течение работы с ними.

Противоречивость требований к OLTP‑системам и системам, ориентированным на глубокий анализ информации, усложняет задачу интеграции их как подсистем единой СППР. В настоящее время наиболее популярным решением этой проблемы является подход, ориентированный на использование концепции хранилищ данных. Общая идея хранилищ данных заключается в разделении БД для OLTP-систем и БД для выполнения анализа и последующем их проектировании с учетом соответствующих требований. В СППР эти два типа баз данных называют оперативными источниками данных (ОИД) и хранилищем данных (ХД).

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]