Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ПЛЕЩ.docx
Скачиваний:
47
Добавлен:
13.05.2015
Размер:
3.97 Mб
Скачать

1.3.8.5. Связывание таблиц

Таблицы обычно связываются попарно через ключи связи (п. 1.3.1). Ключи связи должны быть одинакового типа в родительской и дочерней таблицах. Связи бывают постоянные и временные. Постоянные связи уста­нав­ливаются до выполнения прикладной программы при создании логи­че­с­кой модели данных (обычно визуальными средствами). Этими связями можно пользоваться в прикладной программе. Временные связи уста­нав­ли­ваются при выполнении прикладной программы (в FoxPro командой Set Relation, в языке SQL– в фразахJOINиWHEREоператораSELECT) и удаляются после ее выполнения. Использование связанных таблиц существенно упрощает пользователю обработку таблиц (так, пере­ме­щаясь по родительской таблице, происходит автоматическое перемещение по ее дочерним таблицам по условию равенства ключей связи), автома­ти­чес­ки обеспечивая контроль целостности (п. 1.3.5). Дочерняя таблица должна иметь индекс по ключу связи.

1.3.9. Постреляционная модель

Во многом нормализация отношений нарушает естественные иерархические связи между объектами, которые достаточно распространены в нашем мире. Возможность сохранять их на концептуальном (но не па физическом) уровне позволяет пользователям более естественно отражать семантику предметной области. В настоящий момент уже существует теоретическое обоснование работы с ненормализованными отношениями и практические реализации подобных систем.

Постреляционная модель ‑ это реляционная модель, допускающая многозначные поля (атрибуты), т.е. само поле может быть таблицей.

Пример. Имеется реляционная база из двух таблиц:

НАКЛАДНЫЕ (номер накладной, дата поставки, код поставщика).

ТОВАРЫ (номер накладной,код товара, количество, единица измерения).

Ее можно перевести в постреляционную базу из одной таблицы:

НАКЛАДНЫЕ‑ТОВАРЫ (номер накладной, дата поставки, код поставщика, то­ва­ры в накладной).

Поле “Товары в накладной” является таблицей “ТОВАРЫ”.

Достоинство: уменьшение числа таблиц в базе, что повышает на­­г­ляд­­ность представления данных, не требует операции соединения двух таб­лиц при выполнении программы, повышает эффективность хранения и обработки данных.Недостатки:проблема обеспечения целостности и не­про­ти­воречивости данных (используются не нормализованные таблицы).

Примеры СУБД: uniVers, Bubba, Dasdb.

1.3.10. Многомерная модель

Информация, накопленная в базах данных, является чрезвычайно ценным материалом, и в настоящий момент широко распространяются методы обработки баз данных с точки зрения извлечения из них дополнительных знаний, методов, которые связаны с обобщением и различными дополнительными способами обработки данных (содержание данного пункта скопировано из работы [19]). Базы данных в данной концепции выступают как хранилища информации, это направление называется «Хранилища данных» (Data Warehouse).

Для работы с «Хранилищами данных» наиболее значимым становится так называемый интеллектуальный анализ данных (ИАД), или data mining. На рынке программных продуктов стали появляться соответствующие инструментальные средства. Особенно широко методы ИАД применяются в бизнес-приложениях аналитиками и руководителями компаний. Для этих категорий пользователей разрабатываются инструментальные средства высокого уровня, позволяющие решать достаточно сложные практические задачи без специальной математической подготовки.

В бизнес-приложениях наибольший интерес представляет интеграция методов интеллектуального анализа данных с технологией оперативной аналитической обработки данных (On-Line Analytical Processing, OLAP). OLAP использует многомерное представление агрегированных данных для быстрого доступа к важной информации и дальнейшего ее анализа.

Системы OLAP обеспечивают аналитикам и руководителям быстрый последовательный интерактивный доступ к внутренней структуре данных и возможность преобразования исходных данных с тем, чтобы они позволяли отразить структуру системы нужным для пользователя способом. OLAP-системы позволяют просматривать данные и выявлять имеющиеся в них закономерности либо визуально, либо простейшими методами (такими как линейная регрессия), а включение в их арсенал нейросетевых методов обеспечивает существенное расширение аналитических возможностей.

В основе концепции оперативной аналитической обработки (OLAP) лежит многомерное представление данных. Термин OLAP ввел Кодд (Е. F. Codd) в 1993 году.

Одновременный анализ по нескольким измерениям данных определяется как многомерный анализ. Каждое измерение включает направления интеграции данных, состоящие из серии последовательных уровней обобщения, где каждый вышестоящий уровень соответствует большей степени агрегации данных по соответствующему измерению. Так, измерение Исполнительможет определяться направлением консолидации, состоящим из уровней обобщения «предприятие–подразделение–отдел-служащий». Измерение Время может даже включать два направления консолидации – «год–квартал–месяц–день» и «неделя–день», поскольку счет времени по месяцам и по неделям несовместим. В этом случае становится возможным произвольный выбор желаемого уровня детализации информации по каждому из измерений. Операция спуска (drilling down) соответствует движению от высших ступеней консолидации к низшим; напротив, операция подъема (rolling up) означает движение от низших уровней к высшим.

Многомерная модель ‑ узкоспециализированная модель, пред­наз­на­чен­­ная для хранения данных в виде многомерного массива (гиперкуба), исполь­зуемых системами оперативной аналитической обработки типа OLAP или систем поддержки принятия ре­ше­ний DSS(DecisionSupport.System, примерMSDSS).

Пример. Объем продаж автомобилей по маркам автомобилей, годам и городам мож­но представить в виде трехмерной модели (куба со сторо­нами: марки автомобилей, годы, города и с ячейками ‑ количество про­дан­ных автомо­би­лей) вместо реляционной (таблицы с полями: марка автомо­би­ля, год про­да­жи, город и количество проданных автомобилей). Куб бо­лее нагляден, чем таблица, и с ним удобнее и быстрее работать.

Рассмотрим ряд терминов этой модели.

Агрегируемость данныхозначает наличие различных уровней обобщения информации (аналитик, пользователь, руководители различных рангов).

Историчность данныхподразумевает привязку данных ко времени (на­ли­­чие временных рядов).

Прогнозируемость данныхпредполагает их использование в процедурах прогнозирования на различные временные периоды.

Срез (Slice)‑ подмножество гиперкуба, полученное в результате фиксации одного или нескольких измерений.

Пример.Если ограничить значения измерения “Марка автомобиля” мар­кой “ВАЗ 2105”, то получим двухмерную таблицу продажи авто­мо­би­лей этой марки по городам и годам.

Вращение (Rotate)‑ вращение гиперкуба (местоположение отдельных осей меняются местами).

Агрегация/детализация (Drill Up/Down)‑ переход к более общему/деталь­но­му представлению информации пользователю из гиперкуба.

Пример.Можно сформировать итоговую таблицу продаж автомо­би­лей (независимо от их марок) по городам и годам.

Достоинства:удобство и эффективность аналитической об­работки больших объемов данных.Недостаток:гро­мозд­кость и не эффективность для простой опера­тив­ной обработки небольших объемов данных.

Примеры СУБД: Essbase (Arbor Software), Media Multi‑matrix и Media/MR (Speedware), Oracle Express Server (Oracle), Cache.