Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Теория БД (текст).doc
Скачиваний:
23
Добавлен:
14.04.2015
Размер:
1.1 Mб
Скачать

Проектирование Баз Данных 18

I. Моделирование данных

0. Введение.

В конце 60-х, начале 70-х годов появилась техническая база, позволяющая хранить большие объемы информации, и возникли вопросы, как организовать хранение и накопление данных с тем, чтобы время выбора необходимой информации было приемлемым.

К этим задачам на первых порах относятся задачи административного управления: кадровые задачи, учет материальных ценностей, далее это распространилось на учет в медицинских и других учреждениях.

В отличие от задач математики, где, как правило, расчет локализован во времени, т.е. за один выход на ЭВМ выполняется полный цикл решения: ввод, счет, выдача результатов, в информационных задачах исходные данные накапливаются постепенно и в процессе вычислений могут использоваться многократно, при различных выходах на ЭВМ.

Потребность обработки больших объемов информации привела к разработке математического обеспечения интегрированных баз данных. Слово "интегрированная" означает, что в базе данных собраны, объединены, интегрированы данные различных пользователей этих данных.

Под БАЗОЙ ДАННЫХ понимается совокупность хранимых операционных данных, используемых прикладными программами некоторого предприятия. Под предприятием здесь понимается совокупность людей, объединенных определенным общим видом деятельности в области науки, экономики, техники и т.д. Примерами предприятий являются завод, банк, больница, учебное заведение и т.п.

В процессе деятельности предприятия требуется большое количество данных, отражающих работу этого коллектива. Эти данные необходимо хранить, обновлять, выбирать в требуемом ракурсе. Достаточно важной характеристикой является время возникновения или обновления данных.

В

Рис.1 Примерная модель некоторого предприятия.

качестве примера можно рассмотреть данные о некотором предприятии, выпускающем продукцию (рис.1)

Для нормального управления предприятием руководство должно знать структуру ОТДЕЛОВ, в которых работают СЛУЖАЩИЕ как по изготовлению некоторых ДЕТАЛЕЙ, так и над проектированием новых. Кроме того, необходимо знать основные сведения о ПОСТАВЩИКАХ различных узлов, из которых собираются детали, наличии узлов и уже изготовленных деталях на СКЛАДАХ, и в производственных помещениях (ЦЕХАХ). Конечно, мы отразили функционирование предприятия лишь в общих чертах; для реального управления требуется существенная детализация той информации, которую необходимо хранить.

Мы перечислили те ОБЪЕКТЫ, (конечно, только часть их), которые характеризуют предприятия.

Важно отметить, что между различными объектами существуют СВЯЗИ или ОТНОШЕНИЯ, характеризующие взаимозависимость между ними, допустимые сочетания между объектами одного и того же или различных типов. Мы предпочитаем использовать термин связь, так как термин отношение используется в реляционных базах данных для обозначения хранимых данных.

Связи между объектами являются такими же данными, как и информация об объектах и, следовательно, данные о связях должны храниться в базе данных.

Обычно связи объединяют два объекта (бинарная связь), но бывает и иначе. В данном случае, например, определенные поставщики поставляют детали, необходимые для определенного проекта. Это не то же самое, что 2 бинарные связи: поставщики поставляют детали и детали используются в проекте. Различие проявится, если одни и те же детали могут выпускаться различными поставщиками и использоваться в различных проектах.

На рис.1 отражены только ТИПЫ ОБЪЕКТОВ, а для каждого типа может быть несколько ЭКЗЕМПЛЯРОВ объектов. Между некоторыми из этих экземпляров в свою очередь может существовать связь. Именно такого рода связи отражаются линиями выходящими из и входящими в один и тот же тип объекта.

Между двумя объектами может быть несколько связей: Служащий работает над проектом; Служащий руководит проектом.

Почему все-таки ИНТЕГРИРОВАННАЯ?

Раньше для каждой задачи создавались свои массивы данных с различным способом хранения, различными местами хранения и т.п. Как правило, это приводило к дублированию информации в разных задачах об одних и тех же объектах. Нам же нужно ЦЕНТРАЛИЗОВАННОЕ УПРАВЛЕНИЕ.

Учитывая централизацию управления, возникает необходимость звена, отвечающего за интегрированные данные. Такой человек (или группа людей) называется АДМИНИСТРАТОРОМ БАЗЫ ДАННЫХ (АБД). Таким образом, база данных предполагает совокупность данных, программ, оборудования и персонала, отвечающего за их работоспособность. (По аналогии с производственным предприятием администратор базы данных выполняет те же функции что главный инженер и главный технолог одновременно).

Централизованное управление имеет ряд преимуществ. Однако реализация этих преимуществ требует решения ряда проблем, некоторые из которых приведены ниже:

¨ Избыточность данных.

¨ Противоречивость.

¨ Совместное использование. На существующей базе данных можно строить новые предложения, решать новые задачи.

¨ Вопросы стандартизации.

¨ Безопасность данных, т.е. можно регулировать доступ к данным.

¨ Целостность данных = достоверность данных. Интегрирование базы данных позволяет расширить систему косвенного контроля данных, т.к. могут возникнуть зависимости между данными различных задач.

Учитывая эти замечания, необходимо отметить важное качество, которому должны удовлетворять базы данных - НЕЗАВИСИМОСТЬ ДАННЫХ, которая отражается двумя основными моментами:

¨ Форма задания конкретного значения (символьное, двоичное, десятичное).

¨ Структура хранимых данных.

В обоих случаях в конкретном приложении (реализации некоторой задачи) для пользователя должно быть безразлично, в каком виде хранятся данные; он должен получить их в таком виде и по той структуре, как это ему удобно в данном конкретном приложении.