Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Для УМК БД.doc
Скачиваний:
46
Добавлен:
19.08.2019
Размер:
1.35 Mб
Скачать

207

1.Тема 1. Введение в базы данных (БД). Принципы построения БД. Этапы эволюции БД: системы обработки данных, использующих файлы с последовательным доступом. Переход от обработки данных к обработке информации. Понятие иерархических сетевых архитектур. Понятие реляционных БД, технология клиент-сервер, объектно-ориентированные БД.

В настоящее время жизнь человека, настолько насыщена разного рода информацией, что для управления ею требуется создание огромного количества баз и банков данных, используемых в различных отраслях деятельности.

Обработка данных развивалась от примитивных методов 50-х годов к сложным интерактивным системам сегодня.

Первые коммерческие компьютерные системы использовались в основном для ведения бухгалтерии, и такие системы были названы системами обработки данных.

Они полностью подражали тем функциям, которые могли быть выполнены вручную. Так, например, компьютерные файлы соответствуют папкам для бумаг. Такие файлы допускали лишь последовательный допуск к данным, что означало, что каждая запись в файле может быть прочитана и обработана только после того, как были прочитаны и обработаны все предшествующие записи.

Недостатки:

1. требовался большой объем памяти и большое время доступа к данным;

Вторым этапом явилась разработка систем, использующих файлы с произвольным доступом к данным, что дало возможность напрямую обращаться к конкретной записи без предварительной обработки файла (сортировки) или последовательного чтения все записей.

Недостатки:

1. избыточность данных;

2. недостаточные возможности по управлению данными;

3. большие трудозатраты программистов.

В конце 60-х гг. произошел переход от обработки данных и обработке информации.

Люди поняли, что информация-это не просто деловые записи. Данные, не увязанные между собой - мусор, и только объединенные и взаимоувязанные данные являются информацией, т.е. данные - это разрозненные факты. Информация - организованные и обработанные данные.

База данных (Б.Д.) - это множество взаимосвязанных единиц данных.

Система управления базой данных (СУБД) - программное обеспечение, осуществляющее управление базой данных.

Информационные системы, использующие базы данных, позволили преодолеть ограничения файловых систем.

1.1. Архитектура бд

БД имеют определенную архитектуру, т.е. данные, хранимые в базе, описываются некоторой моделью представления данных. К числу классических относятся следующие модели данных: иерархическая, сетевая, реляционная.

В конце 70-х гг. были разработаны иерархические и сетевые СУБД.

Иерархические СУБД - использовали модели данных, в которой связи между данными имеют вид иерархии.

Такую архитектуру характеризует наличие однонаправленных связей между объектами базы данных, т.е. это упорядоченный набор деревьев, где есть корень-предок и потомки-поддеревья. Последняя существующая иерархическая архитектура. СУБД DIAMS. У каждого потомка имеется только один предок. В иерархической СУБД все файлы связаны между собой физическими указателями, т.е. физическими адресами, где запись находится на диске.

Связи между данными в иерархической модели показаны на рис. 1.1.

 

 

 

 

 

Рис. 1. 1. Представление связей в иерархической модели

В этой модели каждая запись базы данных представляла конкретную деталь, между записями существовали отношения предок-потомок, связывающие каждую часть с деталями, входящими в нее, чтобы получить доступ к данным программа могла:

1. найти конкретную деталь по ее номеру.

2. перейти вниз к 1-му потомку.

3. Перейти вверх к предку.

4. Перейти в сторону к другому потомку.

Т.о., для чтения данных из базы данных требовалось перемещение по записям. Перемещение осуществлялось за счет указателей.

Между предками и потомками автоматически поддерживается контроль целостности связей, т.е.: потомок не может существовать без родителя, а у некоторых родителей может не быть потомков. Механизмы поддержания целостности связей между записями различных деревьев отсутствуют.

Достоинства: 1)эффективное использование памяти ЭВМ. 2)модель данных удобна для работы с иерархически упорядоченной информацией.

Недостатки: 1) громоздкость для обработки информации с достаточно сложными логическими связями, а также сложность понимания для обычного пользователя. 2) не все связи между данными можно представить в виде иерархии.

Сетевые архитектуры - характеризует то, что связи между объектами базы данных не упорядочены и представляют сеть, т.е. поддеревья-потомки, могут иметь любое число корней. В таких моделях также использовались физические указатели. Последняя существующая структура подобной архитектуры- базы данных . DB Vista.

Сетевая модель данных позволяет отображать разнообразные взаимосвязи элементов данных в виде произвольного графа, обобщая тем самым иерархическую модель данных (рис. 1.2).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рис. 1.2. Представление связей в сетевой модели

 

Сетевая БД состоит из набора записей и набора соответствующих связей. Если в иерархических структурах запись - потомок могла иметь только одну запись предка, то в сетевой модели данных запись - потомок может иметь произвольное число записей - предков (сводных родителей).

«+»: 1)возможность эффективной реализации по показателям затрат памяти и оперативности. 2)большие возможности в смысле допустимости образования произвольных связей.

«-»:1)высокая сложность схемы БД, построенной на ее основе, 2) сложность для понимания и выполнения обработки информации в БД обычным пользователем. 3)ослаблен контроль целостности данных связей.

В 1970 г. Е.Ф.Кодд предложил, что данные можно связывать в соответствии с их внутренними логическими взаимоотношениями, а не физическими указателями. Эта теория стала революционным событием в развитии базы данных.

Кодд предложил модель данных, в которой все данные связаны в таблицы, состоящие из строк и столбцов. Эти таблицы получили название реляций, а модель стала называться реляционной.

Для работы с ней в основе лежит аппарат реляционной алгебры и реляционного исчисления, которые обеспечивают работу с данными на основе логических характеристик, а не физических указателей.

В реляционной БД пользователь указывает данные, которые для него необходимы, а не то, как осуществить доступ к этим данным. Процесс перемещения по БД осуществляется автоматически. Реляционные БД выполняют и функцию каталога, в нем содержится описание всех объектов из которых состоит БД: триггеры, индекс, процедуры и таблицы.

В 1970 г. Кодд разработал правила реляционной модели:

1. Вся информация представлена в виде реляционных таблиц

2. Реляционная СУБД поддерживает три реляционных оператора (Выбор, Проектирование и Объединение), с помощью которых пользователь получает данные. Модель также поддерживает теоретико - множественные операции (Объединение, Пересечение, Дополнение).

3. Поддерживает логическую структуру данных не зависимо от их физического представления.

4. Использует язык высокого уровня для структурирования, выполнения запросов и изменения информации.

5. Поддерживает виртуальные таблицы, обеспечивая пользователям альтернативный способ просмотра данных

6. Обеспечивает механизмы для поддержки целостности, транзакции и восстановления данных.

Элементы РМД и формы их представления приведены в таблице 1.

Таблица.1 - Элементы реляционной модели

Элемент реляционной модели

Форма представления

Отношение

Таблица

Схема отношения

Строка заголовков столбцов таблицы (заголовок таблицы)

Кортеж

Строка таблицы

Сущность

Описание свойств объекта

Атрибут

Заголовок столбца таблицы

Домен

Множество допустимых значений атрибута

Значение атрибута

Значение поля в записи

Первичный ключ

Один или несколько атрибутов

Тип данных

Тип значений элементов таблицы

Итак, каждая таблица состоит из строк и столбцов, каждая строка  описывает отдельный объект, каждый столбец характеризует объект.

Каждый элемент данных или значения определяется пересечением строки и столбца. Для того чтобы знать требуемый элемент надо знать: 1) имя табл. 2) значение РК или уникального идентификатора.

Для реляционных БД характерна независимость на физическом и логических уровнях.

Свойства отношений:

1. Отношение не должно содержать двух одинаковых картежей.

2. Картежи не упорядочены сверху вниз

3. Атрибуты в заголовке располагаются произвольно

4. Значения атрибутов состоят из логически не делимых единиц.

Реляционная модель представляет собой логически связанные между собой сущности.

Типы связей:

1. один - ко - многим. (каждому значению одного объекта соответствует множество значений другого объекта)

2. один - к - одному

3. многие - ко - многим. (Надо разбивать)

Примером Объектно-реляционной СУБД можно считать продукты Oracle 8.x

Дальнейшим развитием реляционной базы данных является создание объектно-ориентированной базы данных и переход в работе на технологию клиент-сервер.

Система клиент-сервер - это локальная сеть, состоящая из клиентов-компьютеров, которую обслуживает компьютер-сервер.

Сервер базы данных - это программа, которая запускается на машине-сервере и обслуживает доступ клиентов к базе данных.

Сервер обслуживает запросы клиентов по доступу к базе данных, обновлению данных, защите данных, резервному копированию и т.д., сервер обслуживает сразу несколько клиентов.

Клиент - обрабатывает информацию. Возможны следующие конфигурации:

C.1.2.Объектно-ориентированная БД.

В объектно-ориентированной модели при представлении данных имеется возможность идентифицировать отдельные записи базы. Между записями БД и функциями их обработки устанавливаются взаимосвязи с помощью механизмов. Структура объектно-ориентированной БД (ООБД) графически представима в виде дерева, узлами которого являются объекты. Свойства объектов описываются некоторым стандартным типом (например, строковым - string) или типом, конструируемым пользователем (определяется как class).

Значением свойства типа string является строка символов. Значение свойства типа class есть объект, являющийся экземпляром соответствующего класса. Каждый объект - экземпляр класса считается потомком объекта, в котором он определен как свойство. Объект - экземпляр класса принадлежит своему классу и имеет одного родителя. Родовые отношения в БД образуют связную иерархию объектов.

Объекты, имеющие одного и того же родителя, должны различаться по крайней мере инвентарным номером, но должны иметь одинаковые значения свойств.

Поиск в ООБД состоит из выяснения сходства между объектом, задаваемым пользователем, и объектами, хранящимися в БД.

«+» 1)модель данных позволяет идентифицировать отдельную запись БД и 2) определять функции их обработки.

«-» 1)высокая сложность восприятия, 2)неудобство обработки данных и 3)низкая скорость выполнения запросов.

Итак, если рассматривать эволюцию развития систем, направленных на обработку и управления информацией можно выделить следующие этапы:

Рисунок 1.3. Эволюция развития систем, направленных на обработку и управления информацией

Положительным моментом организации ИС по архитектуре клиент - сервер является удачное сочетание централизованного хранения, обслуживания и коллективного доступа к общей корпоративной информации и индивидуальной работой пользователей над персональной информацией.

Исторически первыми появились распределенные ИС с применением файл - сервера (?рис.2). Файлы БД передаются на персональные компьютеры, где производится их обработка. Недостаток такого варианта архитектуры - передача избыточных данных.

Структура распределенной ИС, построенной по архитектуре клиент - сервер с использованием сервера БД, показана на ?рис. .3. При такой архитектуре сервер БД обеспечивает выполнение основного объема обработки данных. Формируемые пользователем или приложением запросы поступают к серверу БД в виде инструкций языка SQL. Сервер БД выполняет поиск и извлечение нужных данных, которые затем передаются на компьютер пользователя. «+» такого подхода в сравнении с предыдущим является заметно меньший объем передаваемых данных.

Для создания и управления персональными БД и приложений, работающих с ними, используются СУБД, такие как Access и Visual FoxPro фирмы Microsoft, Paradox фирмы Borland.

Корпоративная БД создается, поддерживается и функционирует под управлением сервера БД, например Microsoft SQL Server или Oracle Server.

В зависимости от размеров организации и особенностей решаемых задач ИС может иметь одну из следующих конфигураций:

1. компьютер - сервер, содержащий корпоративную и персональные базы;

2. компьютер - сервер и персональные компьютеры с ПБД;

3. несколько компьютеров - серверов и персональных компьютеров с ПБД.

Использование архитектуры клиент - сервер дает возможность постепенного наращивания ИС предприятия, во-первых, по мере развития предприятия, во-вторых, по мере развития самой ИС.

Разделение общей БД на корпоративную БД и персональные БД позволяет уменьшить сложность проектирования БД, а значит снизить вероятность ошибок при проектировании и стоимость системы.

Важнейшим достоинством применения БД в ИС является обеспечение независимости данных от прикладных программ.