Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Структурный подход к организации баз данных

..pdf
Скачиваний:
4
Добавлен:
12.11.2023
Размер:
14.79 Mб
Скачать

ШАтре

СТРУКТУРНЫЙ

подход

К ОРГАНИЗАЦИИ БАЗ ДАННЫХ

Перевод с английского А. А. АЛЕКСАНДРОВА и В. И. БУДЗКО

Под редакцией В. И. БУДЗКО

МОСКВА «ФИНАНСЫ И СТАТИСТИКА» 1983

СТРУКТУРНЫЙ

подход

К ОРГАНИЗАЦИИ БАЗ ДАННЫХ

о м а бабе:

5ТК1ХТШЕО

ТЕСНМОЦВ

РОК ОЕ5КЗГЧ РЕКРОКМАЫСЕ, А № МА1МАЗЕМЕ1МТ

уЛЬСазе $1цс1|е5

5. А)ге

А ^Пеу-1п1егзс1епсе РиЪНсайоп

.ЮНЫ АУН.ЕУ & 50Ы5

Уогк • СЫсНе51ег *ВпзЪапе • Тогоп1о

ББК 32.973

А92

А 240500000° - 171 127—83 010(01)—83

©1980, ЛоНп ШПеу & Бопз, 1пс.

©Перевод на русский язык, предисловие, «Финансы и статистика», 1983

Предлагаемая советскому читателю книга Ш. Атре «Структурный подход к организации баз данных» посвящена важным проблемам создания и эксплуатации информационной системы (ИС) с базой данных (БД). Книга может служить хорошим методическим пособием в органи­ зации работы коллектива специалистов, ответственных за проектирование и эксплуатацию БД, а также при разработке моделей данных различ­ ного уровня (концептуального, внешнего, логического и физического) с учетом информационных потребностей предметной области, возможно­ стей используемой системы управления базами данных (СУБД) и дости­ жения требуемых эксплуатационных характеристик ИС.

Ш. Атре в течение нескольких лет работала в качестве препода- вателя-консультанта Института системных исследований фирмы 1ВМ, в настоящее время — консультант той же фирмы по обработке данных. Ее лекции пользуются большой популярностью в АСМ (Аззоаайоп {ог СошриНпе МасЫпегу) и ЭРМА фа1а Ргосеззш^ Мападетеп! АззоааНоп), а также других профессиональных ассоциациях США, Англии, Бельгии, ФРГ, Голландии, Индии и Сингапура.

Всего лишь десятилетие назад сочетание слов «база данных» зву­ чало для разработчиков программного обеспечения ИС одновременно и привлекательно, и таинственно. Однако постепенно с распростране­ нием и совершенствованием СУБД, накоплением опыта их использо­ вания, изданием отечественных и зарубежных монографий по этой пробле­ матике ИС с базами данных заняли подобающее место практически во всех областях обработки информации. Может показаться, что многие, если не все проблемы, связанные с созданием и эксплуатацией БД, успешно решены. В действительности это не так, или по крайней мере не совсем так. Читатель, интересующийся различными аспектами работы с БД, убедится в этом, ознакомившись с книгой Ш. Атре.

Прежде всего следует отметить, что при постоянном увеличении объема и сложности БД возрастает значение адекватности их структуры и наполнения требованиям по обработке информаций, предъявляемым конкретными предметными областями (предприятиями, организациями и т. д.). Информация хранится в БД в соответствии с некоторой моделью данных (МД), созданной в процессе проектирования . БД. Отображаемая в базе данных модель данных должна не только соответствовать текущим информационным потребностям предметной области, но и в максимальной степени обеспечивать возможность их изменения и расширения, т. е. предоставлять определенный уровень независимости данных (физический и логический). Как известно, по­ пытка создания согласованного подхода к определению архитектуры СУБД, гарантирующего высокий уровень независимости данных и позво­ ляющего добиться унифицированного принципа проектирования, была

предпринята в 1975 г. исследовательской группой АЫ51/ХЗ/5РАКС*. Последняя ставила целью определить области, если таковые имеются, технологии БД, в которых было бы уместно проводить стандартизацию, и предложить, свои рекомендации для последующей работы в каждой из этих областей. В соответствии с отчетом исследовательской группы «идеальная» СУБД должна обеспечивать три основных уровня представле­ ния данных:

• уровень внешних моделей, ориентированных на пользователей,

.• уровень внутренней модели физического хранения,

уровень концептуальной модели, которая составляет представление общего содержания БД.

Каждая модель определяется соответствующей схемой. Центральное место в подобном многоуровневом представлении дан­

ных занимает концептуальная модель, поскольку именно она учитывает информационные потребности предметной области. При этом минимальные возможности, которыми должны обладать наборы определения концепту­ альной схемы,— способность задания элементов данных и взаимосвя­ зей между ними. Такие возможности предоставляют различные типы моделей данных — иерархические, сетевые и реляционные. Поскольку они задают фактически лишь структуру данных и слабо определяют ограниче­ ния на действия с ними, то их относят к семантически слабым типам моделей. Соответственно семантическая мощность концептуальной модели возрастает с увеличением количества дополнительных харак­ теристик (например, контроль полномочий, процедуры проверки достовер­ ности данных и т. д.), которое она позволяет определять. Как отмечалось в книге К. Дейта «Введение в системы баз данных», некоторые авторитетные специалисты заходят так далеко, что предла­ гают считать основной целью концептуальной схемы описание всего предприятия или какой-либо другой подлежащей автоматизации пред­ метной области, т. е. не только его операционных данных, но и того, как эти данные используются.

Примером семантически мощного средства выражения концептуаль­ ной схемы является инфологический подход Сандгрена и Лангефорса, имеющий много общих пунктов с предложениями группы АЫ51/ХЗ/ 5РАКС, но разработанный несколькими годами раньше **

Возможность задания концептуальной модели в большинстве сов­ ременных СУБД отсутствует либо полностью, либо в виде, предложен­ ном в отчете группы АЫ51/ХЗ/5РАКС. Несовместимость на различных уровнях между основными СУБД делает процесс проектирования МД существенно зависимым от конкретной системы. Несмотря на это, представляется важным строить концептуальную модель на соответствую­ щем уровне абстракции, даже если определяющая ее схема будет записана только на бумаге. Вообще говоря, так и происходит на Практике. Каждая ИС в той или иной степени «моделирует» соответствующую предметную область, т. е. отображает те объекты и

взаимосвязи между ними, которые были

выделены на стадии проекти­

* АЫ51/ХЗ/5РАПС 31ис1у Сгоир оп Оа1а

Вазе Мапа^ешеп!

5уз1етз.— 1п1епш

Керог*. РЭТ (Ви11е«п о* АСМ ЗЮМСЮ) 7, N0 2,

1975.

АрргоасЬ 1о Оа1а

** 5 и п (1§геп В. Сопсер1иа1 РоипсЫюп

о! 1Ье 1пЫо§рса1

Вазез. Ргос. 1Р1Р ТС-2 Шогкт§ Соп1егепсе оп Оа1а Вазе Мападетеп! 5уз1етз. Ыог1Н-Но11апс1, 1974.

Ь а п^ е Го г з В. ТЬеогеИса! Апа1уз1з о! ЫогтаПоп Зуз1етз. 1лт<1, 3\ге<1еп, 1973.

рования в соответствии с подлежащими решению задачами, другими словами, концептуальными требованиями. В рамках каждой ИС эти требования объединяются в некоторый единый обобщенный взгляд — концептуальную модель, в большинстве случаев закрепляемую словесным или структурным описанием. При этом, правда, отсутствуют единые стан­ дарты ее представления и, что самое главное, методика разработки.

В концептуальной модели с начала ее создания, как правило, сразу же учитываются ограничения, накладываемые программным обеспечением, в частности СУБД, что требует ее трансформации в совместимый с СУБД вид — логическую модель. В результате концептуальная модель перестает быть таковой. Это может привести к «нивелированию» отдельных и иногда важных требований, которым должна удовлетворять ИС и ее БД, вызывает необходимость привлечения уже на начальной стадии проектирования высококвалифицированных специалистов по конкретной СУБД. Процесс выбора СУБД в этих условиях трудно формализуем. Поэтому создаваемая концептуальная модель должна основываться на определенном представлении данных, а не зависеть от конкретной СУБД.

В книге Ш. Атре проблеме построения концептуальной модели предметной области и ее увязывания с другими моделями данных, поддерживаемыми конкретными СУБД, уделяется основное внимание: этой проблеме посвящена часть 2 «Проектирование базы данных (концептуальная и логическая модели)». Поскольку концептуальное представление должно обладать простотой и достаточным теоретическим обоснованием, автор использует для его создания реляционную модель. Концептуальная схема задается в виде нормализованных до третьей

нормальной формы отношений. Описание процесса нормализации с практических позиций позволяет освоить его лицам, не имеющим

специальной подготовки. Наиболее распространенные современные СУБД, основанные на иерархическом и сетевом представлении данных, а также выделяемый автором класс СУБД с инвертированными файлами, факти­ чески обеспечивают только двухуровневое представление данных, при котором внешние модели составляют отдельные части от логической, поддерживаемой СУБД. Поэтому важное практическое значение имеет рассматриваемая методика трансформации созданной концептуальной модели в логическую модель иерархической или сетевой структуры с учетом накладываемых ограничений.

Кроме создания адекватной МД перед проектировщиком БД стоит еще ряд серьезных задач, включая обеспечение физической организации БД с необходимыми временными характеристиками ИС и минимально возможными требованиями к внешней памяти. Нельзя упускать из виду эксплуатационные характеристики ИС, которые могут «деградировать» в процессе выполнения операций по ведению БД (увеличение объема неис­ пользуемой памяти, степень рассогласования логического и физического порядка следования записей и т. д.). Восстановление эксплуатационных характеристик БД достигается за счет регулярного выполнения реоргани­ зации БД при помощи специальных служебных программ.

Другая важная проблема эксплуатации — обеспечение целостности БД в условиях возникновения различного вида отказов. И здесь необ­ ходимо пользоваться некоторой стратегией восстановления, включающей регламентные действия (полученные страховочные копии БД, запись контрольных точек и т. д.) и заданные для каждого типа отказа процедуры восстановления.

При переходе от файловой организации к БД необходимо вы­ полнить преобразование данных из старого состояния в новое. Это может потребовать значительных затрат на программирование, а также определенных ресурсов ЭВМ на сам перевод. Как правило, в та­ ких условиях эксплуатация старого варианта системы продолжается до тех пор, пока новый не обеспечит тех же информационных возможно­ стей. Один из путей снижения затрат на программирование — использова­ ние универсальных программных комплексов трансляции данных. Приме­ ром может служить созданная в Международном центре научной и техни­ ческой информации стран — членов СЭВ система конвертирования данных (СКОФ).

В процессе эксплуатации требуется выявить все основные факторы, влияющие на производительность. Эта задача существенно усложняется при работе в мультипрограммной среде, в условиях мультидоступа к БД. Анализ производительности должен проводиться комплексно, с учетом всех основных компонент, влияющих на время отклика системы. При этом не следует упускать из виду такие компоненты, как время планирования транзакции, время загрузки прикладной программы в основ­ ную память, время завершения прикладной программы. Они могут пре­ вышать время, затрачиваемое на ввод-вывод при обращении прикладной программы к СУБД, которому, как правило, уделяется основное внимание.

Всем этим проблемам реорганизации и реструктуризации БД, обеспечения ее целостности, перевода данных из существующих файлов в БД, оценки и улучшения эксплуатационных характеристик ИС, а также обеспечения необходимого уровня защиты данных от несанкциони­ рованного доступа и секретности посвящена третья часть книги «Реализация базы данных».

Следует отметить, что Ш. Атре подробно рассматривает функции, значение и состав группы администрирования БД, отводя ей центральное место среди других подразделений предприятия или организации, связанных с обработкой данных.

Книгу Ш. Атре можно рассматривать как введение в проектирова­ ние ИС. Она отличается простотой изложения и изобилует достаточно представительными примерами. Автор не перегружает текст книги вспомогательным материалом из теории программирования или вычисли­ тельной техники, что делает его доступным и студентам вузов, и административным работникам. Без сомнения русский перевод книги Ш. Атре займет достойное место среди последних публикаций по проблемам БД и ИС.

В. И. Будзко

Мы вступаем в этап, когда стоящие перед нами проблемы невозможно решить без применения ЭВМ. Я не испытываю страха перед ЭВМ. Меня страшит их отсутствие.

Айзек Азимов

Революция в области вычислительной техники обещает упростить и облегчить нашу жизнь, повысить жизненную активность до такой степени, о которой не могли мечтать даже утописты. Сейчас в организациях раз­ личных типов ЭВМ хранит и осуществляет поиск громадного количества информации. При этом во всех отраслях промышленности, медицинском обслуживании, финансовых учреждениях и правительственных ведомствах объем обрабатываемых данных возрастает в геометрической прогрессии, и очень трудно представить, как они смогли бы функционировать без ЭВМ. Различные организации мы будем далее называть предметными областями.

Основу всей вычислительной системы любой предметной области составляет хранилище информации, называемое базой данных.'Поэтому, вероятно, есть две наиболее важные проблемы, связанные с обработкой информации: 'проектирование и реализация базы данных.

К настоящему времени по данной проблематике издано множество статей и книг, дающих общее представление о предмете или содер­ жащих обзор существующих систем управления базами данных и моделей данных. Но ни одна из них не отвечает на следующие специфичные вопросы. Каковы функциональные обязанности лиц, связанных с проекти­ рованием и реализацией базы данных? Как обеспечить проектирование базы данных, удовлетворяющей заданным эксплуатационным требовани­ ям? Какие проблемы могут возникнуть на различных этапах?

В книге делается попытка ответить на поставленные вопросы. В ней демонстрируются принципы проектирования базы данных, призванные способствовать достижению функциональных возможностей и эксплуата­ ционных характеристик, удовлетворяющих требованиям среды обработки

информации. В книге приводится распределение функциональных обя­ занностей между администраторами базы данных, системными программи­

стами, системными аналитиками, прикладными программистами, руково­ дителями обработки информации, руководителями обработки данных и пользователями базы данных. Материал излагается в простой форме, но без упрощений, и шаг за шагом раскрывает принципы проектирова­ ния базы данных. Главы располагаются в порядке прохождения этого процесса. Предлагаемая методология не зависит от какого-либо программ­ ного пакета. Она также не привязана к определенной промышленной системе управления базами данных.

Книга может оказаться полезной лицам, занимающимся практи­ ческой деятельностью в области экономики и управления, а также составить основу односеместрового курса специализированного или техни­ ческого колледжа, студентам которого необходимо знать, «как» и «пбчему» следует организовывать обработку информации.

Изложение материала построено на примерах. Через весь текст проходит пример проектирования базы данных для информационной системы банка. Этот же пример рассматривается в приложении А, а в приложении Б дан достаточно полный пример для информационной

системы университета. Две основные особенности книги — методичность изложения материала по проектированию базы данных и отражение процесса проектирования в этих двух учебных примерах.

Представленный в работе материал основывается на лекциях, чи­ таемых мною в течение ряда лет в Институте системных исследований 1ВМ. Версия рукописи использовалась в качестве текста курса с названием «База данных: структурные методы проектирования, реализации и управ­ ления». Отдельные части докладывались на профессиональных семинарах, в том числе и на встречах по локальным темам ассоциаций АСМ (АззоааИоп Гог СошриИпд МасЫпегу) и ЭРМА ф а!а Ргосеззшд МападетепГ АззоааГюп). Вопросы и предложения студентов и коллег

помогли сделать материал более современным и легче усваиваемым, а общий положительный отзыв — представить его в виде книги.

Книга состоит из трех частей; каждая содержит несколько глав. Часть 1 «Администрирование базы данных» посвящена вопросам перехо­ да организации к использованию концепции базы данных и ее ведения. В гл. 1 кратко рассматриваются моменты, составляющие содержание последующих глав. В гл. 2 содержится описание функции администра­ тора базы данных (АБД) и роль АБД и его группы в системе обработки информации. Гл. 3, названная «Словарь данных», рассматри­ вает важное средство накопления информации о содержании базы данных.

В части 2 «Проектирование базы данных (концептуальная и логи­ ческая модели)» демонстрируется процесс проектирования концептуаль­ ной и логической баз данных. В гл. 4 рассматриваются модели данных, составляющие основу любой системы управления базами данных. Кратко описываются три популярных подхода — реляционный, иерархический и сетевой. В гл. 5 описывается проектирование концеп­ туальной модели, а в гл. 6 — логической. Приводятся специальные примеры.

Вчасти 3 «Реализация базы данных» описываются одинаково важные аспекты реализации информационной обработки с использованием базы данных. Основное внимание уделяется вопросам достижения хоро­ ших эксплуатационных характеристик и принятию оптимальных решений при проектировании. Гл. 7 содержит обзор методов доступа к данным, определяющим показатели производительности. В гл. 8 описываются некоторые принципы построения этих методов доступа. В гл. 9 рассматри­ вается проблема проектирования базы данных на уровне физической модели с проведением оценки временных и объемных параметров. Гл. 10 посвящена специфическим проблемам реализации на этапах проекти­ рования, создания и эксплуатации.

Вприложении А представлен учебный пример из банковской системы, а в приложении Б — из университетской. В приложении В

вводятся понятия теории вероятностей и математической статйстики, используемые в гл. 9.

Остается выполнить единственную приятную обязанность — выразить признательность моим студентам, друзьям и коллегам. Я благодарна им за терпеливое прочтение рукописи и большое количество конструк­ тивных предложений. Я также выражаю благодарность Чарльзу Бонтемпо, Роберту Боверу, Генри Д. Боверу, Роберту Г. Брауну, Джорджу Т. Фейдоку, Джоан Фостер, Рону Гейлу, Джорджу Хаварду, Джуди Кинг, Бери Кингсбери, Фрэнку Посту, Джей Чмол, Коре Тенгни и др.

Я/. Атре

Нью-Йорк, Июль 1980

Соседние файлы в папке книги