Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

пдф-Этапы проектирования БД

.pdf
Скачиваний:
16
Добавлен:
14.04.2015
Размер:
122.47 Кб
Скачать

Процесс проектирования баз данных. Основные этапы проектирования.

Этап 1. Формулировние и анализ требований.

На этом этапе устанавливаются цели организации, определяются специфичные требования к базе данных, вытекающие из этих целей или сформулированные непосредственно управляющим персоналом организации. В результате собеседований определяются информационные потоки, отображающие указанные процессы и их взаимодействие.

Этап 2. Концептуальное проектирование.

Результатом этого этапа является высокоуровневое представление информационных требований, например, такое как диаграмма «сущностьсвязь» (ER-диаграмма). Общим для всех подходов к построению ERдиаграмм является набор из четырех основных проектных решений или шагов:

Определение сущностей. Определение атрибутов сущностей.

Идентификация ключевых атрибутов сущностей. Определение связи между сущностями.

Требования каждого пользователя анализируются и представляются в некоторой общей форме. Объекты и события, ассоциированные с представлением каждого пользователя, моделируются множеством сущностей, аттрибутов и связей между сущностями. В дальнейшем эти требования сливаются в единое глобальное представление.

Этап 3. Проектирование реализации.

Главной целью этапа проектирования реализации является создание СУБДориентированной схемы с использованием в качестве исходных данных результатов концептуального проектирования и требований обработки (UPинформации). На этом этапе формируются предварительные типы записей и производится количественная оценка с помощью таких характеристик, как число обращений к логическим записям, объем обрабатываемых в каждом приложении данных, общий объем хранимых данных. Эти оценки помогут приблизительно определить эффективность функционирования физической базы данных в терминах затрачиваемого на обработку времени и требуемой физической памяти.

Этап 4. Физическое проектирование.

Основные проектные решения в физическом проектировании можно разделить примерно на три категории.

Проектирование формата хранимых записей. Сюда включаются все виды представления и сжатия данных в хранимых записях.Сюда же относится распределение элементов данных по различным участкам физической памяти в зависимости от размеров и характеристик использования. Анализ и проектирование кластеров. Кластеризация включает размещение

экземпляров записей в смежных участках физической памяти, распределение по различным устройствам внешней памяти, выбор размеров блоков с целью эффективной выборки.

Проектирование путей доступа. Сюда включаются такие параметры, от

которых в значительной степени зависит стоимость доступа при поиске и обновлении данных (например, логическое упорядочение записей, выбор указателей, методы доступа, техника обработки переполнений).

Формулировние и анализ требований.

Этапы формулирования и анализа требований.

Определение сферы применения БД как в настоящем так и в будущем. Лучшим источником такой информации является информационная схема организации, если она имеется. Используя подобную схему в качестве основы, можно определить функциональные задачи, которые следует рассмотреть в рамках проекта. Если организация не имеет организационной схемы или эта схема не содержит диаграммы зависимости данных и задач, определение сферы применения возлагается на разработчика. Другим фактором, который необходимо принимать во внимание при определении сферы применения являются возможные в будущем изменения в деятельности организации. Каждое из таких возможных изменений должно быть проанализировано с целью определения возможных изменений в

составе данных.

Сбор информации об использовании данных.

Информацию об использовании данных можно разделить на 2 вида: информацию, связанную с производственными функциями и информацию, связанную с функциями управления. Выявляются подразделения, выполняющие производственные функции и выбираются кандидатуры для собеседований, рассылаются каждому руководителю вопросники следующего примерного содержания: Наименование работы для каждого из подчиненных ему лиц; Производственные функции, выполняемые на каждом рабочем месте; Краткое описание целей выполняемой работы.

Полученные ответы сводятся в таблицу. Затем необходимо рассотреть каждую из работ и отнести ее к одному из видов деятельности: производственной или управленческой. Исследование производственных функций.

Собеседование преследует три цели: Идентификация каждой производственной функции;

Идентификация данных, требуемых для выполнения этих функций; Идентификация явных и неявных правил, определяющих, когда и как выполняется каждая функция.

Опросив исполнителя каждой из работ, основные действия, решения и взаимосвязи, выполняемые им в течении рабочего дня следует задокументировать в виде блок-схемы. Затем повторить ту же процедуру для функций, выполняемых еженедельно, ежемесячно, ежеквартально и ежегодно.

После составления блок-схемы следует определить какие документы, файлы и неформализованные ссылки используются при выполнении кажой функции и записать в отдельный список. Используя

информационный список, необходимо поставить соответствующий номер документа рядом с каждым графическим символом блоксхемы. И, наконец, необходимо сопоставить каждый элемент данных, используемый или создаваемый в каждом документе, с каждой

функцией на блок-схеме. Для этого надо обозначить каждый графический символ на блок-схеме уникальным идентификатором. Далее следует составить список используемых во всех документах данных и поместить рядом с каждым элементом данных идентификаторы функций, связанных с каждым документом, в котором используется этот элемент данных. Правила, определяющие когда и как выполняется каждый шаг блок-схемы, могут быть записаны или на самой блок-схеме, или на отдельном листе. Функции управления.

В качестве собеседника, представляющего руководство, следует выбирать лицо, в компетенцию которого входит определение целей и задач предприятия, формулирование стратегий достижения этих целей и управление выполнением планов реализации этих стратегий. Целью бесед является получение общего представления по

следующим пунктам:

основные компоненты деятельности и их взаимодействие друг с другом.

внутрення среда ( организационная структура, расположение и т.д.).

внешняя среда, которая прямо или косвенно влияет на деятельность предприятия (законодательные органы, рынок сбыта и т.д.).

явная или подразумаемая коммерческая политика, которая определяет поведение организации.

информация, требуемая для планирования деятельности. предполагаемые изменения, которые могут влиять на род или сферу деятельности, либо на способы ведения деятельности.

Собеседниками, представляющими среднее звено, могут быть лица, непосредственно ответственные за одну или несколько областей деятельности. Цель этих собеседований заключается в том, чтобы получить более полное понимание следующих вопросов:

взаимодействие между различными областями деятелности. правила и полититка, опредляющие повседневную деятельность. виды информации, используемой для контроля и оценки функционирования.

в о з м о ж н о е в л и я н и е п р е д п о л а г а е м ы х и з м е н е н и й н а производственную деятельность.

Преобразование собранной информации в форму, удобную для проведения анализа.

Процесс преобразования информации, собранной во время собеседований, в форму используемую при методологическом анализе, включает пять шагов:

Составление списка всех используемых и создаваемых данных. Определение производственных задач организации, их характеристик и используемых в них данных.

Определение задач управления, их характеристик и используемых

данных.

Составление списка всех явных и неявных правил и линий поведения в управлении деятельностью организации. Составление списка возможных будущих изменений и путей их влияния на деятельность организаций.

Идентификация элементов данных.

Наиболее часто втречающаяся проблема определения избыточности элементов данных. Одним из способов решения этой проблемы является выделение отдельных элементов данных из полученных документов и распределение их по родовидовым спискам (например, даты, количества, запасы, наименования и т.д.).

Как только составлены родо-видовые списки и решены вопросы избыточности, каждый элемент данных следует поместить в

словарь данных, назначить ему уникальный идентификатор и составить описание.

Идентификатор

Наименование

Определение

1

Номер заказа

О д н о з н а ч н о

 

 

определяет к аждый

 

 

з а к а з в н у т р и в с е й

 

 

компании

2

Заказанное количество

Определяет

 

 

количество

 

 

определенного вида

 

 

товара, зака

Идентификация производственных задач.

После того как составлен словарь элементов данных, можно приступить к анализу блок-схемы, полученной во время проведения собеседований, и определить связи между производственными задачами и данными. Определяется самый низкий уровень деятельности, который многократно использует уникальный набор данных, Такой уровень деятельности называется задачей и определяется следующим образом:

Уникальная единица деятельности, состоящая из набора последовательно выполняемых шагов.

Все шаги направлены на достижение одной и той же цели. На каждом шаге создается или используется один и тот же набор данных.

Для анализа каждой блок-схемы и деления ее на задачи следует применять следующие правила:

З а д а ч а д о л ж н а в ы п о л н я т ь с я в п р е д е л а х о д н о й функциональной области деятельности (блок-схемы). Каждая задача должна состоять из набора последовательных шагов.

Каждый шаг внутри задачи должен выполняться в пределах

 

одних и тех же временных ограничений.

 

 

 

Каждый шаг внутри задачи должен использовать один и тот

 

же набор данных.

 

 

 

 

 

Каждый шаг внутри задачи должен быть обязательно

 

выполнен.

 

 

 

 

 

После того как все блок-схемы проанализированы и разделены

 

на задачи, можно приступать к процессу документирования. Этот

 

процесс включает следующие действия:

 

 

 

Каждой задаче должен быть присвоен свой цифровой

 

идентификатор.

 

 

 

 

 

Каждая задача должна быть кратко описана повелительной

 

формой типа «глагол-дополнение».

 

 

 

К а ж д а я з а д а ч а д о л ж н а б ы т ь о т н е с е н а л и б о к

 

производственным задачам, либо к управленческим.

 

Для каждой задачи следует определить частоту ее

 

выполнения и объем.

 

 

 

 

Каждая задача должна быть отнесена к конкретной

 

функциональной области деятельности организации.

Н о м е р

Определ

Тип

Частота

Объем

Отдел

Элемент

задачи

е н и е

 

 

 

 

ы

 

задачи

 

 

 

 

данных

1

Выписат

Произво

Ежеднев

2000

П р и е м

1,45,50,

 

ь заказ

дств.

но

 

заказов

67

Идентификация задач управления.

Задачи этого типа добавляются к общему списку задач с пометкой в графе «Тип» – «Управленческая». Если во время этого процесса обнаруживаются новые элементы данных, то они добавляются к словарям данных.

Идентификация текущих и будущих правил поведения, определяющих политику организации.

В результате этого процесса должны быть получены два списка: список правил поведения и список возможных изменений. Правила поведения определяют образ действий организации или то, как различные части организации соотносятся друг с другом. Будущие изменения включают все, что может влиять на сферу деятельности, текущую политику или связи организации с внешним окружением.

Концептуальное проектирование.

В большинстве случаев пользователи описывают свои информационные требования в терминах сущностей, атрибутов и связей. Сущность представляет собой основное содержание того явления или процесса, о котором необходимо собрать информацию. В качестве сущности может выступать личность, место или вещь, информацию о которой надо хранить. Необходимо различать такие понятия, как тип сущности и экземпляр сущности. Понятие тип сущности относится к набору однородных предметов или вещей, выступающему как целое. Экземпляр сущности относится к конкретной вещи в наборе. Средством, с помощью которого определяются свойства сущностей, являются атрибуты. Атрибут – это поименованная характеристика сущности. Атрибут имеет следующие характеристики: Наименование. Уникальное обозначение атрибута.

Описание. Повествовательное изложение смысла атрибута.

Роль. Конкретное использование атрибута.

Под связями понимаются ассоциации между одинаковыми или различными типами сущностей. В качестве характеристик можно назвать: наименование связи, степень ассоциативности, избирательность, однозначность, время существования и идентификатор.

Характеристика ассоциативности/однозначности связи обозначает степень ассоциации типов сущностей. Если экземпляр сущности Z соотносится не более чем с одним экземпляром другой сущности Y, связь является однозначной по данному типу сущности. Если связь однозначна в обоих направлениях (т.е. в направлении обоих типов сущностей), она называется связью один-к-одному. Если связь является однозначной только в одном направлении, то существует ассоциация один-ко-многим. Если однозначность отсутствует, то говорят, что существует ассоциация много-ко- многим.

Характеристика избирательности связи определяет правила членства экземпляра сущности в связи:

Необязательная связь. Существование обеих сущностей в связи не зависит от связи.

Возможная связь. Существование одной из сущностей в связи зависит от связи.

Условная связь. Существование одной из сущностей определяется булевским условием.Условная связь является специальным случаем возможной связи. В случае условной связи на диаграммах рядом со стрелкой указывается условие существования.

Обязательная связь. Существование обеих сущностей зависит от связи. Различные подходы к концептуальному проектированию баз данных можно отнести к одной из двух методологий проектирования: анализу сущностей и синтезу атрибутов.

Анализ сущностей является нисходящим подходом, который делит процесс проектирования на четыре стадии: моделирование представлений, объединение представлений, составление и анализ схемы и физическое проектирование. Для концептуального представления представляют

интерес только две первые стадии. Под стадией моделирования представлений понимается моделирование информации, требуемой для базы данных, с точки зрения, отображающей различные аспекты деятельности организации. Видами или типами представлений являются: общее представление ( с точки зрения организации в целом), прикладное представление, информационное представление и представление событий. Каждому типу представлений соответствует особый вид информации: Цели/ограничения организации. Производственные или коммерческие цели организации. Различные информационные ограничения, такие как требования отчетности, необходимость проверки, управляющие воздействия, а также меры по обеспечению секретности.

Обрабатываемая информация. Информация о существуюших и будущих приложениях. Сюда включаются все предполагаемые виды обработки базы данных.

И н ф о р м а ц и о н н ы е с т ру к т ур ы и с вя з и. М од ел и р о ва н и е о б щ и х информационных связей: существующих элементов данных, агрегаций элементов данных и связей.

События и планирование. Сроки представления информации, различных отчетов, сроки решения прикладных задач.

Основная цель объединения представлений заключается в идентификации

ивыделении общих аспектов различных представлений, а также в обнаружении и разрешении их основных противоречий. Этот процесс включает анализ и принятие решений на нескольких уровнях: Несогласованность наименований.

Несогласованность идентификации. Различная идентификация для одних и тех же типов сущностей.

Несогласованность агрегации. Ограничение различных групп элементов на структурном уровне или операций над значениями элементов на уровне экземпляров.

Дополняющие подмножества. Распознавание взаимодополняющих друг друга подмножеств данных.

Противоречивость требований обновления. Обнаружение несогласованных правил добавления/исключения среди различных представлений пользователей.

Противоречивость ограничений целостности. Идентификация различий в правилах поддержания целостности данных.

Синтез атрибутов – эта методология называется восходящей, т.к. она начинается с синтеза атрибутов самого нижнего уровня, из которых затем формируются сущности и связи верхнего уровня. Различают четыре стадии: классификация атрибутов, композиция сущностей, формулирование связей

играфическое представление.

Классификация элементов. Результатом анализа требований является

полный список элементов данных. Эти элементы данных с помощью эвристических правил классифицируются по типам атрибутов, а также в отношении членства в сущности.Типы аттрибутов: идентифицирующий и не являющийся идентификатором.

Композиция сущностей. Атрибуты принадлежат сущностям двух типов: уникальным и неуникальным (зависимым).

Формулирование связей. На этой стадии, кроме двух типов, необходимо использовать также другую информацию, такую как политика организации. Эта информация используется для определения связей между типами сущностей и для определения дополнительных атрибутов сущностей. Графическое представление. На конечной стадии вышеописанн атрибуты и сущности и связи оформляются графически в терминах модели «сущность-связь».

Моделирование проектных представлений. Для моделирования используются четыре представления:

обобщенное – отображает точку зрения высшего и среднего руководства на информационные потребности организации.

прикладное – отображает те процессы обработки данных, которые должны

выполняться для достижения стоящих перед организацией целей. информационное – описывает общие информационные связи, необходимые для принятия решений и долгосрочные информационные требования. представление событий – описывает требования, связанные с планированием или определенными моментами времени.

Основой модели «Сущность-атрибут-связь» являеется графическое изображение, состоящее из прямоугольников и стрелок. Прямоугольники используют для изображения сущностей, а стрелки – для направленных связей.

Моделирование проектных представлений состоит из последовательности шагов:

Идентификация локальных представлений. Могут соответствовать данным в различных функциональных областях.

Формулирование сущностей. Для каждого локального представления могут быть сформулированы сущности. Число сущностей в локальном представлении должно быть не более девяти (шесть – семь). Поскольку сущность представляет информационный факт, этому факту должно быть дано четкое наименование.

Выбор идентифицирующего атрибута для каждой сущности. Идентификатор сущности может состоять из одного или более атрибутов, набор значений которых уникален.

Специфик ация связей. Лок альное представление дополняется информацией, полученной в результате определения ассоциаций между экземплярами сущностей.

Добавление описательных атрибутов к сущностям. В качестве описательных атрибутов могут использоваться только однозначные атрибуты (все повторяющиеся атрибуты исключены – отношение находится в первой нормальной форме).

Объединение представлений пользователей. Основной результат процесса объединения представлений – гдобальная информационная структура. Существуют три основополагающие концепции объединения проектных представлений: идентичность, агрегация и обобщение. Идентичность –

наиболее простая из всех трех концепций. Говорят, что два или более элементов являются идентичными, если они имеют одинаковое семантическое значение. Другим способрм описания отношения идентичности является объявление двух или более элементов синонимами. Агрегация – соответствует концепции, позволяющей рассматривать связь между элементами, как новый элемент более высокого уровня. Обобщение

– это понятие относится к типу абстракции, в которой группа подобных элементов воспринимается как родовой элемент, при этом различия между отдельными элементами опускаются.

Типы объединения представлений.Имеются три типа объединения, каждый из которых основан на одной из вышеназванных концепций. Предполагается, что представления пользователей удовлетворяют следующим условиям:

Множество объектов является полным с точки зрения потребностей

пользователя.

Все объекты имеют уникальные наименования. Синонимы отсутствуют.

Предполагается, что одновременно будет производиться объединение не более двух пользователей.

Объединение идентичности. Для проверки согласованности результата объединения представлений пользователей может быть предложено следующее правило: если объект из представления одного пользователя идентичен объекту из представления другого пользователя, ни один из этих объектов не должен в дальнейшем принимать участие в каком-либо другом объединении идентичности между этими двумя представлениями. Объединение агрегаций. Один из пользователей определяет агрегатный объект как целое , а другой – в виде составных частей. Второй вариант – когда один пользователь определяет агрегатный объект в виде множества одних составных частей, а другой – в виде множества других составных частей.

Объединение обобщений. Аналогично объединению агрегаций. Комплексные семантические связи.

Процесс объединения.

Синтез атрибутов. Основными шагами проектирования являются: Выбор сущностей и атрибутов.

Идентификация связей данных.

Представление информационной структуры в графической форме. Интерпретация информационной структуры с целью ее верификации. Предполагается анализ следующих компонентов:

Сущности – элементы данных, которые используются в организации для идентификации объектов. Будут различаться два типа сущностей: уникальные и неуникальные.

Атрибуты Связи