Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Информационное обеспечение(лекции)

.pdf
Скачиваний:
77
Добавлен:
27.03.2016
Размер:
2.19 Mб
Скачать

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ

Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования

МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ МАШИНОСТРОИТЕЛЬНЫЙ УНИВЕРСИТЕТ (МАМИ)

/ УНИВЕРСИТЕТ МАШИНОСТРОЕНИЯ /

К. И. Меша, Г. И. Семенихин, В. И. Харитонов

УЧЕБНОЕ ПОСОБИЕ

«Информационное обеспечение систем управления»

для студентов, обучающихся по направлениям подготовки бакалавров 220400.62 «Управление в технических системах», 220200.62 «Автоматизация и управление» и специальности и специальности 220201.65 «Управление и информатика в технических системах»

Москва

2012

УДК 004 ББК 65

К. И. Меша, проф., Г. И. Семенихин, доц., В. И. Харитонов, проф.

Учебное пособие по дисциплине «Информационное обеспечение систем управления» для студентов, обучающихся по направлениям 220400.62 «Управление в технических системах», 220200.62 «Автоматизация и управление» и специальности и специальности 220201.65 «Управление и информатика в технических системах» и предназначено для студентов, изучающих дисциплину «Информационное обеспечение систем управления».

стр. 229, МАМИ, 2012г.

В учебном пособии на основе системного подхода изложены вопросы, связанные с использованием автоматизированных информационных технологий и информационно-управляющих систем. Рассмотрены технологии и методы, применяемые в современных базах данных и СУБД; проблемы и идеи, возникающие при использовании иерархических, сетевых и реляционных моделей данных. Приведен анализ жизненного цикла автоматизированной информационной системы, рассматриваются цели и подходы к проектированию баз данных, определяются этапы процесса проектирования. Рассматриваются способы создания инфологических моделей предметной области на примере языка ER-диаграмм. Особое внимание уделено процессу нормализации отношений реляционной модели. Рассмотрены принципы физической организации данных в современных СУБД. Приведен обзор принципов построения и использования распределенных баз данных как наиболее перспективного направления в информационных технологиях.

2

Содержание

Введение.......................................................................................................................

5

1 ИНФОРМАЦИОННЫЕ СИСТЕМЫ НА БАЗАХ ДАННЫХ.............................

9

1.1

Понятие информационной системы, информационное обеспечение..........

9

1.2

Понятие базы данных......................................................................................

10

1.3

Понятие системы управления базами данных..............................................

11

1.3.1

Обобщенная архитектура СУБД..............................................................

12

1.3.2

Достоинства и недостатки СУБД.............................................................

21

1.3.3

Архитектура многопользовательских СУБД..........................................

25

1.4

Понятие независимости данных ....................................................................

30

1.5

Категории пользователей базой данных.......................................................

30

1.5.1

Общая классификация пользователей БД...............................................

30

1.5.2

Администратор базы данных ..................................................................

32

1.5.3

Разделение функций администрирования ..............................................

33

1.6. Средства администрирования баз данных....................................................

35

2 ПРОЕКТИРОВАНИЕ БАЗ ДАННЫХ.................................................................

40

2.1

Жизненный цикл информационной системы.............................................

40

2.2

Подходы и этапы проектирования баз данных ............................................

42

2.2.1

Цели и подходы к проектированию баз данных..................................

42

2.2.2

Этапы проектирования баз данных .........................................................

45

2.3

Инфологическое проектирование базы данных............................................

47

2.3.1

Модель «сущность-связь» ........................................................................

48

2.3.2

Классификация сущностей, расширение ER-модели ............................

54

2.3.3 Проблемы ER-моделирования................................................................

56

2.4

Логическое проектирование...........................................................................

62

2.4.1

Выбор СУБД ..............................................................................................

62

2.4.2

Даталогические модели данных...............................................................

72

2.4.3

Нормализация ............................................................................................

83

3 ФИЗИЧЕСКАЯ ОРГАНИЗАЦИЯ ДАННЫХ В СУБД ...................................

103

3.1

Списковые структуры ...................................................................................

103

3.1.1

Последовательное распределение памяти ............................................

104

3.1.2

Связанное распределение памяти..........................................................

106

3.2

Модель внешней памяти...............................................................................

111

3.3. Методы поиска и индексирования данных.................................................

114

3.3.1 Последовательный поиск.........................................................................

114

3.3.2. Бинарный поиск.......................................................................................

116

3.3.3. Индекс - «бинарное дерево»...................................................................

117

3.3.4. Неплотный индекс...................................................................................

118

3.3.5. Плотный индекс.......................................................................................

120

3.3.6. Инвертированный файл ..........................................................................

120

4 МАТЕМАТИЧЕСКИЕ ОСНОВЫ МАНИПУЛИРОВАНИЯ

 

РЕЛЯЦИОННЫМИ ДАННЫМИ..........................................................................

123

4.1

Теоретические языки запросов ....................................................................

123

4.1.1. Реляционная алгебра...............................................................................

123

3

4.1.2. Реляционное исчисление кортежей.......................................................

129

4.1.3

Реляционное исчисление доменов.........................................................

135

4.1.4

Сравнение теоретических языков..........................................................

136

4.2

Определение реляционной полноты............................................................

137

5 РАСПРЕДЕЛЕННЫЕ БАЗЫ ДАННЫХ И СУБД ...........................................

139

5.1

Основные определения, классификация распределенных систем...........

139

5.2

Преимущества и недостатки распределенных СУБД................................

145

5.3

Функции распределенных СУБД.................................................................

149

5.4

Архитектура распределенных СУБД ..........................................................

149

5.5

Разработка распределенных реляционных баз данных.............................

152

5.5.1. Распределение данных............................................................................

154

5.5.2

Фрагментация...........................................................................................

155

5.5.3

Репликация ...............................................................................................

160

5.6

Обеспечение прозрачности...........................................................................

167

5.6.1

Прозрачность распределенности ...........................................................

167

5.6.2

Прозрачность транзакций.......................................................................

169

5.6.3

Прозрачность выполнения......................................................................

171

5.6.4

Прозрачность использования.................................................................

172

ПРИЛОЖЕНИЯ.......................................................................................................

173

Приложение 1 - НЕДОСТАТКИ ФАЙЛОВЫХ СИСТЕМ...............................

173

Приложение 2 - КРАТКАЯ ИСТОРИЯ РАЗВИТИЯ СУБД.............................

175

Приложение 3 - СРАВНИТЕЛЬНАЯ ХАРАКТЕРИСТИКА

 

ДАТАЛОГИЧЕСКИХ МОДЕЛЕЙ .....................................................................

178

Приложение 4 - ПРИМЕР ИНФОЛОГИЧЕСКОГО ПРОЕКТА БАЗЫ

 

ДАННЫХ...............................................................................................................

184

Приложение 5 - ОБОБЩЕННАЯ МЕТОДИКА ПРОЕКТИРОВАНИЯ

 

РЕЛЯЦИОННЫХ БАЗ ДАННЫХ ......................................................................

186

Приложение 6 - ПРАВИЛА РАСПРЕДЕЛЕННЫХ СУБД ..............................

191

Приложение 9 - КРАТКИЙ ТОЛКОВЫЙ СЛОВАРЬ ......................................

205

СПИСОК ЛИТЕРАТУРЫ.......................................................................................

224

4

Введение

Предметом настоящего учебного пособия являются информационные системы, базы данных и системы управления базами данных. Это очень важная область, определяющая характер революции в информационных системах.

Содержание учебного пособия соответствует Государственному образовательному стандарту высшего профессионального образования по направлению подготовки инженеров специальности 651900 «Автоматизация и управление»; в частности, образовательной программе 210100 «Управление и информатика в технических системах» и учебной программе дисциплины «Информационное обеспечение систем управления».

Границы применения вычислительной техники в различных сферах человеческой деятельности с каждым годом определить все сложнее – они становятся необъятными. Так, неоспоримы успехи в областях технического и математического обеспечения ЭВМ, в развитии электроники и интегральной схемотехники. Современные вычислительные машины и системы достигли высочайшего уровня развития.

Повсеместное применение средств вычислительной техники связано и с информационным взрывом, сущность которого состоит в лавинообразном росте количества информации, которое должно воспринимать и перерабатывать человечество (экспоненциальный закон роста количества информации). Это касается всех сфер человеческой деятельности. Информация, данные все чаще рассматриваются как стратегические национальные ресурсы, которые должны быть организованы так, чтобы ценность их была максимальной.

Революционный рост объемов перерабатываемой информации и накопленный опыт использования электронно-вычислительной техники в различных областях привели в 60-70-х годах XX века к необходимости пересмотреть такую традиционную область обработки информации, как управление данными. Новый подход к обработке информации нашел наиболее яркое отражение в концепции баз данных. Автоматизированные информационные системы на основе баз данных позволили обеспечить устранение излишней избыточности хранимых данных, предоставили возможности многоаспектного поиска во взаимосвязанной совокупности именованных данных. Теперь круг решаемых в информационной системе задач не ограничивается кругом задач, сформулированных при разработке, если она основана на технологии баз данных.

С начала развития вычислительной техники образовались два основных направления ее использования. Первое направление – применение вычислительной техники для выполнения численных расчетов, которые слишком долго или вообще невозможно производить вручную. Становление этого направления способствовало интенсификации методов численного решения сложных математических задач, развитию класса языков программирования, ориентированных на удобную запись численных алгоритмов, становлению обратной связи с разработчиками новых архитектур ЭВМ.

5

Второе направление - это использование средств вычислительной техники в автоматических или автоматизированных информационных системах. В самом широком смысле информационная система представляет собой программный комплекс, предназначенный для надежного хранения информации, выполнения специфических для данного приложения преобразований информации и вычислений, предоставлении пользователям удобного и легко осваиваемого (дружелюбного) интерфейса. Обычно объемы информации, с которыми приходится иметь дело таким системам, достаточно велики, а сама информация имеет достаточно сложную структуру. Классическими примерами информационных систем в гражданской сфере являются банковские системы, системы резервирования авиационных или железнодорожных билетов, мест в гостиницах и т.д.

Второе направление объективно возникло позже первого. Это связано с тем, что на заре вычислительной техники компьютеры обладали ограниченными возможностями в отношении объемов памяти. Очевидно, что указанное ограничение не очень существенно для численных расчетов. Даже если программа должна обработать большой объем информации, при программировании можно продумать расположение этой информации во внешней памяти, чтобы программа работала как можно быстрее, а алгоритм был выполнен.

Сдругой стороны, к информационным системам, в которых потребность

втекущих данных определяется пользователями, естественными требованиями являются высокая скорость выполнения запросов и максимальный объем памяти.

Споявлением магнитных дисков началась история систем управления данными во внешней памяти. До этого каждая прикладная программа, которой требовалось хранить данные во внешней памяти, определяла расположение каждой порции данных на магнитной ленте или барабане и выполняла операции обмена между оперативной и внешней памятью с помощью программно-аппаратных средств низкого уровня (машинных команд или вызовов соответствующих программ операционной системы). Такой режим работы не позволял или очень затруднял поддержание на одном внешнем носителе нескольких архивов долговременно хранимой информации. Кроме того, каждой прикладной программе приходилось решать проблемы именования частей данных и структуризации данных во внешней памяти.

Для обеспечения гибкости использования данных необходимо учитывать два аспекта разработки баз данных:

во-первых, данные должны быть независимы от использующих их программ, чтобы данные можно было добавлять или перестраивать без изменения программ;

во-вторых, должна быть обеспечена возможность запрашивать и отыскивать информацию в базе данных без трудоемкого написания программ на обычном языке программирования.

6

Таким образом, проектирование баз данных основывается на вполне определенной системе положений – четко сформулированной концепции.

Концепция баз данных стала определяющим фактором при создании эффективных систем автоматизированной обработки информации. Поэтому проектирование автоматизированных систем управления различного назначения должно включать в себя и проектирование информационных систем, основанных на технологии баз данных.

Врезультате изучения данного курса студенты получают необходимые сведения об информационном обеспечении, информационных системах, базах данных, системах управления базами данных; знакомятся с жизненным циклом информационных систем; изучают основные этапы проектирования информационных систем, модель данных «сущность-связь», реляционную, сетевую и иерархическую модели данных; знакомятся с языками определения и манипулирования данными; получают представление о физической организации данных, методах доступа к данным, о перспективах развития информационных систем.

Основная цель данного учебного пособия – введение в технологии и методы, применяемые в современных базах данных и СУБД; в проблемы и идеи, возникающие при использовании иерархических, сетевых и реляционных моделей данных. В предлагаемом пособии нет жесткой привязки к какой-либо одной популярной СУБД, акцент сделан на теоретических основах организации больших, часто запрашиваемых массивов данных. Опыт всех специалистов показывает, что без знания этих основ невозможно эффективно работать с конкретными автоматизированными информационными системами, как бы хорошо они не сопровождались и документировались.

Поэтому была предпринята попытка собрать и использовать в одном издании наиболее проработанный учебный материал лучших специалистов, осуществляющих свою деятельность в области обучения, научных исследований и практической реализации подходов, основанных на технологии баз данных.

Впервом разделе учебного пособия даются определения информационной системы, базы данных, системы управления базами данных. Обсуждаются основные функции, и приводится типовая организация СУБД, классифицируются пользователи БД. Здесь же детализируется круг обязанностей администратора базы данных, рассматриваются основные средства администрирования.

Второй раздел учебного пособия содержит анализ жизненного цикла автоматизированной информационной системы, рассматриваются цели и подходы к проектированию баз данных, определяются этапы процесса проектирования. Рассматриваются способы создания инфологических моделей предметной области на примере языка ER-диаграмм. Вводится необходимый для дальнейшего изложения теоретический базис. Детально рассматривается сложный этап логического проектирования эффективных БД. Обсуждены достоинства и недостатки наиболее популярных моделей данных –

7

иерархической, сетевой, реляционной. Особое внимание уделено восходящему пути проектирования – процессу нормализации отношений реляционной модели. Акцентированы недостатки универсального отношения, классифицированы зависимости атрибутов и даны обобщенные определения известным нормальным формам. Поставлена задача нормализации для целей практики.

Втретьем разделе рассмотрены принципы физической организации данных в современных СУБД. Построена модель внешней памяти и предложены некоторые методы исследования оптимальных способов физического хранения данных. Коротко приведены наиболее распространенные методы поиска и индексирования данных.

Четвертый раздел посвящен математическим основам манипулирования реляционными данными. Обсуждаются особенности трех теоретических языков запросов, приведены теоремы об эквивалентности выразительной мощности реляционной алгебры и реляционного исчисления. Проведен сравнительный анализ теоретических языков запросов, обсуждены перспективы реальных языков запросов.

Впятом разделе приведен обзор принципов построения и использования распределенных баз данных как наиболее перспективного направления в информационных технологиях. Обобщены концепции организации и работы компьютерных сетей, функции и архитектура распределенных баз данных. Обсуждена проблема прозрачности и сформулированы правила, при выполнении которых СУБД является распределенной.

Вприложениях к учебному пособию помещены краткий толковый словарь по организации баз данных, примеры проектов баз данных, результаты сравнительного анализа даталогических моделей и правила реализации распределенных СУБД.

8

1 ИНФОРМАЦИОННЫЕ СИСТЕМЫ НА БАЗАХ ДАННЫХ

1.1 Понятие информационной системы, информационное обеспечение

Информационные системы системы обработки данных о какой-либо предметной области со средствами накопления, хранения, обновления, поиска и выдачи данных.

Данные – информация (факты и идеи), представленная в формализованном виде, позволяющем передавать или обрабатывать ее при помощи некоторого процесса (и соответствующих технических средств).

Впоследнем определении под «передачей» данных подразумевается и процесс их хранения, т.к. с теоретических позиций – хранение равносильно передаче данных, но не в пространстве, а во времени (соответственно схемы памяти рассматриваются как каналы передачи данных во времени).

Вшироком смысле под информацией понимают любые сведения о каком-либо событии, сущности, процессе и т.п., являющиеся объектом некоторых операций: восприятия, передачи, преобразования, хранения или использования.

Процесс осмысливания понятия информации и ее роли в жизни и деятельности человека продолжается. Понятие информации вместе с другими научными понятиями позволяет более глубоко познать законы развития материального мира. На современном этапе считается, что оно является общим для всех видов и форм движения материи и связывается с тем или иным неотъемлемым свойством или атрибутом материи.

Все многообразие информационных систем можно классифицировать по ряду признаков.

По средствам выполнения информационной задачи различают информационные системы ручные, механизированные и автоматизированные; по выполняемой функции – информационно-поисковые, управляющие, моделирующие, обучающие, экзаменующие и др.; по области применения – медицинские, финансовые, лингвистические и др.

Автоматизированная информационная система (АИС) –

информационная система, использующая ЭВМ на этапах ввода, обработки и выдачи информации по различным запросам пользователей. Представляя собой развитие информационно-поисковых систем, обеспечивающих выполнение информационного поиска с помощью прикладных программ, АИС характеризуется преимуществами системного направления развития ЭВМ:

многофункциональностью, т.е. способностью решать разнообразные задачи; одноразовостью подготовки и ввода данных;

независимостью процесса сбора и обновления (актуализации) данных от процесса их использования прикладными программами;

9

независимостью прикладных программ от физической организации базы данных;

развитыми средствами лингвистического обеспечения.

Для полного решения какой-либо информационной задачи в этих системах необходимо, чтобы ЭВМ понимала смысл текста, написанного на естественном языке, что тесно связано с проблемой искусственного интеллекта.

Таким образом, информационные системы служат информационному обеспечению различных видов деятельности человека. Логично будет уточнить понятие информационного обеспечения на современном этапе развития информационных технологий.

Информационное обеспечение поддержка процессов управления, технологии, обучения, научных исследований и др. средствами систем баз данных и знаний.

Качество информационного обеспечения гарантируется за счет концентрации информации в базах данных, повышения интеллектуального уровня информационных систем средствами баз знаний. Информационное обеспечение повышает производительность труда в десятки раз, изменяет характер многих видов информационной и трудовой деятельности.

1.2 Понятие базы данных

База данных (БД) – именованная совокупность данных, отображающих состояние объектов и их отношений в рассматриваемой предметной области. Организуется так, что данные собираются однажды и централизованно хранятся (и модифицируются) в виде, доступном всем специалистам или системам программирования, которые могут их использовать.

Особенности организации данных в БД по сравнению с файловыми системами обеспечивают использование одних и тех же данных в различных приложениях, позволяют решать различные задачи планирования, исследования и управления. БД сводят к минимуму дублирование данных, прибегая к дублированию только для ускорения доступа к данным или для обеспечения восстановления БД при ее разрушении. Одна из важных черт БД – независимость данных от особенностей прикладных программ, которые их используют, а также возможность создания этих программ в такой форме, что изменение особенностей хранения, логической структуры или значений данных не требует изменения программ их обработки. Другой важной чертой БД является возможность изменения физических особенностей хранения данных без изменения их логической структуры.

Можно четко сформулировать требования к БД со стороны внешних пользователей. База данных должна:

1.удовлетворять актуальным информационным потребностям пользователей, обеспечивать возможность хранения и модификации больших объемов многоаспектной информации;

2.обеспечивать заданный уровень достоверности хранимой информации и ее непротиворечивость;

10