Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Laboratornye_raboty_po_kursu-Bazy_dannykh-2012-...doc
Скачиваний:
77
Добавлен:
22.11.2019
Размер:
6.51 Mб
Скачать

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ

ФЕДЕРАЛЬНОЕ АГЕНСТВО ПО ОБРАЗОВАНИЮ

МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ПЕЧАТИ ИМЕНИ ИВАНА ФЕДОРОВА

ИВАНЬКО А.Ф., ИВАНЬКО М.А., ШУРЫГИН В.Н., ЗАЙНУДИНОВ С.

ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ ( Базы данных) В КНИЖНОМ ДЕЛЕ И ПОДГОТОВКЕ ГАЗЕТНО-ЖУРНАЛЬНЫХ ИЗДАНИЙ

Методические указания по выполнению лабораторных и практических занятий

Для студентов , обучающихся по направлению 035000 «Издательское дело»,

Профиль подготовки «Книгоиздательское дело»

Квалификация - бакалавр

Москва - 2012

Составители: Иванько Александр Федорович, доцент, к.т.н.;

Иванько Михаил Александрович, доцент, к.т.н.;

Шурыгин Владимир Николаевич, доцент, к.т.н., Зайнудинов Сафар, доцент, к.т.н.

Лабораторные работы по курсу «Информационные технологии в книжном деле» соответствуют программе курса и Государственному образовательному стандарту и предназначены для улучшения практической подготовки студентов , обучающихся на факультете Издательского дела и журналистики МГУП имени Ивана Федорова по направлению «Издательское дело», профиль подготовки «Книгоиздательское дело». В методических указаниях представлены практические рекомендации по выполнению лабораторных работ с использованием ППП MS Exel, СУБД MS Access либо с аналогичными пакетами OpenOffice.org., фирмы ORACLE. Для выполнения лабораторных работ необходим компьютерный класс, оснащенный ПЭВМ IBM PC или совместимыми с ними.. В процессе выполнения лабораторных работ, используется соответствующее свободное или лицензионное специализированное программное обеспечение .

Теоретические сведения необходимые для выполнения практических заданий.

Внедрение информационных технологий в полиграфическое производство и издательскую деятельность, книгораспространение - вызвало необходимость обработки больших объемов данных.

Для реализации этой задачи можно использовать различное программное обеспечение. Как правило в реальных условиях обработка больших информационных массивов осуществляется с помощью электронных таблиц или специализированных программных систем управления базами данных ( СУБД). В данном методическом пособие предлагаются методы обработки данных с помощью электронных таблиц ( ППП MS EXEL), а также с помощью специализированного ППП MS Access.

Методы организации хранения больших информационных массивов, реализуемые различными СУБД, позволили применять автоматизированные способы обработки информации на стадии допечатной подготовки изданий. Автоматизированные банки данных определяют систему математических , программных, информационных, организационных и технических средств предназначенных для централизованного хранения и коллективного использования информации для получения необходимых результатов в процессе подготовки печатных изданий. Введение технологии баз данных в подготовке оригинал-макетов вызывает необходимость использования соответствующих процедур при работе с различными программными продуктами .

Основным принципом организации базы данных является совместное хранение данных и их описаний.

Эти описания обычно называют метаданными. С помощью данного принципа обеспечивается независимость данных от программ обработки, что позволяет запрашивать и модифицировать данные без написания дополнительных программ[1].

1.1. Информация, данные, знания. Терминология

Информация – любые сведения о каком-либо событии, сущности, процессе и т.п., являющиеся объектом некоторых операций: восприятия, передачи, преобразования, хранения или использования.

Данные – это информация, зафиксированная в некоторой форме, пригодной для последующей обработки, передачи и хранения, например, находящаяся в памяти ЭВМ или подготовленная для ввода в ЭВМ[1].

Знания – в системах обработки информации знания понимают как сложноорганизованные данные, содержащие фактографическую и семантическую информацию (т.е. регистрация некоторого факта и его смысловое содержание).

Подготовка информации состоит в её формализации, сборе и перенесении на машинные носители.

Обработка данных – это совокупность задач, осуществляющих преобразование массивов данных. Обработка данных включает в себя ввод данных в ЭВМ, отбор данных по каким-либо критериям, преобразование структуры данных, перемещение данных на внешней памяти ЭВМ, вывод данных, являющихся результатом решения задач, в табличном или в каком-либо ином удобном для пользователя виде[1].

Система обработки данных (СОД) – это набор аппаратных и программных средств, осуществляющих выполнение задач по управлению данными.

Управление данными – весь круг операций с данными, которые необходимы для успешного функционирования СОД.

Предметная область (ПО) – часть реального мира, подлежащая изучению с целью организации управления и, в конечном итоге, автоматизации. ПО представляется множеством фрагментов, которые характеризуются множеством объектов, множеством процессов, использующих объекты, а также множеством пользователей, характеризуемых единым взглядом на предметную область [2].

База данных (БД) – совокупность структурированных взаимосвязанных данных, относящихся к определённой предметной области и организованных таким образом, что эти данные могут быть использованы для решения многих задач многими пользователями.

Банк данных (БнД) – это автоматизированная информационная система, включающая в свой состав комплекс специальных методов и средств (математических, информационных, программных, языковых, организационных и технических) для поддержания динамической информационной модели предметной области с целью обеспечения информационных запросов пользователей.

Информационная система (ИС), основанная на базе данных, служит для сбора, накопления, хранения информации, а также её эффективного использования для разнообразных целей. Информация представляется в виде данных, хранимых в памяти ЭВМ. При проектировании ИС, с одной стороны, решается вопрос о том, какие сведения и для каких целей будут содержаться в системе, с другой – как соответствующие данные будут организованы в памяти ЭВМ, как они будут поддерживаться и обрабатываться при эксплуатации ИС. В настоящее время для повышения эффективности обработки и преобразования информации практически все информационные системы делают автоматизированными (АИС) [1,2].

По сферам применения различают два основных класса АИС: информационно-поисковые (ИПС) и системы обработки данных (СОД). ИПС ориентированы, как правило, на извлечение подмножества хранимых данных, удовлетворяющих некоторому поисковому критерию. Пользователя ИПС интересует, в основном, извлекаемые из базы данных сведения, а не результаты их обработки (пример ИПС – справочные службы).

Обращения пользователя к СОД чаще всего приводят к обновлению данных. Вывод данных может вовсе отсутствовать или представлять собой результат программной обработки хранимых сведений. Пример СОД – банковские системы, осуществляющие открытие/закрытие счетов, пересчёт вкладов в зависимости от процентов, приём/снятие сумм и т.п.

В зависимости от характера информационных ресурсов, с которыми имеют дело АИС, их подразделяют на документальные и фактографические. На практике используются также и системы комбинированного типа.

Разработка любой информационной системы начинается с определения предметной области.

Предметная область (ПО) информационной системы рассматривается как совокупность реальных процессов и объектов (сущностей), представляющих интерес для её пользователей[1,2,3].

Каждый из объектов обладает определённым набором свойств (атрибутов), среди которых можно выделить существенные и малозначительные. Признание какого-либо свойства существенным носит относительный характер. Для упрощения процедуры формализации ПО в большинстве случаев прибегают к разбиению всего множества объектов ПО на группы объектов, однородных по структуре и поведению (относительно рамок рассматриваемой ПО), называемых типами объектов. Данные ПО представлены экземплярами объектов. Экземпляры объектов одного типа обладают одинаковыми наборами атрибутов, но должны отличаться значением хотя бы одного атрибута для того, чтобы быть узнаваемыми[1].

Для каждого объекта определяется идентификатор – ключевой атрибут или комбинация атрибутов. Такой идентификатор называется первичным ключом, его значение является уникальным и обязательным.

Между объектами ПО могут существовать связи, имеющие различный содержательный смысл (семантику). Эти связи могут быть факультативными или обязательными .

Различают типы множественных связей: "один к одному" (1:1), "один ко многим" (1:n) и "многие ко многим" (m:n).

Совокупность типов сущностей и типов связей между ними характеризует структуру предметной области. Собственно данные представлены экземплярами объектов и связей между ними.

Система БД включает два основных компонента: собственно базу данных и систему управления . Большинство СОД(систем обработки данных) включают также программы обработки данных, которые обращаются к данным через систему управления.

В соответствии с ГОСТ , система управления базами данных (СУБД) обеспечивает выполнение двух групп функций: предоставление доступа к базе данных пользователям (или прикладному программному обеспечению- ППО) и управление хранением и обработкой данных в БД.

БД является информационной моделью внешнего мира, некоторой предметной области. В ней, как правило, хранятся данные об объектах, их свойствах и характеристиках. Во внешнем мире объекты взаимосвязаны, поэтому в БД эти связи должны быть отражены. Если связи между данными в БД отсутствуют, то имеет смысл говорить о нескольких независимых БД, имеющих раздельное хранение.

В памяти ЭВМ создаётся динамически обновляемая модель предметной области, что обеспечивает соответствие базы данных текущему состоянию ПО (периодически или в режиме реального времени). Одни и те же данные БД могут быть использованы для решения многих прикладных задач. Этим база данных принципиально отличается от любой другой совокупности данных внешней памяти ЭВМ [1].

Понятие модели данных

Модель данных – это математическое средство абстракции, позволяющее отделить факты от их интерпретации и вместе с тем обеспечить развитые возможности представления соотношения данных.

Модель данных – это комбинация трех составляющих:

1. Набора типов структур данных.

2. Набора операторов или правил вывода, которые могут быть применены к любым правильным примерам типов данных, перечисленных в (1), чтобы находить, выводить или преобразовывать информацию, содержащуюся в любых частях этих структур в любых комбинациях.

3. Набора общих правил целостности, которые прямо или косвенно определяют множество непротиворечивых состояний БД и/или множество изменений её состояния.

Типы структур данных

Структуризация данных базируется на использовании концепций "агрегации" и "обобщения". Первый вариант структуризации данных был предложен Ассоциацией по языкам обработки данных (Conference on Data Systems Languages, CODASYL).

Элемент данных – наименьшая поименованная единица данных, к которой СУБД может обращаться непосредственно и с помощью которой выполняется построение всех остальных структур. Для каждого элемента данных должен быть определён его тип.

Агрегат данных – поименованная совокупность элементов данных внутри записи, которую можно рассматривать как единое целое. Агрегат может быть простым (включающим только элементы данных) и составным (включающим наряду с элементами данных и другие агрегаты).

Запись – поименованная совокупность элементов данных или элементов данных и агрегатов. Запись – это агрегат, не входящий в состав никакого другого агрегата; она может иметь сложную иерархическую структуру, поскольку допускается многократное применение агрегации. Различают тип записи (её структуру) и экземпляр записи, т.е. запись с конкретными значениями элементов данных. Одна запись описывает свойства одного объекта ПО (экземпляра)[1,2].

Среди элементов данных (полей) выделяются одно или несколько ключевых полей. Значения ключевых полей позволяют классифицировать объект, к которому относится конкретная запись. Ключи с уникальными значениями называются потенциальными. Каждый ключ может представлять собой агрегат данных. Один из ключей является первичным, остальные – вторичными. Первичный ключ идентифицирует экземпляр записи и его значение должно быть уникальным в пределах записей одного типа.

Иногда термин "запись" заменяют термином "группа".

Набор (или групповое отношение) – поименованная совокупность записей, образующих двухуровневую иерархическую структуру. Каждый тип набора представляет собой отношение (связь) между двумя или несколькими типами записей. Для каждого типа набора один тип записи может быть объявлен владельцем набора, остальные типы записи объявляются членами набора. Каждый экземпляр набора должен содержать только один экземпляр записи типа владельца и столько экземпляров записей типа членов набора, сколько их связано с владельцем. Для группового отношения также различают тип и экземпляр.

Операции над данными

Модель данных определяет множество действий, которые допустимо производить над некоторой реализацией БД для её перевода из одного состояния в другое. Это множество соотносят с языком манипулирования данными (Data Manipulation Language, DML).

Любая операция над данными включает в себя селекцию данных (select), то есть выделение из всей совокупности именно тех данных, над которыми должна быть выполнена требуемая операция, и действие над выбранными данными, которое определяет характер операции. Условие селекции – это некоторый критерий отбора данных, в котором могут быть использованы логическая позиция элемента данных, его значение и связи между данными [1,2,3].

По типу производимых действий различают следующие операции:

  • идентификация данных и нахождение их позиции в БД;

  • выборка (чтение) данных из БД;

  • включение (запись) данных в БД;

  • удаление данных из БД;

  • модификация (изменение) данных БД.

Обработка данных в БД осуществляется с помощью процедур базы данных – транзакций. Транзакция – это последовательность операций над данными, которая является логически неделимой, то есть рассматривается как единая макрооперация. Транзакция либо выполняется полностью, либо не выполняется совсем. Никакая другая процедура или операция не могут обратиться к данным, которые обрабатываются стартовавшей процедурой, до тех пор, пока последняя не закончит свою работу.

Реляционная модель данных (РМД)

Понятие отношения

Реляционная модель данных была предложена математиком Э.Ф. Коддом (Codd E.F.) в 1970 г. РМД является наиболее широко распространенной моделью данных и единственной из трех основных моделей данных, для которой разработан теоретический базис с использованием теории множеств [2,3].

В основе РМД лежит понятие отношения, представляющего собой подмножество декартова произведения доменов. Домен – это множество значений, которое может принимать элемент (например, множество целых чисел, множество комбинаций символов длиной N и т.п.).

Широкое распространение РМД объясняется в первую очередь простотой представления и формирования БД, универсальностью и удобством обработки данных, которая осуществляется с помощью декларативного языка запросов SQL (Structured Query Language) [3].

Существуют два стандарта SQL, определённые американским национальным институтом стандартов (ANSI): SQL-89 (SQL1) и SQL-92 (SQL2). В настоящее время в стадии разработки находится новый стандарт – SQL3. Большинство коммерческих систем управления базами данных (СУБД) поддерживают стандарт SQL2, который принят ISO (International Standards Organization) в качестве международного стандарта. (Подробнее об SQL рассказано в [10]).

Всё возрастающая сложность приложений баз данных и ограниченность РМД привели к развитию модели Кодда, которое сначала получило название расширенной реляционной модели, а позже получило свое развитие в объектно-реляционных моделях данных (ОРМД).

Объектно-реляционные модели данных

Расширению возможностей реляционных баз данных (РБД) способствует применение в концепции баз данных понятия объекта, аналогичного понятию объекта в объектно-ориентированном программировании. Это расширение достигается за счёт использования таких объектно-ориентированных компонентов, как пользовательские типы данных, инкапсуляция, полиморфизм, наследование, переопределение методов и т.п.

К сожалению, до настоящего времени (2003 г.) разработчики не пришли к единому мнению о том, как следует определять ОРМД. Модели, поддерживаемые различными производителями СУБД, существенно отличаются по своим функциональным характеристикам, поэтому о включении объектов в РМД можно говорить только как об общем направлении развития баз данных. О перспективах этого направления свидетельствует тот факт, что ведущие фирмы–производители СУБД, в числе которых Oracle, Informix и INGRES, расширили возможности своих продуктов до объектно-реляционной СУБД (ОРСУБД).

В большинстве реализаций ОРМД объектами признаются агрегат и таблица (отношение), которая может входить в состав другой таблицы. Методы обработки данных представлены в виде хранимых процедур и триггеров, которые являются процедурными объектами базы данных, и связаны с таблицами. На внутреннем (физическом) уровне все данные ОРБД хранятся в виде отношений, и ОРСУБД поддерживают язык SQL.

Объектно-ориентированные модели данных

Ещё один подход к построению БД – использование объектно-ориентированных моделей данных (ООМД). Моделирование данных в ООМД базируется на понятии объекта. Для ООМД, как и в случае с ОРМД, не существует общепризнанной модели данных.

При создании объектно-ориентированных СУБД (ООСУБД) используются разные методы, а именно: встраивание в объектно-ориентированный язык средств для работы с базами данных; создание объектно-ориентированных библиотек функций для работы с СУБД; расширение существующего языка работы с базами данных объектно-ориентированными функциями; создание нового языка и новой объектно-ориентированной модели данных [2,3].

К достоинствам ООМД можно отнести широкие возможности моделирования предметной области, выразительный язык запросов и повышенную производительность. Эти модели обычно применяются для сложных предметных областей, для моделирования которых не хватает функциональности реляционной модели (например, систем автоматизации проектирования, издательских систем и т.п.).

Среди недостатков ООМД следует отметить отсутствие универсальной модели, недостаток опыта создания и эксплуатации ООБД, сложность использования и недостаточность средств защиты данных.

Проектирование БД – одна из наиболее сложных и ответственных задач, связанных с созданием информационной системы. В результате решения этой задачи должны быть определены содержание БД, эффективный для всех её будущих пользователей способ организации данных и инструментальные средства управления данными.

Процесс проектирования БД включает в себя следующие этапы:

1. Информационно-логическое (инфологическое) проектирование.

2. Определение требований к операционной обстановке, в которой будет функционировать информационная система.

3. Выбор СУБД и других инструментальных программных средств.

4. Логическое проектирование БД.

5. Физическое проектирование БД.

Система управления базами данных (СУБД) – это важнейший компонент АИС, основанной на базе данных. СУБД необходима для создания и поддержки базы данных информационной системы в той же степени, как для разработки программы на алгоритмическом языке – транслятор. Программные составляющие СУБД включают в себя ядро и сервисные средства (утилиты).

Ядро СУБД – это набор программных модулей, необходимый и достаточный для создания и поддержания БД, то есть универсальная часть, решающая стандартные задачи по информационному обслуживанию пользователей. Сервисные программы предоставляют пользователям ряд дополнительных возможностей и услуг, зависящих от описываемой предметной области и потребностей конкретного пользователя.

Системой управления базами данных называют программную систему, предназначенную для создания на ЭВМ общей базы данных для множества приложений, поддержания её в актуальном состоянии и обеспечения эффективного доступа пользователей к содержащимся в ней данным в рамках предоставленных им полномочий.

В качестве основных функций СУБД можно выделить следующие:

1. Хранение, извлечение и обработка данных.

Это основная функция системы, ради которой она создаётся.

2. Наличие языка обработки данных.

Язык обработки данных должен включать все необходимые для управления данными операции.

3. Наличие доступного пользовательского каталога данных.

Каталог (словарь-справочник) содержит метаданные, т.е. информацию о данных. Он должен быть организован с использованием тех же структур, что и сами данные. Это даёт возможность использовать для доступа к нему тот же язык, который используется для доступа к самим данным.

4. Поддержка многопользовательского режима доступа.

База данных создаётся для решения многих задач многими пользователями. Это подразумевает возможность одновременного доступа многих пользователей к данным. Данные в БД являются разделяемым ресурсом, и СУБД должна обеспечивать разграничение доступа к ним.

5. Обеспечение логической независимости данных.

Это свойство позволяет сконструировать несколько различных логических взглядов (представлений) на одни и те же данные для разных групп пользователей, не изменяя их физического представления. При этом логическое представление данных может сильно отличаться от физической структуры их хранения и может синтезироваться динамически на основе хранимых объектов БД в процессе обработки запросов.

6. Обеспечение физической независимости данных.

Под физической независимостью данных подразумевается способность СУБД предоставлять некоторую свободу модификации способов организации базы данных в среде хранения, не вызывая необходимости внесения изменений в логическое представление данных. Это позволяет оптимизировать среду хранения данных с целью повышения эффективности системы, не затрагивая созданных прикладных программ, работающих с БД.

Свойства (5–6) обеспечиваются с помощью одних и тех же механизмов СУБД.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]