Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Петров все рефераты.docx
Скачиваний:
6
Добавлен:
19.09.2019
Размер:
656.55 Кб
Скачать
  1. Система управления базами данных фактографических аис

История СУБД как особого вида программного обеспечения неразрывно связана с историей начала использования электронно-вычислительных машин для организации хранения и обработки информации. Именно в то время (конец 60-х, начало 70-х годов) были разработаны основы программного обеспечения для создания и эксплуатации фактографических информационных систем. В конце 70-х, начале 80-х годов направление программного обеспечения под общим названием «СУБД» превратилось в одну из наиболее бурно развивающихся отраслей программной индустрии. При этом основные программно-математические и технологические решения по СУБД были разработаны в 70-х годах в ряде крупных исследовательских проектов. Наиболее известными из них являются проект «Рабочей группы по базам данных» КОДАСИЛ (DBTG CODASYL) с участием уже упоминавшегося Ч. Бахмана, пионерские работы основателя теории реляционных баз данных Е. Кодда, проект разработки системы управления реляционными базами данных «System R» фирмы IBM (1975-1979 гг.) и проект разработки СУБД «Ingres» в университете Беркли (1975-1980 гг.) под руководством известного специалиста в области баз данных М. Стоунбрейкера.

  1. Внутренняя схема баз данных фактографических аис

Изначально и по сей день программное обеспечение АИС (СУБД) в качестве места физического размещения данных ориентировано на внешнюю (дисковую) память. Как уже отмечалось, размещение данных во внешней памяти, точнее эффективность доступа к ним во внешней памяти, существенно влияет на эффективность обработки данных. В результате важным аспектом АИС является внутренняя схема базы данных, которую организует и поддерживает СУБД. В общем плане внутренняя схема базы данных включает три основных компонента, представленные на рис. 3.

Рис. 3. Состав внутренней схемы базы данных

Центральным компонентом внутренней схемы являются информационные массивы, включающие собственно данные (информационных объектов логической схемы БД, т.е. в реляционных СУБД таблиц), и массивы индексов, являющихся специальными дополнительными конструкциями для ускорения доступа к данным основных информационных объектов. Информационные массивы в большинстве СУБД состоят из одной или нескольких так называемых страниц, каждая из которых содержит совокупность некоторых единичных элементов, называемых физическими записями. В результате, единичным элементом внутренней схемы баз данных АИС является физическая запись, в большинстве случаев совпадающая по смыслу с логической записью, т. е. в реляционных СУБД с табличной строкой. Способы организации записей в страницах (расположение, добавления, корректировка, удаление) составляют физические структуры данных, которые образуют третий (низший) уровень представления информации в информационной системе (см. рис. 1). Важным компонентом внутренней структуры является каталог БД, в котором размещается системная информация по логической структуре БД, включающая описание основных информационных объектов (имена, структура, параметры, связи) и ограничения целостности данных. Организация системной информации БД определяется особенностями конкретной СУБД, а сам каталог может входить непосредственно в файлы данных (область описателей данных) или составлять отдельный информационный массив. Как уже отмечалось, в состав автоматизированного банка данных АИС помимо самой базы данных входит и прикладной компонент, образуемый совокупностью интерфейсных элементов представления, ввода и обработки данных, типовых запросов и процедур обработки данных, а также «событий» и «правил», отражающих правила и специфику предметной области АИС (так называемые «правила бизнеса»). Соответственно во внутренней схеме БД выделяется специальная область, в которой размещается информация по прикладному компоненту АИС. Все три части внутренней структуры и их составные элементы (например, информационные массивы отдельных информационных объектов БД) могут размещаться в одном едином файле базы данных или в разных файлах. Во втором случае внутренняя схема БД определяется совокупностью и порядком расположения данных файлов.

Источники

  1. Избачков Ю.С., Петров В.Н. Информационные системы, 2-е изд. – СПБ.: Питер, 2006 – 656

  2. Гайдамакин Н.А. Автоматизированные информационные системы, базы и банки данных, М.: Гелиос АРВ, 2002. – 368 с

http://www.nlr.ru - Портал Российской Национальной Библиот

Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики

Кафедра прикладной экономики и маркетинга

Р Е Ф Е Р А Т

на тему

Фактографические системы. Модели данных

Выполнила: студентка гр. 2070

(Луговая Карина Александровна,)

Принял: Петров В.Ю.

Санкт – Петербург

2012

Содержание

Введение………………………………………………………………………….…3

Фактографические системы…………………………….……………………….4

Модели данных………………………………………………….………………....4

Разновидности моделей данных…………………………………………………….6

Источники………………………………………………………………………….7

ВВЕДЕНИЕ

Модель данных, поддерживаемая механизмами СУБД, потенциально полностью определяет множество всевозможных конкретных баз данных, которые могут быть созданы средствами этой системы, а также способы модификации состояния базы данных с целью отображения тех изменений, которые происходят в предметной области.

Следует обратить внимание на двойственную роль модели данных в СУБД. Прежде всего, она определяет правила представления модели предметной области в среде системы базы данных. Поэтому можно рассматривать модель данных как метамодель для описания моделей различных предметных областей в среде выбранной СУБД. Именно в терминах модели данных, поддерживаемой данной СУБД, представляются в среде этой системы интенсиональная (в терминах типов данных и связей) и экстенсиональная (в терминах экземпляров данных и экземпляров связей) модели предметной области, а также операции над элементами этих моделей.

Другое предназначение модели данных - служить основой механизмов управления данными СУБД. Они используют интенсиональную модель предметной области (схему базы данных), которая определяет структуру базы данных и обеспечивает корректный доступ механизмов управления данными СУБД к данным в базе данных. Именно в терминах схемы базы данных осуществляются операции манипулирования данными и формулируются пользовательские запросы.

ФАКТОГРАФИЧЕСКИЕ СИСТЕМЫ

Фактографические АИС накапливают и хранят данные в виде множества экземпляров одного или нескольких типов структурных элементов (информационных объектов). Каждый из таких экземпляров структурных элементов или некоторая их совокупность отражают сведения по какому-либо факту, событию и т. д., отделенному (вычлененному) от всех прочих сведений и фактов. Структура каждого типа информационного объекта состоит из конечного набора реквизитов, отражающих основные аспекты и характеристики сведений для объектов данной предметной области. К примеру, фактографическая АИС, накапливающая сведения по лицам, каждому конкретному лицу в базе данных ставит в соответствие запись, состоящую из определенного набора таких реквизитов, как фамилия, имя, отчество, год рождения, место работы, образование и т. д. Комплектование информационной базы в фактографических АИС включает, как правило, обязательный процесс структуризации входной информации из документального источника. Структуризация при этом осуществляется через определение (выделение, вычленение) экземпляров информационных объектов определенного типа, информация о которых имеется в документе, и заполнение их реквизитов.

Модель данных.

Основу механизмов управления данными в СУБД составляет некоторая модель данных. Так называется инструмент моделирования предметной области, позволяющий отображать ее состояния и динамику в среде базы данных, управляемой этой системой. Более точно, модель данных - это совокупность правил структурирования данных в базах данных, допустимых операций над ними и ограничений целостности, которым эти данные должны удовлетворять. Если некоторая модель данных реализуется механизмами управления данными рассматриваемой СУБД, то говорят, что эта СУБД поддерживает указанную модель данных

В классической теории баз данных, модель данных есть формальная теория представления и обработки данных в системе управления базами данных (СУБД), которая включает, по меньшей мере, три аспекта:

1) аспект структуры: методы описания типов и логических структур данных в базе данных;

2) аспект манипуляции: методы манипулирования данными;

3) аспект целостности: методы описания и поддержки целостности базы данных.

Аспект структуры определяет, что из себя логически представляет база данных, аспект манипуляции определяет способы перехода между состояниями базы данных (то есть способы модификации данных) и способы извлечения данных из базы данных, аспект целостности определяет средства описаний корректных состояний базы данных.

Модель данных — это абстрактное, самодостаточное, логическое определение объектов, операторов и прочих элементов, в совокупности составляющих абстрактную машину доступа к данным, с которой взаимодействует пользователь. Эти объекты позволяют моделировать структуру данных, а операторы — поведение данных.

Модели баз данных базируются на современном подходе к обработке информации, состоящем в том, что структуры данных обладают относительной устойчивостью.

Структура базы данных должна отображать информационную модель предметной области, позволять формировать элементы данных (записи) и взаимосвязи между ними. При этом взаимосвязи обычно типизированы следующим образом: “один к одному” — одна запись может быть связана только с одной другой записью; “один ко многим” — одна запись может быть связана со многими другими; “многие ко многим” — одна и та же запись может входить в отношения со многими другими записями.

Использование того или иного типа взаимосвязи определило четыре основные модели баз данных: иерархическую, сетевую, реляционную и объектно-ориентированную.

Иерархическая модель данных представляет данные в виде древовидной структуры и является реализацией логических отношений “один ко многим”.

Сетевая модель данных позволяет отображать отношения “один ко многим” и “многие ко многим”. В ее основу положены сетевые структуры. Любой элемент сетевой структуры может быть связан с любым другим элементом.

В реляционных базах данных отношения представляются в виде двумерной таблицы. Каждое отношение представляет собой подмножество декартовых произведений доменов. Доменом здесь называется множество значений, расположенных в столбце соответствующего атрибута двумерной таблицы.

Объектно-ориентированные модели данных объединяют в себе две модели данных — реляционную и сетевую и используются для создания БД со сложными структурами данных.

Основные устройства внешней памяти компьютера — магнитные диски и магнитные ленты. В отличие от оперативной памяти здесь время доступа к данным зависит от места расположения данных на диске или ленте (требуется время на подвод нужного участка к механизму чтения-записи).

Данные во внешней памяти хранятся в виде файлов.

Файл — множество логически связанных записей. В простейшем случае файл — последовательный массив записей.

С диска читается (записывается) не один символ (байт), а сектор или блок данных размером обычно 512 байт. Время доступа к гибкому диску (FDD) — 200-500 мс, к жесткому (HDD) — до 10-12 мс. Размер сектора оговорен конструкцией диска и не зависит от проектировщика системы. Обмен дисковой памяти с оперативной происходит только целыми секторами. Поэтому оптимальные длины записей, при которых достигается минимальное время обмена, должны быть кратными длине сектора. Правда, выигрыш по сравнению с записями, пересекающими границу сектора, составляет всего 2-5%.

Операционная система отводит часть оперативной памяти под буферы ввода-вывода. Каждый буфер имеет размер сектора, а их количество задается пользователем. При попытке чтения какого-либо сектора из внешней памяти операционная система ищет его сначала среди буферов, и только в случае его отсутствия происходит реальное чтение из внешней памяти. Считанный сектор занимает свободный буфер или вытесняет из одного из буферов давно не используемую информацию.

Во внешней памяти несколько смежных секторов (обычно 2 или 4, а вообще — до 16) образуют кластер. При создании файла ему отводится один кластер. Если информация выходит за пределы кластера, файлу отводится новый кластер из числа свободных на диске. Он может быть несмежным с первым и связывается с ним в цепочку. Длина цепочки ограничивается только наличием свободных кластеров.

На диске выделяется место под таблицу размещения файлов (FAT — File Allocation Table), остальное пространство диска используется для размещения файлов. В таблице хранятся описания файлов и соответствующие им списки (цепочки) кластеров.

Доступ к файлу начинается с обращения к FAT и поиска имени файла, при успешном поиске становятся доступны кластеры файла в области размещения файлов. При записи на диск нового файла в FAT предоставляется очередная свободная строка, а в области размещения файлов — очередные свободные кластеры.

При удалении файла первый символ имени файла в FAT заменяется служебным символом (обычно знаком вопроса). В результате имя файла и занимаемые им кластеры становятся недоступными