Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Эволюция баз данных

.pdf
Скачиваний:
119
Добавлен:
11.06.2015
Размер:
3.26 Mб
Скачать

Министерство образования и науки РФ Федеральное государственное бюджетное образовательное

учреждение высшего профессионального образования Национальный исследовательский ядерный университет «МИФИ» ОБНИНСКИЙ ИНСТИТУТ АТОМНОЙ ЭНЕРГЕТИКИ Факультет кибернетики

А.Н. АНОХИН

ЭВОЛЮЦИЯ БАЗ ДАННЫХ

Учебное пособие по курсу «Базы данных»

Допущено учебно-методическим объединением вузов по университетскому политехническому образованию в качестве учебного пособия для студентов

высших учебных заведений, обучающихся по направлениям 230100 «Информатика и вычислительная техника», 230400 «Информационные системы и технологии»

Обнинск 2011

УДК 004.6

Анохин А.Н. Эволюция баз данных. Учебное пособие по курсу «Базы данных». – Обнинск: ИАТЭ НИЯУ МИФИ, 2011. – 84 с.

В пособии рассматривается эволюция носителей данных, моделей данных и архитектур баз данных. Выполнен краткий исторический обзор технологий и систем управления базами данных. Представлены современные направления развития баз данных. Описаны основные понятия и разновидности клиент-серверных архитектур. Рассмотрены различные механизмы управления транзакциями.

Для студентов, обучающихся по направлению 230100 «Информатика и вычислительная техника», студентов и аспирантов смежных кибернетических специальностей и направлений, специалистов, занимающихся проектированием и внедрением баз данных.

Табл. 27, ил. 40, библиограф. 26 назв.

Рецензенты:

кафедра автоматизированных систем управления Российского государственного университета нефти и газа им. И.М. Губкина;

д.т.н., с.н.с. Е.Д. Вязилов к.т.н., доц. А.П. Ремонтов

Темплан 2011, поз. 17

©ИАТЭ НИЯУ МИФИ, 2011 г.

©Анохин А.Н., 2011 г.

2

ПРЕДИСЛОВИЕ

История баз данных – это эволюция четырех составляющих: 1) носителей информации, 2) методов структурирования и организации данных, 3) архитектур баз данных и 4) программного инструментария для создания и управления базами данных. Развитие систем управления базами данных (СУБД) очень показательно для информационных технологий. Их появление в конце 1960-х гг. вызвало бурный всплеск работ в этом направлении. В 70-80-е гг. в развитых странах СУБД создавались десятками. Только в СССР за десятилетие этого периода было создано около 60 (!) СУБД [12]. Со временем работа с данными все более унифицировалась, что привело к укрупнению производителей и захвату рынка всего лишь несколькими компаниями и их продуктами. Сегодня вряд ли найдется специалист, который сможет «с ходу» назвать больше десятка современных СУБД, не считая продуктов специального назначения. Для более глубокого изучения истории баз данных будет полезна энциклопедия [4].

Несмотря на описательный характер данного пособия, в нем используются понятия, подробная интерпретация которых опущена. Однако без этих терминов рассказать об эволюции баз данных невозможно. Надеюсь на читательскую интуицию, которая подскажет правильное значение терминов. В крайнем случае, читатель может обратиться к соответствующей учебной литературе по основам концептуального моделирования данных.

Каждая глава завершается контрольными вопросами. Их цель состоит не столько в проверке знаний, сколько в побуждении читателя к творческому осмыслению материала и, возможно, к поиску дополнительной информации.

Пособие содержит материал для изучения дисциплин «Базы данных», «Управление данными», «Методология и история кибернетики, информатики и вычислительной техники» (для студентов кибернетических направлений).

Выражаю глубокую признательность редактору и рецензентам данного пособия и особенно – Е.Д. Вязилову, который поделился уникальным опытом работы с нереляционными базами данных.

Автор

3

1. ЭВОЛЮЦИЯ НОСИТЕЛЕЙ ИНФОРМАЦИИ

Очевидно, что первым способом хранения данных был язык, сочетающий в себе как звуки, так и жесты. Информация, передаваемая таким способом, не могла существовать без непосредственного общения людей и в любой момент могла быть утеряна навсегда. Начиная с Каменного века и по сегодняшний день человечество постоянно заботилось о «материализации» и сохранении информации. Для кодирования информации были придуманы самые разные алфавиты – наскальные рисунки, узелки, клинья, буквы, цифры, символы, цвета и др. Информация фиксировалась на таких носите-

лях, как камень, папирус, бумага, ткань, металл. Общей чертой всех этих способов являлось то, что такая информация порождалась человеком и предназначалась для использования только человеком. Сегодня такой способ работы с информацией называется «ручной обработкой». Все современные системы ручной работы с информацией сформировались еще в Средние века, когда окончательно устоялись основные языки и алфавиты, было налажено производство бумаги и появились печатные станки.

С XVII в. начинается история механической и электромеханической обработки данных. Первыми устройствами механической обработки данных стали шарманки, музыкальные шкатулки и ткацкие станки. В музыкальных устройствах для фиксации данных использовались металлические валики или диски с выступами. Когда валик вращался, эти выступы отклоняли подпружиненные рычаги, которые затем возвращались на свое место и вызывали удар по колокольчику или открытие одной из труб маленького органа. Позднее в шарманках стали применяться и перфокарты.

1.1. Перфокарты и перфоленты

Впервые перфокарты для управления ткацким станком использовал французский ткач Базиль Бошо (Basile Bouchon) еще в 1725 г. Однако более широкое применение перфокарт в текстильной промышленности связано с именем Жозе Мари Жаккара (Joseph Marie Jacquard) – французского изобретателя программируемого ткацкого станка. Перфокарта представляла собой лист плотного картона с матрицей прорезей (рис. 1). Картон прокатывался через линию игольчатых рычажков, которые «западали» в прорези и направляли соответствующую нить.

4

Рис. 1. Перфокарты Жаккара, Корсакова и Холлерита (фото из материалов энциклопедии Wikipedia)

В задачах обработки информации перфокарты впервые были использованы в 1832 г. русским изобретателем Семеном Николаевичем Корсаковым – создателем механических устройств для информационного поиска и классификации1. Примерно в это же время английский математик Чарлз Бэббидж (Charles Babbage) сформулировал идею применения перфокарт для управления вычислительным процессом (рис. 2).

Рис. 2. Перфокарты для аналитической машины Ч. Бэббиджа (из экспозиции Лондонского музея науки, фото автора)

1Осознание значимости этого исторического факта пришло благодаря работам профессора кафедры кибернетики МИФИ Геллия Николаевича Поварова – известного ученого и популяризатора кибернетики в нашей стране.

5

Активное использование перфокарт в информатике началось в конце XIX в. и связано с именем американского инженера Германа Холлерита (Herman Hollerith). В 1890 г. созданный им табулятор использовался для переписи населения США. В этот период Холлерит организовал фирму по производству табуляторов, которая сегодня известна под названием «IBM». Начиная с оборудования Холлерита прорези в перфокартах стали использовать для обеспечения электрического контакта, а позднее – для пропускания света. Параллельно с перфокартами развиваются их сородичи – перфоленты, активно применявшиеся в телеграфии с середины XIX в. (рис. 3).

Рис. 3. Перфокарта и перфолента для ЭВМ 1960-х гг.

С 1950-х гг. в течение 30-ти лет (до появления дискет) перфокарты и перфоленты являются основным, наиболее демократичным персональным носителем информации для ЭВМ. Перфоленты были компактнее перфокарт, однако легко рвались. Если в перфоленте находили ошибку, то всю ленту приходилось перебивать заново, в то время как в колоде перфокарт достаточно было заменить лишь одну карту.

Перфокарты и перфоленты были более чем простыми носителями информации. На перфокартах делали записи, из них сворачивали пепельницы, их использовали в качестве блюдца для кусочка торта. В программистских коллективах перфолентами украшали новогодние елки и перевязывали подарки. Долгое время перфолента являлась символом кибернетики и вычислительной техники, она появлялась на различных эмблемах и обложках книг по программированию.

6

1.2. Магнитные ленты

XX в. стал веком магнитных носителей информации. Возможность записи информации на магнитную проволоку была впервые реализована в 1898 г. Спустя 30 лет в Германии на магнитную ленту был записан звук. Для производства оборудования и пленки в Германии были образованы фирмы AEG и BASF. Использование магнитных лент для хранения данных началось в 1951 г. на одной из первых американских ЭВМ UNIVAC I. Лента имела ширину 12,7 мм (полдюйма) и содержала восемь дорожек, позволявших записывать информацию с плотностью 128 байт на дюйм длины.

Через год компания IBM создает устройство, использующее аналогичную ленту, но работающее с семью дорожками (шесть дорожек с данными и одна для образования контрольной суммы). Первое устройство записывало данные с плотностью 100 символов/ дюйм («символ» в данном случае – это информация, записанная на одном поперечном срезе пленки), последующие модели – с плотностью до 800 символов/дюйм. С появлением в 1964 г. ЭВМ 360-й серии IBM переходит на 9-дорожечный стандарт магнитных лент (восемь дорожек с данными и одна для образования контрольной суммы). Плотность записи увеличивается до 6250 байт/дюйм, в результате чего на одну катушку (рис. 4) диаметром около 27 см, вмещающую до 730 м пленки, можно было записать до 170 МБ данных. Такие ленты (правда, с меньшей плотностью записи) применялись и для отечественных ЭВМ серий ЕС и СМ.

Рис. 4. Катушка с магнитной лентой для ЕС ЭВМ и компакт-кассета

7

В быту магнитные ленты использовались для записи и воспроизведения звука и видео. В 1963 г. компания Philips представила свою новую разработку – компакт-кассету. Ее пластмассовый корпус размером 10×6,4 см содержал две катушки, между которыми перематывалась 3,81 мм пленка длиной до 130 м (рис. 4). В 1970-е гг. компакт-кассеты были настолько дешевы и популярны, что их стали использовать и для записи информации для микрокомпьютеров

– прообразов современных «персоналок». В 1975 г. группой американских экспертов, собравшихся в Канзас-Сити, был выработан стандарт, получивший незамысловатое название – KSA (KansasCity Standard). Этот стандарт открыл дорогу широкому применению компакт-кассет и бытовых магнитофонов вместе с персональными компьютерами того времени. На них записывали и передавали друг другу первые игры и программы. Одной из существенных проблем этих носителей информации была крайне медленная скорость – типичная программа на Бэйсике объемом 8 КБ загружалась до пяти минут.

Использование магнитных лент продолжается до сих пор. Небольшие коробочки – устройства для записи и чтения информации с магнитной ленты – получили название стримеров (в англ. терминологии streamer или tape drive). Сама лента помещена в «картриджи» – современные аналоги компакт-кассет емкостью до 1 ТБ. Для записи используются несколько форматов, наиболее популярным из которых является LTO (Linear Tape Open).

Очевидным недостатком магнитных лент является последовательный доступ к данным. Иначе говоря, для чтения информации, записанной в «хвосте» ленты, необходимо прокрутить всю ленту, периодически проверяя – не достигли ли мы нужного участка. Поэтому основным назначением ленты сегодня является хранение архивов и резервное копирование данных.

Революция в хранении информации произошла в 1950-х гг. с появлением магнитных дисков и магнитных барабанов. Их основным достоинством является возможность прямого и очень быстрого доступа к данным.

1.3. Магнитные барабаны

Магнитный барабан был изобретен в 1932 г. Густавом Таушеком (Gustav Tauschek), пионером информационных технологий в Австрии, известным как разработчик счетных машин на перфокар-

8

тах. Барабан представляет собой металлический цилиндр, покрытый ферромагнитным слоем. На цилиндрической поверхности размечены параллельные кольца – дорожки, для каждой из которых предусмотрена своя неподвижная головка чтения-записи. Цилиндр вращается вокруг своей оси, и каждая головка независимо от другой выполняет чтение и запись данных.

В цифровых ЭВМ магнитные барабаны впервые были применены в Великобритании в 1949 г. в проекте Mark 1. Уже через годдва барабаны стали выпускаться и в США, а их объем превысил полмегабайта. В 1954 г. компания IBM выпустила барабанный накопитель для известного компьютера того времени IBM-650. Этот барабан имел длину 16 дюймов (около 40 см) и 40 дорожек (рис. 5).

Рис. 5. Магнитный барабан для IBM-650 (фото с сайта компании IBM) и МБ-11 (начало 1970-х гг., фото из материалов энциклопедии Wikipedia)

Благодаря параллельному доступу одновременно ко всем дорожкам барабаны обеспечивали очень высокую скорость обмена данными. Это качество способствовало применению барабанов в качестве расширителя оперативной памяти – чаще всего для свопинга, т.е. для подкачки страниц виртуальной памяти [8]. Такая возможность была особенно привлекательной при решении сложных расчетных задач. В 60-е гг. XX в. лидерами этого направления были компьютеры UNIVAC, оснащаемые накопителями на магнитных барабанах FASTRANDTM. Выпущенные в середине 1960-х гг. накопители FASTRAND-II содержали два вращающихся в противоположных направлениях барабана. Вдоль этих барабанов перемещалась штанга, на которой располагались 64 головки. Штанга имела 192 позиции, в каждой из которых «захватывались» одновременно 64 дорожки. Общая емкость этого накопителя составляла около 100 МБ.

9

Последними серийными накопителями на барабанах стали IBM 2301 и IBM 2303, входившие в состав семейства ЭВМ 360-й серии. Магнитный барабан имел диаметр 30 см и длину 60 см и вмещал чуть более 4 МБ данных. В СССР магнитные барабаны были очень популярны в ЭВМ серии БЭСМ. В БЭСМ-1 (1953 г.) они имели емкость, аналогичную 200 КБ2, а в БЭСМ-6 (конец 1960-х) – более 1,5 МБ. Накопители на барабанах (например, МБ-9, МБ-11, рис. 5) применялись практически во всех советских ЭВМ того времени – М-20, БЭСМ-4, М-220, М-222, Наири-3, Раздан-3, Минск-32, Урал.

В серии ЕС ЭВМ также был предусмотрен накопитель ЕС-5033, емкость которого составляла почти 6 Мбайт.

1.4. Магнитные диски

Первый накопитель на магнитных дисках производства IBM появился в 1956 г. К тому времени возможность прямого доступа к данным на дисках была уже оценена в звукозаписи, где диски стали применяться уже с конца XIX в. Однако аналоговая форма информации, подверженность помехам и невозможность перезаписи не позволяли использовать виниловые диски для вычислительной техники.

Первый дисковый накопитель содержал 50 магнитных дисков диаметром 61 см, посаженных на одну ось с небольшим промежутком для движения считывающей головки (рис. 6). Такая конструкция получила название «пакет дисков» (disk pack, англ.). Общая емкость первого пакета составляла всего 4,4 МБ. В дальнейшем диаметр дисков уменьшился до 36 см и к середине 1960-х гг. в рамках серии IBM/360 выпускались пакеты из шести дисков емкостью 7,25 МБ и из 10-ти дисков емкостью 29 МБ (рис. 7). К 1970 г. емкость пакетов уже достигла 200 МБ, однако такие накопители были чрезвычайно дорогостоящими.

По мере повышения плотности записи компания IBM поставила задачу удешевления и уменьшения размера и веса дисков. В 1971 г. компания представила свою новую разработку – 8-дюй- мовый (200 мм в диаметре) гибкий магнитный диск или «флоппи-

диск» (floppy disk, англ.), называемый также дискетой (diskette,

2На самом деле, емкость всех накопителей того времени измерялась количеством помещавшихся на него слов, при этом разрядность слов была разной – от 24 до 64 двоичных разрядов или до 12 десятичных разрядов.

10