Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

morozov_lektsiyi

.pdf
Скачиваний:
12
Добавлен:
12.02.2016
Размер:
769.26 Кб
Скачать

Проектування машин баз даних та знань

1

П р о е к т у в а н н я м а ш и н б а з д а н и х т а

 

з н а н ь

 

Зміст

 

Тема 1: Вступ. Мета та задачі курсу.................................................................................................

3

1.1. Інформаційні технології та бази даних .................................................................................

3

1.2. Історія розвитку технологій баз даних..................................................................................

3

1.3. Основні тенденції розвитку інформаційних систем ............................................................

6

1.3.1. Розподіл і децентралізація...............................................................................................

6

1.3.2. Неоднорідність .................................................................................................................

7

1.3.3. Розвиток стандартів .........................................................................................................

7

1.3.4. Моделювання реального світу ........................................................................................

8

1.4. Зв’язок управління інформацією з іншими дисциплінами інформаційних систем..........

8

1.5. Основні перспективні ідеї в технології баз даних ...............................................................

9

1.5.1. Маніфест систем баз даних третього покоління ...........................................................

9

1.5.2. Маніфест об’єктно-орієнтованих систем баз даних ...................................................

11

1.5.3. Симпозіум Національної наукової фундації США .....................................................

11

Тема 2. Управління розподіленою інформацією...........................................................................

13

2.1. Принципи управління розподіленою інформацією ...........................................................

13

2.2. Моделі розподілених баз даних ...........................................................................................

14

2.2.1. Однорідні і неоднорідні системи ..................................................................................

14

2.2.2. Методи побудови розподілених баз даних „зверху вниз” і „знизу до верху”..........

16

Тема 3. Технологія клієнт-сервер в базах даних ...........................................................................

19

3.1. Основи архітектури клієнт-сервер.......................................................................................

19

3.2. Основні принципи і критерії оцінки систем клієнт-сервер...............................................

20

3.3. Стандарти архітектури клієнт-сервер в управлінні інформацією ....................................

21

3.3.1. SQL Access Group і стандарт DRDA ............................................................................

21

3.3.2. Стандарти, засновані на інтерфейсі рівня викликів SAG...........................................

21

3.4. Програмне забезпечення проміжного шару .......................................................................

22

Тема 4. Управління розподіленою інформацією...........................................................................

23

4.1. Принципи побудови сховищ даних .....................................................................................

23

4.2. Цифрові бібліотеки і інформаційні магістралі ...................................................................

26

Теми 5. Паралельні системи баз даних ..........................................................................................

26

5.1. Сучасні підходи до фрагментація і тиражування ..............................................................

26

5.2. Концепції МРР і паралельних систем баз даних................................................................

26

5.3. Моделі фрагментації для паралельних систем баз даних .................................................

28

5.3. Перспективи розвитку паралельних систем баз даних......................................................

29

5.4. Перспективи тиражування ...................................................................................................

30

Тема 6. Об’єктно-орієнтовані бази даних ......................................................................................

32

6.1. Характеристики і мотивація об’єктно-орієнтованих баз даних .......................................

32

6.2. Концепції об’єктно-орієнтованих баз даних ......................................................................

34

6.2.1. Індивідуальність об’єктів ..............................................................................................

34

6.2.2. Атрибути .........................................................................................................................

34

6.3.3. Методи.............................................................................................................................

35

6.3.4. Класи................................................................................................................................

35

6.3.5. Ієрархії класів і наслідування........................................................................................

35

6.3.6. Довготривале зберігання ...............................................................................................

35

6.4. Співвідношення гібридного і розширеного реляційного підходів...................................

36

Проектування машин баз даних та знань

2

6.5. Об’єктно-орієнтовані механізми управління даними і моделі .........................................

38

6.6. Діяльність ODMG по стандартизації...................................................................................

39

Тема 7. Перспективні технології бази даних .................................................................................

41

7.1. Бази даних з інтегрованим часом ........................................................................................

41

7.2. Основні принципи часових баз даних .................................................................................

41

7.3. Моделі даних з часом............................................................................................................

42

7.4. Часові розширення мов баз даних .......................................................................................

43

7.5. Об’єктно-орієнтовані часові бази даних .............................................................................

43

7.6. Активні бази даних ...............................................................................................................

43

7.7. Принципи активних систем баз даних ................................................................................

44

7.7.1. Обмеження і твердження...............................................................................................

44

7.7.2. Збережувані процедури .................................................................................................

45

7.7.3. Тригери............................................................................................................................

45

7.8. Розширення моделей активних баз даних ..........................................................................

45

7.9. Моделі трансакцій і активні бази даних .............................................................................

45

7.10. Штучний інтелект і технологія баз даних.........................................................................

46

Проектування машин баз даних та знань

3

Тема 1: Вступ. Мета та задачі курсу.

1.1. Інформаційні технології та бази даних

Всім відомий очевидний факт, що крупні системи живуть своїм життям - в будь-якій області людської діяльності - будь то інженерні, фінансові, інформаційні і інші конструкції. Помилки на ранніх стадіях їх побудови є найдорожчими і приводять в кращому разі до подорожчання, перевищення термінів створення і погіршення якісних характеристик цих систем, в гіршому - до повного краху при їх створенні. Людство знає немало таких прикладів. Невеликі і середні системи можуть бути побудовані методом „грубої сили”. Прорахунки, що неминуче виникають при проектуванні, можуть бути усунені згодом, і це не викличе повного руйнування системи. Інша справа - великі і надвеликі системи. Без стратегічного планування їх побудови і упровадження, вони просто приречені на невдачу. Особливо це важливо для інформаційних систем. Інформаційні технології змінюються найбільш динамічно. Підходи, що здавалися перспективними і важливими п’ять-десять років тому, сьогодні можуть привести до побудови „успадкованих систем” і категорично не повинні використовуватися фахівцями. Ціна таких помилок зростає в багато разів.

Не дивлячись на уявну незмінність базових технологій (реляційна модель даних, що служить основою практично всіх сучасних реалізацій систем баз даних, з’явилася майже тридцять років тому), у галузі баз даних відбуваються значні зміни. Концепції сховищ даних, що з’явилися останнім часом, розширення реляційної моделі даних, вживання об’єктноорієнтованого підходу і інших до побудови СУБД вже зараз значно змінили картину. І швидше за все в найближчому майбутньому ця картина зміниться ще разючіше. Всі провідні виробники програмних продуктів, призначених для побудови сховищ і баз даних, зараз активно займаються реалізацією нових концепцій в промислових розробках.

Актуальність і новизна пов’язаних з цією сферою проблем привернули до них увагу широкого кола фахівців не тільки крупних компаній, що зайняті виробництвом обчислювальної техніки і програмного забезпечення, але і провідних дослідницьких центрів. Це, у свою чергу, сприяло швидкому становленню нової гілки інформатики, що спеціалізується на розробці інструментальних засобів і додатків, а також теоретичних основ систем баз даних.

На розвиток цієї гілки інформатики значний вплив мали і продовжують мати досягнення в суміжних напрямах, пов’язаних з операційними системами, мовами і технологіями програмування, штучним інтелектом, обчислювальною і комунікаційною технікою. Проте вже із самого початку стало ясно, що вона володіє, проте, власною проблематикою, пов’язаною із специфікою задач управління узагальненими ресурсами даних в сучасних обчислювальних середовищах з різноманіттям можливостей їх архітектури.

1.2. Історія розвитку технологій баз даних

Якщо спробувати стисло прослідити історію розвитку технологій баз даних, то в ній можна виділити декілька важливих етапів.

60-ті роки характеризуються народженням перших ідей, а також формуванням основ методології побудови систем баз даних, яка незабаром стала грати ключову роль в розробці інформаційних систем самого різного призначення. Великий внесок належить тут Робочій групі з баз даних CODASYL (CODASYL DBTG) і низці комітетів цієї організації, головною заслугою яких прийнято рахувати створення повного комплексу мовних специфікацій СУБД, заснованих на мережевій моделі даних. Проте, без сумніву, не менш важливу роль зіграли запропоновані ними цілісна архітектурна концепція систем управління базами даних, а

Проектування машин баз даних та знань

4

також ряд важливих принципів організації і функціонування таких систем (управління доступом, захист цілісності даних, адміністрування даними, процедури баз даних - прообраз тригерів в SQL, принципи побудови інтерфейсів прикладного програмування СУБД і т.п.).

70-ті роки слід розглядати як час зародження реляційних технологій і накопичення досвіду їх практичної реалізації. Вже на початку 70-х років, услід за публікацією основоположної статті Е. Кодда про реляційну модель даних був реалізований ряд ранніх систем - MacAIMS, IS/1 (згодом названа PRTV), RANDEZVOUS і ін. Дещо пізніше були здійснені широко відомі крупні наукові проекти і створені дослідницькі прототипи функціонально розвинутих реляційних СУБД, перш за все System R (компанія IBM Corp.) і Ingres (Каліфорнійський університет, Берклі). Були створені реляційні мови SQL і QBE - основа майбутніх програмних продуктів масового вживання. Великий вплив на подальші процеси розвитку мали також проведені в цей період „розвідувальні” дослідження Робочої групи по базах даних ANSI/X3/SPARC (1975). Ця робота поклала початок активної діяльності зі стандартизації в галузі баз даних, викликала необхідність переосмислення концепції моделі даних, стимулювала появу нових архітектурних підходів. На їх основі почалися дослідження в області розподілених систем і відображення моделей даних. Були створені нові моделі, що дозволяють „утримувати” більше семантики. До їх числа відносяться створена П. Ченом модель „сутність-зв’язок” (1976), розширена реляційна модель Э. Кодда RM/T (1979) і ін. Перша з цих моделей дотепер займає одну з ключових позицій в інструментальних засобах проектування баз даних, друга - зробила великий вплив на розвиток класичного реляційного підходу.

80-ті роки, безумовно, стали етапом становлення і досягнення домінуючого положення реляційних систем. З появи в 1979 році системи Oracle почалося швидке зростання числа реалізацій комерційних реляційних програмних продуктів для різних програмно-апаратних платформ. Еволюційним шляхом продовжувався розвиток їх функціональних можливостей. Діяльність зі стандартизації мови SQL (перший її стандарт був прийнятий ANSI в 1976 році) неабиякою мірою сприяла остаточному переважанню реляційних СУБД на ринку програмного забезпечення систем баз даних. До початку 90-х років був створений цілий спектр високопродуктивних SQL-серверів баз даних, що отримали широке використання для створення інформаційних систем різноманітного призначення. Велика увага стала надаватися розвитку розподілених систем, зокрема, на основі локальних обчислювальних мереж. Була запропонована архітектурна концепція „клієнт-сервер”. Виникли технології систем баз даних на платформі персональних комп’ютерів.

Реляційна технологія відбулася. Проте вже тоді існувало, і з розвитком апаратурних можливостей розширювалося коло додатків, для яких ця технологія була неадекватною. Прикладами можуть служити мультимедійні додатки, системи, що оперують просторовочасовими даними, системи автоматизації проектування, CASE-системи і т.п. В реляційних СУБД відсутні, наприклад, необхідні для таких додатків, засоби визначення нових типів даних користувачем, моделювання поведінки сутностей предметної області, підтримка багатоверсійності екземплярів даних і схеми.

Разом з тим багато розробників інформаційних систем були вимушені відмовлятися від використовування типових СУБД загального призначення у зв’язку з їх „надлишковістю”. Ядро комерційних систем, що поставляються, зазвичай є монолітним. Воно часто виявляється функціонально надлишковим в конкретному застосуванні і тим самим вимагає надмірних (щодо таких застосувань) ресурсів. Можливості вибору потрібної конфігурації ядра типової системи самим користувачем і конструювання „полегшеної СУБД", спеціально орієнтованої на даний додаток і такої, що не вимагає зайвих ресурсів, як правило, не передбачаються.

З цих причин у ряді провідних наукових центрів, стурбованих подальшою долею реляційних систем баз даних, в другій половині 80-х років був зроблений ряд дослідницьких проектів, задача яких полягала в пошуку шляхів подолання вказаних труднощів. Основну увагу в них надавалося питанням міграції в середовища, засновані на об’єктній парадигмі,

Проектування машин баз даних та знань

5

розширюваності підтримуваної системи типів даних і гнучкого конфігурування СУБД. Рішення всіх цих проблем дозволило б адаптувати нові системи до потреб нетрадиційних додатків. Особливо помітний вплив на подальший розвиток надали проекти Postgres (M. Стоунбрекер, Каліфорнійський університет, Берклі), Starburst (Би. Ліндсей, Л. Хаас і ін., IBM Almaden Research Center), EXODUS (M. Кері, Д. Девітт, Вісконсинській університет), Genesis (Д. Баторі, Техаський університет, Остін). Саме ці проекти великою мірою визначили функціональні можливості, що з’явилися в другій половині 90-х років, серверів баз даних нового покоління, створених провідними виробниками програмних продуктів для систем баз даних.

З початку 90-х років. спостерігається особливо помітне пожвавлення в розвитку, як теоретичних досліджень, так і практичних технологій розробки систем баз даних і інформаційних систем. Активізувалася і індустрія програмного забезпечення, призначеного для цих цілей. Важливими стимуляторами прогресу тут стали значні досягнення в розвитку концепцій відкритих систем, стрімкі кроки у вдосконаленні обчислювальних мереж і глобальних телекомунікацій. Були створені і почали активно використовуватися технології проектування програмного забезпечення засновані, як правило, на об’єктному підході.

Безперечний вплив на вказані процеси мав також розвиток Інтернет і реалізація в його середовищі проекту глобальної гіпертекстової інформаційної системи - відомої „всесвітньої павутини”. Був накопичений значний власний потенціал в теорії і технологіях баз даних, перш за все в аспектах архітектури систем і в моделюванні даних. Нарешті, в даний період був розроблений і встановлений цілий спектр індустріальних і офіційних міжнародних стандартів, що отримав широке визнання.

Ухвалення стандарту SQL-92 додало новий імпульс розвитку реляційних систем. В той же час в 90-ті роки, були зроблені значні кроки для забезпечення практичного використовування об’єктного підходу в області баз даних. Це відбувалося у значній мірі під впливом успішного практичного втілення об’єктно-орієнтованої парадигми в системах програмування, що отримали масове розповсюдження. Опублікований в 1989 році широко відомий Маніфест об’єктно-орієнтованих систем баз даних підтвердив думку наукового співтовариства про актуальність об’єктного напряму в області баз даних. Оскільки в маніфесті були сформульовані бажані характеристики об’єктно-орієнтованих систем, він визначив тим самим основні напрями їх розвитку. Консорціум ODMG прийняв ряд версій стандарту об’єктних баз даних (поточна версія цього стандарту ODMG 2.0 була опублікована в 1997 році). Були створені „чисто” об’єктні програмні продукти (Objectivity/DB, GemStone, ObjectStore, O2, POET, Omniscience, Versant і ін.), що різною мірою відповідають вказаному стандарту. Разом з тим почався еволюційний процес „об’єктивізації” провідних реляційних СУБД. „Універсальні сервери баз даних”, що з’явилися в 1996 - 1997 роках (нові версії популярних систем Informix, DB2, Oracle) стали об’єктно-реляційними. Їх важливою особливістю є підтримка розширюваної системи типів даних.

В даний період почалися також інтенсивні розробки крупних корпоративних інформаційних систем, заснованих на нових підходах і новому інструментарії. З’явилися можливості ефективної інтеграції систем баз даних в середовище Інтернет, для корпоративних систем були запропоновані технології Інтранет. Отримали розвиток і стали широко використовуватися ідеї архітектури проміжного шару, а також компонентні підходи до формування інформаційних ресурсів і розробки програмного забезпечення.

Багато досягнень в розвитку технологій баз даних на всіх етапах їх розвитку, звичайно, стали можливими тільки завдяки значному прогресу в області обчислювальної техніки і телекомунікацій (нова архітектура, наприклад системи з масовим паралелізмом, істотне підвищення продуктивності процесорів, вдосконалення запам’ятовуючих пристроїв, успіхи в розробках обчислювальних мереж і глобальних комунікацій, створення персональних комп’ютерів і мобільних комп’ютерних середовищ і т.д.).

Проектування машин баз даних та знань

6

Отже, сьогоднішні технології баз даних є вельми обширною і надзвичайно розгалуженою сферою, як в частині їх власних можливостей, так і відносно різноманіття додатків.

Деякі сміливо оголошені прогнози часто виявлялися некоректними. Так, наприклад, вельми привабливими в кінці 70-х років були дослідження в області машин баз даних - спеціалізованих процесорів, які обслуговують специфічні потреби управління даними інформаційної системи значною мірою тим же способом, яким традиційні комунікаційні процесори обслуговують потреби в області комунікацій. Написана в 1983 році стаття „Машини баз даних: ідея, час якої пройшов? Критика майбутнього машин баз даних” передбачала кончину машин баз даних. Проте успіх систем баз даних з високим рівнем паралелізму „спростовує передбачене в статті 1983 року зникнення машин баз даних”. Такі зовнішні чинники, як переважання реляційної моделі даних (що було важко собі уявити в 1983 році, коли реляційні програмні продукти тільки почали з’являтися) і придатність реляційних запитів для паралельного виконання, сприяли спростуванню передбаченої кончини машин баз даних.

1.3. Основні тенденції розвитку інформаційних систем

Сильний вплив на багато з перспективних напрямів розвитку в області управління базами даних і управління інформацією мають загальні тенденції розвитку інформаційних систем. Розглянемо чотири головні тенденції і ті їх аспекти, які специфічні для управління інформацією. Цими чотирма тенденціями є:

-розподіл і децентралізація ресурсів управління інформацією;

-неоднорідність компонентів інформаційних систем;

-розвиток стандартів;

-включення моделювання реального світу в інформаційні системи.

1.3.1.Розподіл і децентралізація

Навряд чи не кожний, що має справу з комп’ютерами добре знайомий з тенденцією щодо розподілу і децентралізації обчислювальних ресурсів. Розукрупнення апаратного забезпечення комп’ютерів стало причиною появи малих за розмірами, проте вельми потужних процесорів і комп’ютерних систем, які стали життєздатною альтернативою великим системам. Такі обчислювальні системи - від настільних персональних комп’ютерів і робочих станцій до систем середнього класу - звичайно зв’язуються за допомогою комунікаційних засобів, наприклад локальних обчислювальних мереж (Local Area Networks, LAN), щоб забезпечити колективні обчислювальні потужності на тому ж, або й на більш високому рівні, ніж при централізованих великих системах недавнього минулого.

Розподіл обчислювальних ресурсів супроводжує значно більша децентралізація управління, чим в централізованому середовищі, при якому центр даних, як правило, мав сильний контроль над ресурсами великої обчислювальної системи. Така ситуація зберігається, поки що для компонентів великих обчислювальних систем у багатьох крупних організаціях. Проте настільні персональні комп’ютери (ПК) і робочі станції, разом з системами середнього класу на рівні підрозділу, забезпечили значно більший ступінь управління ресурсами для окремих користувачів.

Одним з позитивних аспектів децентралізації є вищий ступінь динамічності в багатьох областях використання обчислювальної техніки в корпораціях, таких, як установка і розробка додатків, підключення периферії, розширення системи і т.п. Негативна сторона, проте, полягає в тому, що швидке збільшення числа додатків, що знаходяться в особистій власності користувачів (наприклад, особистих копій систем електронних таблиць або програмного забезпечення систем баз даних для ПК), приводить до втрати контролю над даними. Окремі користувачі мають більш швидкий доступ до тих даних, якими вони

Проектування машин баз даних та знань

7

«володіють», ніж вони мали б при централізовано керованих ресурсах, і вони можуть легко і швидко, при необхідності, створювати нові дані. Проте є тенденції до виникнення вельми важких проблем, пов’язаних з несуперечністю колективних даних організації в цілому, оскільки відсутня, наприклад, синхронізація оновлення даних і існує повне замішання щодо того, „хто, чим володіє і де це знаходиться”.

Розподіл і децентралізація мають безпосереднє відношення до управління базами даних і управління інформацією. Хоча більшість організацій і дотепер має корпоративні інформаційні системи з централізованим управлінням інформацією, що базуються на великих обчислювальних системах, з середини 80-х років спостерігається значний прогрес в області створення систем та специфічних додатків на рівні підрозділів, і у використовуванні настільних ПК з персональними додатками, що включають системи управління базами даних. Фактично управління базами даних, обробка текстів, управління електронними таблицями і графіка стали представляти так звану велику четвірку горизонтальних додатків ПК. У більшості організацій спроби центру даних нав’язати у використовуванні ПК і, зокрема, в управлінні даними принципи, подібні до тих, що використовуються на великих обчислювальних системах, зіткнулися з величезним опором. Розподіл і децентралізація надали безпрецедентний контроль над інформацією „корпоративним масам”, і вони не відмовляться від цього контролю.

1.3.2. Неоднорідність

Дні використовування середовищ одного постачальника стрімко йдуть геть. Навіть „стандартна” модель центру даних корпорації, що ґрунтується на деякому типі великих обчислювальних систем корпорації IBM і на одному або більше типах операційних систем, набуває рис неоднорідності, оскільки апаратні засоби і програмне забезпечення третьої сторони також знаходять свою дорогу в ці середовища. Більш важливим, ніж навіть сам факт появи нових систем, є вимога до можливості їх з’єднання і інтероперабельності, не дивлячись на існування різних виробників.

Модель неоднорідності має також відношення до управління інформацією. Успадковані системи, це, як правило, системи ієрархічних баз даних або системи плоских файлів, які містять і управляють давнішніми даними корпорації. Вони повинні спільно використовувати з реляційними базами даних, що функціонують на тих же самих великих обчислювальних системах, а також з базами даних підрозділів і базами даних, що використовуються на ПК. Усі ці випадки сумісного використовування повинні забезпечуватися незалежно від апаратних моделей і версій програмних продуктів. Інтероперабельність у все більш широких масштабах наводить мости між численними інформаційними моделями (наприклад, комбінуючи реляційні і об’єктно-орієнтовані дані).

1.3.3. Розвиток стандартів

Інтероперабельность неоднорідних середовищ, описаних вище, ґрунтується на стандартах. Стандарти проникають в кожну область використання обчислювальної техніки - від комунікацій, де прикладом може служити еталонна модель взаємодії відкритих систем

(Open Systems Interconnection (OSI) Reference Model), до управління базами даних (стандарт мови SQL).

Всупереч деяким суперечливим думкам щодо їх ролі в інформаційних системах, стандарти можуть тут застосовуватися головним чином у зв’язку з вимогами користувачів. Самі по собі стандарти мають невелике значення. Проте в контексті двох головних тенденцій, розподіл і неоднорідність, стандарти стають надзвичайно важливими (мал. 1.1). Користувачі хочуть мати свободу заміни апаратних засобів і/або програмного забезпечення в системах, не відмовляючись від всіх інтерфейсів, на які спираються їх середовища. Інакше, наприклад, заміна однієї комерційної СУБД на іншу могла б привести до необхідності

Проектування машин баз даних та знань

8

переписування коду додатків або коду інших сервісів (служб) середовища, таких, як комунікації або призначені для користувача інтерфейси.

Розподіл

 

Викликає

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Неоднорідність

Викликає

 

 

 

 

 

 

 

 

 

Викликає

 

 

 

 

 

 

Стандарти

 

 

 

 

 

 

 

 

Рис. 1.1. Взаємозв’язок між розподілом, неоднорідністю та стандартами

1.3.4. Моделювання реального світу

Протягом всієї історії застосування комп’ютерних систем у комерційній діяльності існував деякий розрив між самими інформаційними системами і конструкціями реального світу, для підтримки яких вони розроблялися. Прикладами такого розриву можуть служити:

-множина додатків, які вимагають багатократного повторення введення даних і значного об’єму інформації на паперових носіях, що спільно використовується користувачами в різних областях комерційної діяльності;

-сам процес розробки програмного забезпечення і систем з його базовими методологіями і моделями, які вимагали складного, з можливими помилками, відображення між фазою концептуального проектування і реалізацією додатків і систем;

80-ті роки характеризуються більш тісним зближенням парадигм інформаційних систем і тих систем реального миру, які вони представляють і підтримують. До результатів впливу моделей реального світу на світ комп’ютерних систем можна віднести:

-графічні інтерфейси користувача (Graphical User Interfaces, GUI), які додали додаткам більш природний вигляд і поліпшили їх сприйняття;

-об’єктно-орієнтовані моделі, принципи яких були застосовані до програмування та управління даними і (завдяки таким можливостям, як наслідування і методи) привнесли більш тісний зв’язок між концептуальною стадією і стадією реалізації процесу розробки;

-управління потоками робіт, при якому можуть визначатися і управлятися потоки робіт між користувачами і взаємозв’язки між додатками. Системи, засновані на потоках робіт, дають можливість в термінах потоків керування і даних між додатками і користувачами моделювати природній шлях здійснення комерційної діяльності ретельніше, ніж із застосуванням засобів, що інтенсивно використовують паперові документи і вимагають високого ступеня втручання людини.

1.4.Зв’язок управління інформацією з іншими дисциплінами інформаційних систем

Дисципліна управління інформацією не є, очевидно, автономною в світі комп’ютерних систем. Найпотужніші і розвинуті системи баз даних і системи управління інформацією мають мало сенсу без таких результуючих можливостей, як надання інформації для користувача або забезпечення комунікацій в середовищі розподілених систем.

Прихильники відкритих систем сформували в світі інформаційних систем класифікацію різних областей сервісу, які покликані задовольняти різноманітні потреби. Ці

Проектування машин баз даних та знань

9

численні області охоплюються еталонними моделями, які забезпечують рамки, що зв’язують управління інформацією з іншими дисциплінами. Прикладом такої еталонної моделі є Профіль переносності додатків середовища відкритих систем (OSE/1 APP, Open Systems Environment Application Portability Profile), який підтримується і специфікується Національним інститутом стандартів і технології США (NIST, National Institute Standards and Technology), що розробляє рекомендації зі стандартизації сервісів в наступних областях:

-Операційні системи.

-Інтерфейси користувача.

-Програмування.

-Управління даними.

-Обмін даними.

-Графіка.

-Мережі.

Коротше кажучи, багато областей управління базами даних і управління інформацією є взаємозалежними з цими областями сервісу. Розподілені бази даних вимагають мережевих сервісів, підмови даних вимагають сервісів програмування і т.д.

1.5. Основні перспективні ідеї в технології баз даних

Дослідження і формування уявлень про майбутнє баз даних і управління інформацією продовжувалися на всьому протязі 80-х років. У цей період було надано багато уваги більшості з тих областей - від розширень реляційної моделі даних і об’єктно-орієнтованих баз даних до безпеки. В 1989 - 1990 роках відбулися три важливі події, які можуть розглядатися як представлення головних ідейних шкіл в технології баз даних.

До цих подій відноситься:

-публікація Маніфесту систем баз даних третього покоління;

-Симпозіум Національної наукової фундації (National Science Foundation, NSF), присвячений перспективам баз даних;

-публікація Маніфесту об’єктно-орієнтованих систем баз даних, що послужить передумовою до подальшого розгляду тенденцій в області ООБД.

1.5.1. Маніфест систем баз даних третього покоління

В липні 1990 року Комітет із розвитку функціональних можливостей СУБД (група, що складається з багатьох ведучих дослідників і практиків в області баз даних) опублікував доповідь, що представлена на конференції у Віндермере (Англія) і названу „Маніфест систем баз даних третього покоління”. Автори вважали, що в процесі еволюції систем баз даних до моменту представлення їх доповіді сформувалися два покоління таких систем:

-Перше покоління - ієрархічні і мережні системи, які були першими системами, що дозволили об’єднати засоби мов визначення даних і маніпулювання даними для набору записів.

-Друге покоління - реляційні СУБД, важливий крок в еволюції, з яким пов’язані використовування не процедурної мови маніпулювання даними і забезпечення в істотному ступені незалежності даних.

Як указували автори, реляційні системи другого покоління були орієнтовані на додатки, пов’язані з обробкою даних для комерційної діяльності, і взагалі, не були адекватні таким класам додатків, як CASE, CAD, гіпертекст і мультимедіа. Автори стверджували, що реляційні системи другого покоління також не відповідають деяким додаткам у комерційній діяльності, для яких вони були призначені. Якби такі додатки слідували реальним моделям тієї роботи, яку вони представляли (комітет використовував приклад обробки даних з виплат страхівок). Але мультимедійні дані і дані іншого формату, які важкі для представлення в

Проектування машин баз даних та знань

10

реляційних СУБД і для доступу до них, повинні були б насправді бути частиною додатку. Тому була висунута теза, що „кожному необхідна краща СУБД”.

Автори сформулювали в маніфесті три принципи і тринадцять пропозицій, що мають відношення до СУБД третього покоління.

Принципи Принцип 1. СУБД третього покоління забезпечуватимуть сервіси в трьох областях:

-управління даними;

-управління об’єктами;

-управління знаннями.

Принцип 2. СУБД третього покоління повинні відноситися до категорії систем другого покоління в тому значенні, що головні досягнення реляційного світу – не процедурний доступ і незалежність даних - не повинні бути втрачені системами третього покоління.

Принцип 3. СУБД третього покоління повинні бути відкритими для інших підсистем. Програмні продукти, що претендують на статус продуктів третього покоління, повинні мати

всвоєму розпорядженні мови четвертого покоління (4GL), інструментарій підтримки ухвалення рішень, засоби для виконання віддалених операцій над даними, а також розподілені можливості.

Пропозиції Перші п’ять пропозицій були пов’язано з об’єктно-орієнтованими властивостями, які,

на думку авторів, необхідні для систем третього покоління.

Пропозиція 1.1. СУБД третього покоління повинні мати багату систему типів. Якщо говорити стисло, загальні об’єктно-орієнтовані засоби пропонується розглядати як розширення до реляційних систем (системам другого покоління), а не як їх заміщення, і це - одна з головних передумов Маніфесту третього покоління на відміну від Маніфесту об’єктно-орієнтованих систем. Виражаючись більш точно, об’єктно-орієнтовані можливості мисляться не як елементи повністю нового архітектурного розгляду СУБД, а як розширення існуючих моделей.

Пропозиція 1.2. Наслідування - добра ідея.

Пропозиція 1.3. Функції (методи, процедури бази даних) і інкапсуляція - добрі ідеї. Пропозиція 1.4. СУБД повинна факультативним чином призначати унікальні

ідентифікатори для записів (UID, Unique IDentifiers).

Пропозиція 1.5. Правила (тригери) стануть важливою властивістю майбутніх систем. Їх не слід асоціювати з якими-небудь певними функціями або колекціями.

Наступна група пропозицій торкається посилення функцій СУБД, що дозволяють взяти до уваги другий принцип про збереження можливостей систем другого покоління.

Пропозиція 2.1. Навігація для доступу до необхідних даних повинна використовуватися тільки як крайній засіб. Іншими словами, не слід повертатися до техніки доступу до даних, що специфікується програмістом, як це було в ієрархічних і мережних СУБД.

Пропозиція 2.2. Повинно бути принаймні два варіанти реалізації колекцій, один з яких використовує перелік її членів, а інший - мова запитів для специфікації критерію членства.

Пропозиція 2.3. Можливість оновлення уявлень є істотною.

Пропозиція 2.4. Кластеризація, індекси унікальних ідентифікаторів (UID), буферні пули

впризначеному для користувача просторі і подібні їм аспекти є фізичними, а не логічними, і вони не мають нічого спільного з моделлю даних. Автори підтримують в своїх специфікаціях характеристики систем третього покоління трьох-схемну концепцію ANSI/SPARC, що передбачає відділення фізичної моделі від більш високих архітектурних рівнів.

Заключна група пропозицій відноситься до аспектів відкритих систем. Пропозиція 3.1. СУБД третього покоління повинні бути багатомовними.

Пропозиція 3.2. Необхідна близька відповідність між системами типів СУБД третього покоління і мов (як указувалося в Пропозиції 1.1), і повинні бути виключені невідповідності імпедансу, характерні для світу SQL.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]