Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Shpory_Sem.docx
Скачиваний:
3
Добавлен:
10.09.2019
Размер:
427.82 Кб
Скачать

6. Відновлення структури бази даних.

Після проектування таблиць, полів і зв'язків необхідно ще раз переглянути структуру бази даних і виявити можливі недоліки. Бажано це зробити на даному етапі, поки таблиці не заповнені даними. Для перевірки необхідно створити кілька таблиць, ви­значити зв'язки між ними та ввести кілька записів у кожну таб­лицю, потім подивитися, чи відповідає база даних поставленим вимогам. Рекомендується також створити чернеткові вихідні фо­рми та звіти й перевірити, чи видають вони необхідну інформа­цію. Крім того, необхідно виключити з таблиць усі можливі по­вторення даних.

7. Додавання даних і створення інших об'єктів бази даних. Якщо структури таблиць відповідають поставленим вимогам, то можна вводити всі дані. Потім можна створювати будь-які запи­ти, форми, звіти, макроси та модулі.

8. Використання засобів аналізу в СУБД. Наприклад, у СУБД Microsoft Access є два інструменти для вдосконалення структури баз даних. Майстер аналізу таблиць досліджує таб­лицю, в разі потреби пропонує нову її структуру та зв'язки, а та­кож переробляє її. Аналізатор швидкодії досліджує всю базу даних, дає рекомендації з її поліпшення, а також реалізує їх.

3.Базу даних можна представити на трьох рівнях: інфологічному,

даталогічному та фізичному.

Мета інфологічного моделювання – забезпечення найбільш природних для

людини способів збору та представлення тієї інформації, яку передбачається

зберігати в базі даних. Тому інфологічну модель даних намагаються будуватипо аналогії з природною мовою.На етапі даталогічного проектування будується логічна структура БД. Прицьому даталогічна модель розробляється з урахуванням конкретної реалізаціїСУБД основі її інфологічної моделі. Кінцевим результатом даталогічногопроектування є опис структури БД на мові опису даних конкретних СУБД.

Не всі види зв’язку, що існують в інфологійній моделі наочній області,

можна відобразити у даталогічній моделі. Так більшість СУБД не забезпечуютьпідтримку зв’язку типу М:М. В цьому випадку вводиться допоміжний елемент,тобто M:N розбивається на два відношення (1:M, 1:N).

Фізична модель – прив’язка даталогічної моделі БД до середовища

зберігання. Використовуються можливості даної конкретної СУБД. Приховановід розробника.Основними конструктивними елементами інфологічної моделі є сутність,зв’язки між ними та їх властивості (атрибути).

Сутність – будь-який помітний об’єкт (об’єкт, який можна відрізнити

від іншого), інформацію про який необхідно зберігати в базі даних. Сутністю

можуть бути люди, місця, літаки, рейси, смак, колір і т.д. Необхідно розрізняти

такі поняття, як тип сутності та екземпляр сутності. Тип сутності відноситься

донабору однорідних осіб, предметів або подій, які виступаючих як ціле.

Екземпляр суті відноситься до конкретної речі в наборі. Наприклад, типом

сутності може бути МІСТО, а екземпляром – Москва, Київ і т.д.

Атрибут – пойменована характеристика сутності. Його найменування

повинне бути унікальним для конкретного типа сутностів, але може бути

однаковим для різного типа сутності(наприклад, КОЛІР може бути

визначений для багатьох суті: СОБАКА, АВТОМОБІЛЬ, ДИМ). Атрибути

використовуються для визначення того, яка інформація повинна бути

зібрана про сутність. Прикладами атрибутів для суті АВТОМОБІЛЬ є ТИП,

МАРКА, НОМЕРНИЙ ЗНАК, КОЛІР і т.д. Тут також існує відмінність

між типом і екземпляром. Тип атрибуту КОЛІР має багато екземплярів або

значень: Червоний, Синій, Банановий і т.д., проте кожному екземпляру суті

привласнюється тільки одне значення атрибуту.

Ключ – мінімальний набір атрибутів, по значеннях яких можна однозначно

знайти необхідний екземпляр сутності. Мінімальність означає, що виключенняз набору будь-якого атрибуту не дозволяє ідентифікувати сутність по тих, щозалишилися.Зв’язок – асоціювання двох або більш сутностей. Якби призначеннямбази даних було тільки зберігання окремих, не зв’язаних між собою даних,то її структура могла б бути дуже простою. Проте одна з основних вимог доорганізації реляційної бази даних – це забезпечення можливості відшуканняоднієї сутності за значеннями інших, для чого необхідно встановити між нимипевні зв’язки. А оскільки в реальних базах даних нерідко містяться сотнісутностей, то теоретично між ними може бути встановлено більше тисячізв’язків. Наявність такої безлічі зв’язків і визначає складність інфологічної

моделей.

4.При побудові інфологічних моделей можна використовувати мову ER-діаграм

(від англ. Entity-Relationship, тобто сутність-зв’язок). У них є певні позначення:

- сутність

- ассоциация

- атрибут

Зв’язки позначаються лініями, над якими може проставлятися ступінь зв’язку

(1 або буква, яка замінює слово “багато”) і необхідне пояснення.

Між двома сутностями, наприклад, А і В, можливі чотири види зв’язків.

1. Зв’язок ОДИН-ДО-ОДНОГО (1:1): у кожен момент часу кожному екземпляру

сутності А відповідає 1 або 0 екземпляр сутності В.

Студент може не одержувати стипендію, одержати звичайну або одну з

підвищених стипендій.

2. Зв’язок ОДИН-ДО-БАГАТЬОХ (1:М): одному представнику сутності А

відповідають 0, 1 або декілька представників сутності В.

Квартира може бути порожньою, в ній може жити один або декілька

мешканців.

Оскільки між двома сутностями можливі зв’язки в обох напрямах, то існує ще

два типу зв’язку: БАГАТО-ДО-ОДНОГО (М:1) і БАГАТО-ДО-БАГАТЬОХ

(М:N).

Приклад. Якщо зв’язок між сутностями ЧОЛОВІК і ЖІНКА називається

ШЛЮБ, то існує чотири можливі представлення такого зв'язку:

Характер зв’язків між сутностями не обмежується перерахованими. Існують і

складніші зв’язки, наприклад “безліч зв’язків між однією і тією ж суттю”

(пацієнт, маючи одного лікуючого лікаря, може мати також декілька лікарів-

консультантів; лікар може бути лікуючим лікарем декількох пацієнтів і може

одночасно консультувати дещо інших пацієнтів);

У приведених прикладах для підвищення ілюстративності даних зв’язків

не показані атрибути сутності та асоціацій у всіх ER-діаграмах. Так, введення

лише декількох основних атрибутів в опис шлюбних зв’язків значно ускладнить

ER-діаграму. У зв’язку з цим мова ER-діаграм використовується для побудові

невеликих моделей та ілюстрації окремих фрагментів великих.

Частіше застосовується менш наочна, але змістовніша мова інфологічного

моделювання (МІМ), в якому сутність і асоціації представляються

пропозиціями вигляду:

СУТНІСТЬ (атрибут 1, атрибут 2, ..., атрибут n)

АСОЦІАЦІЯ [СУТНІСТЬ S1, СУТНІСТЬ S2, ...]

(атрибут 1, атрибут 2, ..., атрибут n)

де S – ступінь зв’язку, а атрибути, що входять в ключ, повинні бути

відмічені за допомогою підкреслення.

Для виявлення зв’язків між сутностями необхідно, як мінімум, визначити

саму сутність. Але це не просте завдання, оскільки в різних наочних областях

один і той же об'єкт може бути сутністю або атрибутом.

5.Іерархічна

Часто об'єкти перебувають у відношеннях, що називають ієрархічними: відношення «частина — ціле» (наприклад, адміністративна область складається з районів, сільських і міських рад, населених пунктів та ін.); видове відношення (наприклад, будинки бувають житлові, виробничі та ін.); відношення підпорядкованості (наприклад, губернатор — мер міста).Об'єкти, що перебувають в ієрархічних відношеннях, утворюють дерево «орієнтований граф», у якого є тільки одна вершина, не підлегла жодній іншій вершині (цю вершину називають коренем дерева); будь-яка інша вершина графа підлегла лише одній іншій вершині. Концептуальна схема ієрархічної моделі являє собою сукупність типів записів, пов'язаних типами зв'язків в одне чи кілька дерев. Усі типи зв'язків цієї моделі належать до виду «один до декількох» і зображуються у вигляді стрілок. Таким чином, взаємозв'язки між об'єктами нагадують взаємозв'язки в генеалогічному дереві, за єдиним винятком: для кожного породженого (підлеглого) типу об'єкта може бути тільки один вхідний (головний) тип об'єкта. Тобто ієрархічна модель даних допускає тільки два типи зв'язків між об'єктами: «один до одного» і «один до декількох». Ієрархічні бази даних є навігаційними, тобто доступ можливий тільки за допомогою заздалегідь визначених зв'язків. При моделюванні подій, як правило, необхідні зв'язки типу «багато до декількох». Як одне з можливих рішень зняття цього обмеження можна запропонувати дублювання об'єктів. Однак дублювання об'єктів створює можливості неузгодженості даних. Достоїнство ієрархічної бази даних полягає в тому, що її навігаційна природа забезпечує швидкий доступ при проходженні вздовж заздалегідь визначених зв'язків. Однак негнучкість моделі даних і, зокрема , неможливість наявності в об'єкта декількох батьків, а також відсутність прямого доступу до даних роблять її непридатною в умовах частого виконання запитів, не запланованих заздалегідь. Ще одним недоліком ієрархічної моделі даних є те, що інформаційний пошук з нижніх рівнів ієрархії не можна спрямувати по вище розміщених вузлах.

Мережна

У мережній моделі даних поняття головних і підлеглих об'єктів дещо розширені. Будь який об'єкт може бути і головним, і підлеглим (у мережній моделі головний об'єкт позначається терміном «власник набору», а підлеглий — терміном «член набору»). Той самий об'єкт може одночасно виконувати і роль власника, і роль члена набору. Це означає, що кожний об'єкт може брати участь у будь-якій кількості взаємозв'язків. Подібно до ієрархічної, мережну модель також можна подати у вигляді орієнтованого графа. Але в цьому випадку граф може містити цикли, тобто вершина може мати кілька батьківських вершин. Така структура набагато гнучкіша і виразніша від попередньої і придатна для моделювання більш ширшого класу завдань. У цій моделі вершини є сутностями, а ребра, що їх з'єднують, — відношеннями між ними.Ієрархічні і мережні бази даних часто називають базами даних з навігацією. Ця назва відбиває технологію доступу до даних, використовувану при написанні програм обробки мовою маніпулювання даними. При цьому доступ до даних пошляхах, не передбачених при створенні бази даних, може потребувати нерозумно тривалого часу. Підвищуючи ефективність доступу до даних і скорочуючи таким чином час відповіді на запит, принцип навігації разом з цим підвищує і ступінь залежності програм і даних. Програми обробки даних виявляються жорстко прив'язаними до поточного стану структури бази даних і повинні бути переписані при її змінах. Операції модифікації і видалення даних вимагають переустановлення покажчиків, а маніпулювання даними залишається записоорієнтованим. Крім того, принцип навігації не дозволяє істотно підвищувати рівень мови маніпулювання даними, щоб зробити його доступним користувачу-непрограмісту чи навіть програмісту-непрофесіоналу. Для пошуку запису-мети в ієрархічній або мережній структурі програміст повинен спочатку визначити шлях доступу, а потім — крок за кроком переглянути всі записи, що трапляються на цьому шляху. Наскільки складними є схеми представлення ієрархічних і мережних баз даних, настільки і трудомістким є проектування конкретних прикладних систем на їхній основі. Як показує досвід, тривалі терміни розроблення прикладних систем нерідко призводять до того, що вони постійно перебувають на стадії розроблення і доопрацювання. Складність практичної реалізації баз даних на основі ієрархічної і мережної моделей визначила створення реляційної моделі даних.

6.У реляційній моделі даних об'єкти і взаємозв'язки між ними представляються за допомогою таблиць. Взаємозв'язки також подаються як об'єкти. Кожна таблиця представляє один об'єкт і складається з рядків і стовпців. Таблиця повинна мати первинний ключ (ключовий елемент) — поле чи комбінацію полів, що єдиним способом ідентифікують кожний рядок у таблиці.

Назва «реляційна» (relational) пов'язана з тим, що кожен запис у таблиці даних містить інформацію, яка стосується (related) якогось конкретного об'єкта. Крім того, зв'язані між собою (тобто такі, що знаходяться в певних відношеннях — relations) дані навіть різних типів в моделі можуть розглядатися як одне ціле.

Таблиця має такі властивості: - кожний елемент таблиці являє собою один елемент даних; - повторювані групи відсутні; - усі стовпці в таблиці однорідні; це означає, що елементи стовпця мають однакову природу; - стовпцям присвоєні унікальні імена; - у таблиці немає двох однакових рядків.

Порядок розміщення рядків і стовпців у таблиці довільний; таблиця такого типу називається відношенням. У сучасній практиці для рядка використовується термін «запис», а для стовпця термін «поле». Основною відмінністю пошуку даних в ієрархічних, мережних і реляційних базах даних є те, що ієрархічні і мережні моделі даних здійснюють зв'язок і пошук між різними об'єктами за структурою, а реляційні — за значенням ключових атрибутів (наприклад, можна знайти всі записи, значення яких у полі «номер будинку» дорівнює 3, але не можна знайти 3-й рядок). Оскільки реляційна структура концептуально проста, вона дозволяє реалізовувати невеликі і прості (і тому легкі для створення) бази даних, навіть персональні, сама можливість реалізації яких ніколи навіть і не розглядалася в системах з ієрархічною чи мережною моделлю. Недоліком реляційної моделі даних є надмірність по полях (для створення зв'язків між різними об'єктами бази даних). Практично всі існуючі на сьогоднішній день комерційні бази даних і програмні продукти для їх створення використовують реляційну модель даних.

7. 1. Визначте мету створення бази даних, основні її функції й інформацію,

що вона повинна містити. База даних повинна відповідати вимогам тих,

хто буде безпосередньо з нею працювати. Для цього потрібно визначити

теми, які повинна покривати база даних, звіти, які вона повинна видавати,

проаналізувати форми, які в даний момент використовуються для запису

даних, порівняти створювану базу даних з добре спроектованою, подібною

їй базою.

2. Розробіть на папері структуру таблиць, які повинна містити база даних.

При проектуванні таблиць, рекомендується керуватися наступними

основними принципами:

Інформація в таблиці не повинна дублюватися. Не повинне бути повторень

і між таблицями. Коли певна інформація зберігається тільки в одній

таблиці, то й змінювати її прийдеться тільки в одному місці. Це робить

роботу більш ефективною, а також виключає можливість розбіжності

інформації в різних таблицях.

Кожна таблиця повинна містити інформацію тільки на одну тему. Відомості

на кожну тему обробляються набагато легше, якщо утримуються вони в

незалежних друг від друга таблицях.

3. Визначте необхідні втаблиці поля. Кожна таблиця містить інформацію

на окрему тему, а кожне поле в таблиці містить окремі відомості по темі

таблиці. При розробці полів для кожної таблиці необхідно пам'ятати:

- кожне поле повинне бути пов'язане з темою таблиці.

- не рекомендується включати в таблицю дані, які є результатом

вираження.

- у таблиці повинна бути присутня вся необхідна інформація.

4. Задайте ключове поле. Для того, щоб Microsoft Access міг зв'язати дані

з різних таблиць, кожна таблиця повинна містити поле або набір полів, які

будуть задавати індивідуальне значення кожного запису в таблиці. Таке

поле або набір полів називають основним ключем.

5. Визначте зв'язки між таблицями. Після розподілу даних по таблицях і

визначення ключових полів необхідно вибрати схему для зв'язку даних у

різних таблицях. Для цього потрібно визначити зв'язки між таблицями.

6. Ще раз переглянете структуру бази даних і виявите можливі недоліки.

Бажано це зробити на даному етапі, поки таблиці не заповнені даними.

7. Додайте дані й створіть інші об'єкти бази даних. Якщо структури таблиць

відповідають поставленим вимогам, то можна вводити всі дані. Потім

можна створювати будь-які запити, форми, звіти, макроси й модулі.

8. Використовуйте засоби аналізу в Microsoft Access. В Microsoft Access

існує два інструменти для вдосконалення структури баз даних. Майстер

аналізу таблиць досліджує таблицю, якщо буде потреба пропонує нову її

структуру й зв'язки, а також переробляє її. Аналізатор швидкодії досліджує

всю базу даних, дає рекомендації з її поліпшення, а також здійснює їх.

8. Подібно до інших алгебр, деякі оператори є примітивними, а інші, будучи визначені через примітивні, є похідними від них. В реляційній алгебрі Кодда визначено такі шість примітивних операторів: вибіркапроекціядекартів добутокоб'єднання та різниця і перейменування (насправді, Кодд відмовився від включення оператора перейменування, однак, розробники ISBL навели приклади необхідності його включення). Шість операторів є фундаментальними в тому сенсі, що жоден із них не можна відкинути без втрати потужності. Багато інших операторів було визначено комбінацією цих шести. Серед найважливіших можна назвати: перетин множин, ділення та природнє об'єднання. Насправді, ISBL дала підстави для заміни декартового добутку природнім об'єднанням, окремим випадком якого є декартів добуток.

В теорії множин, дека́ртів добу́ток (прями́й добу́ток) двох множин X та Y — це множина усіх можливих впорядкованих пар, у яких перша компонента належить множині X, а друга — множині Y. Це поняття названо на честь відомого французького математика Рене Декарта.

Декартів добуток двох множин X та Y позначають як X×Y:

Наприклад, якщо множина X складається з 13 елементів { AKQJ, 10, 9, 8, 7, 6, 5, 4, 3, 2 }, а множина Y — з 4 елементів {червоний, чорний, блакитний, зелений}, то декартів добуток цих множин є 52-елементною множиною (оскільки 13×4=52) {(A, червоний), (K, червоний), ... , (2, червоний), (A, чорний), ... , (3, зелений), (2, зелений)}.

В математиці, зокрема в теорії множиноб'єднання множин є множиною, яка включає в себе всі елементи об'єднуваних множин і нічого більше.

Різниця множин (відносне доповнення)

Якщо A та B - множини, то різницею між B та А (порядок множин важливий), або відносним доповненням A до B, є множина з елементів B, які не належать A. Різниця множин є бінарною операцією.

Відносне доповнення A до B:

Відносне доповнення A до B позначається як B − A (також B \ A).

Вибірка

Узагальнена вибірка це унарний оператор, що записується як  , де   є формулою числення висловлень, що складається із атомів, дозволених у звичайній вибірціта логічних операторів   (кон'юнкції),   (диз'юнкції) та   (заперечення). Така вибірка вибирає всі кортежі із   для яких   істина.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]