Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Л2_структуры и модели данных.doc
Скачиваний:
6
Добавлен:
29.04.2019
Размер:
144.38 Кб
Скачать

2. Структури и моделі даних. Формати представлення інформації.

Є три формати представлення інформації - цифровий, текстовий і графічний

1. Представлення цифрової інформації - системи числення

Системою числення називають сукупність символів (цифр) і правил їх використання для представлення чисел.

Найпершою виникла унарна (Від лат. Unus - один) система запису, при якому числа позначалися відповідною кількістю рисок.

У римській системі числення для позначення чисел використовували букви (5 - V, 10 - X, 50 - L, 100 - C, 500 - D, 1000 - M), але роль їх залежала від порядку запису (значення могло не тільки додаватися, але і відніматися). Розвиток цієї ідеї привів до появи сучасних позиційних систем числення.

Десятерічная система - позиційна система числення - значення цифри залежить від її позиції (місця) в числі. Тобто його можна записати от так:

N = a2.102 + a1.101 + a0.100.

Число 10 - називають основою системи числення, а степені десятки - вагами розрядів.

Компютерна система числення. По технічних причинах двійкове кодування є "рідною мовою" комп'ютерів.

Комп'ютерне представлення числа - не зовсім співпадає з його двійковим записом на папері.

По-перше, в двійковій системі для представлення чисел використовуються не два символи, а чотири:

"мінус" для позначення негативних чисел і "кома" (або "крапка") для відділення дробової частини від цілої.

По-друге, для представлення чисел в комп'ютері відводиться строго певна кількість байт, отже діапазон і точність уявлення виявляються обмеженими. Дуже велике число приведе до так званої помилки переповнювання (загубляться старші розряди), дуже маленьке буде сприйняте як нуль. Але навіть якщо дробове число і поміститься в розрядну сітку (тобто у відведену кількість біт), цілком може бути втрачена точність.

2. Представлення нечислової інформації - кодування тексту

При кодуванні тексту для кожного його символу відводиться, зазвичай, по 1 байту. Це дозволяє використовувати 28=256 (тобто 8 біт) різних символів. Відповідність між символом і його кодом може бути вибране абсолютно довільно. Проте на практиці необхідно мати можливість прочитати на одному комп'ютері текст, створений на іншому. Тому таблиці кодувань стандартизовані. Практично всі таблиці, що використовуються зараз, засновані на "американському стандартному коді обміну інформацією" ASCII (ASCII - American Standard Code for Information Interchange). Цей стандарт визначає значення для нижньої половини кодової таблиці - перших 127 кодів (32 керуючі коди, основні розділові знаки і арифметичні символи, цифри і латинські букви).

Гірша справа з "національними" символами і "друкарськими" розділовими знаками. А особливо тими мовам, які використовують кирилічний алфавіт (російська, українська, білоруська, болгарська і т.д.).

Для кирилічної мови зараз широко використовуються п'ять таблиць кодувань:

  1. CP866 (DOS-альтернативна) – на PC- сумісних комп'ютерах при роботі з операційними системами DOS и OS/2, а також в любительській міжнародній мережі Фідо (Fidonet).

Технічна організація мережі Фідонет. Спочатку для передачі даних в мережі Фідонет використовувалося пряме модемне підключення через телефонну лінію. Фідонет є оффлайновою мережею, тобто повідомлення і файли розповсюджуються по мережі, тоді як користувач може бути відключений від мережі.

Спочатку основним протоколом мережі Фідонет був протокол передачі «мережевої пошти» (нетмейла, англ. Netmail): індивідуальних електронних текстових повідомлень, що містять ім'я відправника і одержувача, а також Фидонет-адреса кожного з них. У мережі забезпечується роутинг повідомлень, так що відправникові і одержувачеві повідомлення не обов'язково встановлювати між собою прямий («директний», англ. direct) зв'язок. Нетмейл позволял «присоединять» к каждому передаваемому сообщению один файл. Это позволило создать серию работающих поверх нетмейла протоколов, передающих информацию от одного узла к другому в прикрепленных файлах.

Найчастіше використовуваним з таких протоколів є echomail, що є публічними конференціями, схожими на групи Usenet.

Фідонет не є частиною Інтернета. Проте в даний час канали і протоколи Інтернету досить часто використовуються для передачі поверх них трафіку Фідонет, велика частина ехоконференцій мережі Фідонет доступна користувачам Інтернет через Usenet и WWW-гейти.

  1. CP1251 (Windows- кодування) - на PC- сумісних при роботі під Windows 3.1 і Windows 95

  2. KOI-8r - найстаріша з кодувань, що використовуються до цих пір. Застосовується на комп'ютерах, що працюють під UNIX, є фактичним стандартом для російських текстів в мережі Internet.

4. Macintosh Cyrillic - призначена для роботи зі всіма кирилічними мовами на Макінтошах (при розробці цього кодування не врахували одну букву українського алфавіту. Тому українська - єдина кирилічна мова, для якої на Макінтошах є своє окреме кодування, - Macintosh Ukrainian).

5. ISO-8859. Це кодування замислювалося як міжнародний стандарт для кирилічних текстів.

Перетворення виконати дуже легко. Для цього служать спеціальні програми - текстові конвертори. Останнім часом з'являються конвертори, здатні самостійно визначати початкове кодування тексту і що навіть уміють "розшифровувати" текст після неправильного перекодування.

Існують і спеціальні шрифти (так звані, дінгбатси), які містять не букви, а спеціальні символи, наприклад, математичні або музичні; елементи орнаментів, піктограми.

Міжнародне кодування Unicode, розроблене кілька років тому, тепер починає упроваджуватися на практиці. Взагалі, unicode-таблиця - чотирьохбайтова, але зараз частіше використовуються особливі способи додаткового кодування - Utf-8 і Utf-16, де довжина коду залежить від поширеності символу. Українські букви і в тому і в іншому випадку представляються двома байтами (а латинські в Utf-8 - всього одним).

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]