Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
22 - 28.docx
Скачиваний:
5
Добавлен:
17.09.2019
Размер:
195.43 Кб
Скачать

24. Системи кодування

ASCII (American Standard Code for Information Interchange) в обчислювальній техніці — система кодів, у якій числа від 0 до 127 включно поставлені у відповідність літерам, цифрам і символам пунктуації. Наприклад, 45 відповідає знаку переносу, а 65 — літері «А» великій. Перші 32 коди використовуються для керівних функцій, на зразок введення і стирання попереднього символу. Строго кажучи, ASCII — це семи-бітний код, а восьмий біт часто використовується для забезпечення відповідності чи додаткових символів. Система широко використовується для зберігання тексту і передачі інформації між комп'ютерами.

Юнікод (Unicode) - стандарт кодування символів, що дозволяє представити знаки практично всіх письмових мов. Стандарт запропонований в 1991 році некомерційною організацією «Консорціум Юнікоду» (англ. Unicode Consortium, Unicode Inc.). Застосування цього стандарту дозволяє закодувати дуже велике число символів з різних писемностей: у документах Unicode можуть сусідити китайські ієрогліфи, математичні символи, букви грецького алфавіту, латиниці і кирилиці, при цьому стає непотрібним перемикання кодових сторінок. Стандарт складається з двох основних розділів: універсальний набір символів (англ. UCS, universal character set) і сімейство кодувань (англ. UTF, Unicode transformation format). Універсальний набір символів задає однозначну відповідність символів кодам - ​​елементам кодового простору, що представляє невід'ємні цілі числа. Сімейство кодувань визначає машинне представлення послідовності кодів UCS. Коди в стандарті Юнікод розділені на кілька областей. Область з кодами від U +0000 до U +007 F містить символи набору ASCII з відповідними кодами. Далі розташовані області знаків різних писемностей, знаки пунктуації і технічні символи. Частина кодів зарезервована для використання в майбутньому. Під символи кирилиці виділені області знаків з кодами від U +0400 до U +052 F, від U +2 DE0 до U +2 DFF, від U + A640 до U + A69

Універсальна система кодування (Юнікод) являє собою набір графічних символів і спосіб їх кодування для комп'ютерної обробки текстових даних.

Графічні символи - це символи, які мають видиме зображення. Графічним символам протиставляються керуючі символи і символи форматування. Графічні символи включають в себе такі групи:

  • букви, що містяться хоча б в одному з обслуговуваних алфавітів;

  • цифри;

  • знаки пунктуації;

  • спеціальні знаки (математичні, технічні, ідеограми та ін);

  • роздільники.

Юнікод - це система для лінійного представлення тексту. Символи, які мають додаткові над або підрядкові елементи, можуть бути представлені у вигляді побудованої за певними правилами послідовності кодів або у вигляді єдиного символу (монолітний варіант, precomposed character).

Графічні символи в Юнікод поділяються на протяжні і непротяжні (бесшірінние). Непротяжні символи при відображенні не займають місця в рядку. До них належать, зокрема, знаки наголосу та інші діакритичні знаки. Як протяжні, так і непротяжні символи мають власні коди. Протяжні символи інакше називаються базовими (англ. base characters), а непротяжні - модифікуючими (англ. combining characters); причому останні не можуть зустрічатися самостійно. Наприклад, символ «á» може бути представлений як послідовність базового символу «a» (U +0061) і модифікуючого символу «» (U +0301) або як монолітний символ «á» (U +00 C1).

Особливий тип модифікуючих символів - селектори варіантів накреслення (англ. variation selectors). Вони діють тільки на ті символи, для яких такі варіанти визначені.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]