Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Dopolnitelno - tekstovie kodirovki.doc
Скачиваний:
9
Добавлен:
21.04.2019
Размер:
468.48 Кб
Скачать

Кодирование текстовой информации. Содержание

(является гиперссылками перехода):

Введение 1

ASCII 1

Mac 2

Основное понятие – «таблица кодировки» 3

Российская особенность 4

Семейство кодировок 8859 4

CP866 6

Win1251 (CP1251) 7

KOI-8 9

Unicode 13

Дополнительная информация (приложение) 16

Сравнительные таблицы 18

Таблица 1. Сравнение стандартов. 18

Таблица 2. Области преимущественного применения. 19

Таблица 3. Сравнение символов. 20

Таблица 4. Сравнение кодировок. 20

Одно слово в разных кодировках (пример) 22

Использованные источники: 22

Введение

Нажатие клавиши на клавиатуре приводит к тому, что сигнал посылается в компьютер в виде двоичного числа, которое хранится в таблице кодировки.

Таблица кодировки – это таблица, в которой устанавливается соответствие между символами и их порядковыми номерами в компьютерном алфавите.

Как правило, все символы компьютерного алфавита пронумерованы от 0 до 255. Каждому номеру соответствует 8-разрядный двоичный код от 00000000 до 11111111. Этот код есть порядковый номер символа в двоичной системе счисления.

Для разных типов ЭВМ используются различные таблицы кодировки.

ASCII

1.

С распространением персональных компьютеров типа IBM PC международным стандартом стала таблица кодировки под названием ASCII (American Standard Code for Information Interchange) – Американский стандартный код для информационного обмена. Стандартными в этой таблице являются только первые 128 символов, т.е. символы с номерами от нуля (двоичный код 00000000) до 127.(01111111). Сюда входят буквы латинского алфавита, цифры, знаки препинания, скобки и некоторые другие символы. Остальные 128 кодов, начиная со 128 (двоичный код10000000) и кончая 255 (11111111), используются для кодировки букв национальных алфавитов, символов псевдографики и научных символов. В русских национальных кодировках в этой части таблицы размещаются символы русского алфавита.

Принцип последовательного кодирования алфавита: в кодовой таблице ASCII латинские буквы (прописные и строчные) располагаются в алфавитном порядке. Расположение цифр также упорядочено по возрастанию значений. Данное правило соблюдается и в других таблицах кодировки. Благодаря этому и в машинном представлении для символьной информации сохраняется понятие «алфавитный порядок».

Mac

2.

Компьютеры фирмы Apple, работающие под управлением операционной системы Mac OS, используют свою собственную кодировку Mac.

Кодировка MacCyrillic используется только на компьютерах «Макинтош».

Благодаря отсутствию псевдографики и «верхних» управляющих символов эта кодировка включает довольно много полезных символов; кроме того, присутствуют все дополнительные буквы, необходимые для записи украинского, белорусского, македонского и сербского языков.

Нижняя часть таблицы кодировки (латиница) полностью соответствует кодировке ASCII. Числа под буквами обозначают шестнадцатеричный код буквы в Юникоде.

.0

.1

.2

.3

.4

.5

.6

.7

.8

.9

.A

.B

.C

.D

.E

.F

  8.  

А 410

Б 411

В 412

Г 413

Д 414

Е 415

Ж 416

З 417

И 418

Й 419

К 41A

Л 41B

М 41C

Н 41D

О 41E

П 41F

  9.  

Р 420

С 421

Т 422

У 423

Ф 424

Х 425

Ц 426

Ч 427

Ш 428

Щ 429

Ъ 42A

Ы 42B

Ь 42C

Э 42D

Ю 42E

Я 42F

  A.  

† 2020

° B0

¢ A2

£ A3

§ A7

• 2022

¶ B6

І 406

® AE

© A9

™ 2122

Ђ 402

ђ 452

≠ 2260

Ѓ 403

ѓ 453

  B.  

∞ 221E

± B1

≤ 2264

≥ 2265

і 456

µ B5

∂ 2202

Ј 408

Є 404

є 454

Ї 407

ї 457

Љ 409

љ 459

Њ 40A

њ 45A

  C.  

ј 458

Ѕ 405

¬ AC

√ 221A

ƒ 192

≈ 2248

∆ 2206

« AB

» BB

… 2026

  A0

Ћ 40B

ћ 45B

Ќ 40C

ќ 45C

ѕ 455

  D.  

– 2013

— 2014

“ 201C

” 201D

‘ 2018

’ 2019

÷ F7

„ 201E

Ў 40E

ў 45E

Џ 40F

џ 45F

№ 2116

Ё 401

ё 451

я 44F

  E.  

а 430

б 431

в 432

г 433

д 434

е 435

ж 436

з 437

и 438

й 439

к 43A

л 43B

м 43C

н 43D

о 43E

п 43F

  F.  

р 440

с 441

т 442

у 443

ф 444

х 445

ц 446

ч 447

ш 448

щ 449

ъ 44A

ы 44B

ь 44C

э 44D

ю 44E

¤ A4

Кроме того, что пользователь может работать на разных компьютерах, существует работа в компьютерных сетях. При этом отображение страницы интернет не всегда правильное. Часто пользователь вместо ожидаемого текста на родном языке видит «абракадабру» из символов. Данная проблема также связана с применением различных кодировок для текстовой информации.

Заметим, что сегодня проходит работа по выработке единого стандарта, единой стандартной кодировки, понимаемой всеми и всегда…

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]