Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Гл.1 Сх..docx
Скачиваний:
12
Добавлен:
12.11.2019
Размер:
281.02 Кб
Скачать

1.6 Кодировка текстовых данных

Кодировка текстовых данных. Если каждому символу алфавита соотнести определенное целое число (например, порядковый номер), то с помощью двоичного кода можно кодировать и текстовую информацию. Восемь двоичных разрядов достаточно для кодировки 256 разных символов. Этого хватит, чтобы представить разными комбинациями восьми битов все символы английского и российского языков, как маленькие, так и большие, а также знаки препинаний, символы основных арифметических действий и некоторые общепринятые специальные символы, например, символ "§".

Технически это выглядит очень просто, однако всегда существовали определенные весомые организационные сложности. В первые годы развития вычислительной техники они были связаны с отсутствием необходимых стандартов, а в настоящее время, напротив, с большим количеством одновременно действующих стандартов. Для того, чтобы весь мир одинаково кодировал текстовые данные, нужные единственные таблицы кодировки, а это пока невозможно через противоречие между символами национальных алфавитов, а также через противоречие корпоративного характера.

Для английского языка, который захватил де-факто нишу международного средства общения, противоречия уже снятые. Институт стандартизации США (ANSI -american National Standard Institute) ввел в действие систему кодировки ASCII (American Standard Code for Information Interchange - стандартный код информационного обмена США). В системе ASCII закреплены две таблицы кодировки - базовая и расширенная. Базовая таблица закрепляет значение кодов от 0 до 127, а расширенная относится к символам представления номерами от 128 до 255.

Первых 32 кодов базовой таблицы, начиная с нулевого, отданы производителям аппаратных средств (в первую очередь производителям компьютеров и печатающих устройств). На этом участке размещаются так называемые управляющие коды, которым не отвечают никакие символы языков, и, соответственно, эти коды не выводятся ни на экран, ни на печать, ими можно управлять лишь тем, как проводится вывод других данных.

Начиная с кода 32 по код 127 размещены коды символов английского алфавита, знаков препинаний, цифр, арифметических действий и некоторых вспомогательных символов.

Таблица 1.6 – Некоторые значения кода ASCII (шестнадцатиразрядного)

Цифры

Русский алфавит

Английский алфавит

0

0030

А

00С0

а

00Е0

A

0041

1

0031

Б

00С1

б

00Е1

B

0042

2

0032

В

00С2

в

00Е2

C

0043

3

0033

Г

00С3

г

00Е3

D

0044

4

0034

Д

00С4

д

00Е4

E

0045

5

0035

Е

00С5

е

00Е5

F

0046

6

0036

Ё

00С6

ё

00Е6

G

0047

7

0037

И

00С7

и

00Е7

H

0048

8

0038

К

00СА

к

00ЕА

I

0049

9

0039

Л

00СВ

л

00ЕВ

J

004A

Для кодировки символов русского языка используется система кодировки, известная как система кодировки Windows-1251, которая была введена "извне" компанией Microsoft, но, учитывая широкое распространение операционных систем и других программных продуктов этой компании в России, она глубоко закрепилась и нашла широкое приложение. Эта кодировка используется на большинстве локальных компьютеров, которые работают на платформе Windows.

Распространенной является кодировка, что носит название KОИ-8-R (код обмена информацией, восьмизначный), - его происхождение относится до времен действия Совета Экономической Взаимопомощи государств Восточной Европы. Сегодня кодировка КОИ-8 имеет широкое распространение в компьютерных сетях на территории России и в российском секторе Интернета, для Украины используется кодировка KОИ-8-U.

Международный стандарт, в котором предусмотрена кодировка символов российского алфавита, носит название кодировки ISO (International Standard Organization - Международный институт стандартизации). На практике даная кодировка используется редко.

Универсальная система кодировки текстовых данных. Если проанализировать организационные трудности, связанные с созданием единственной системы кодировки текстовых данных, то можно прийти к выводу, что они вызваны ограниченным набором кодов (256). В то же время очевидно, что если, например, кодировать символы не восьмиразрядными двоичными числами, а числами с большим количеством разрядов, то и диапазон возможных значений кодов станет намного большим. Такая система, основанная на 16-разрядной кодировке символов, имеет название универсальной - UNICODE. Шестнадцать разрядов позволяют обеспечить уникальных кодов для 65 536 разных символов - этого поля достаточно для размещения в одной таблице символов большинства словно планеты.

Таблица 1.7 – Некоторые значения кода UNICODE

Цифры

Русский алфавит

Английский алфавит

0

0030

А

0410

а

0430

A

0041

1

0031

Б

0411

б

0431

B

0042

2

0032

В

0412

в

0432

C

0043

3

0033

Г

0413

г

0433

D

0044

4

0034

Д

0414

д

0434

E

0045

5

0035

Е

0415

е

0435

F

0046

6

0036

Ё

0416

ё

0436

G

0047

7

0037

И

0418

и

0438

H

0048

8

0038

К

041А

к

043А

I

0049

9

0039

Л

041В

л

043В

J

004A

Кодировка графических данных.

Если рассмотреть с помощью увеличительного стекла черно-белое графическое изображение, напечатанное в газете или книге, то можно увидеть, что оно состоит из мельчайших точек, которые создают характерный узор, который называется растром.

Поскольку линейные координаты и индивидуальные свойства каждой точки (яркость) можно выразить с помощью целых чисел, то можно сказать, что растровая кодировка позволяет использовать двоичный код для представления графических данных.

Общепринятым на сегодняшний день считается представление черно-белых иллюстраций в виде комбинации точек с 256 градациями серого цвета, и, таким образом, для кодировки яркости любой точки достаточно восьмиразрядного двоичного числа.

Для кодировки цветных графических изображений применяется принцип декомпозиции произвольного цвета на основные составляющие. Для этого используют три основных цвета: красный (Red, R), зеленый (Green, G) и синий (Blue, В). На практике считается (хотя теоретически это не совсем так), что любой цвет, видимый человеческим глазом, можно получить путем механического смещения этих трех основных цветов.

Такая система кодировки называется системой RGB за первыми буквами названий основных цветов.

Если для кодировки яркости каждой из основных составляющих использовать по 256 значений (восемь двоичных разрядов), как это принято для полутоновых черно-белых изображений, то на кодировку цвета одной точки нужно затрачивать 24 разряды. При этом система кодировки обеспечивает однозначное определение 16,5 млн разных цветов, что в действительности близкое к чувствительности человеческого глаза.

Режим представления цветной графики с использованием 24 двоичных разрядов называется полноцветным (True Color).

Каждому из основных цветов можно поставить в соответствие дополнительный цвет, дополняющий. Нетрудно заметить, что для любого из основных цветов дополнительным будет цвет, образованный суммой пары остальных основных цветов.

Соответственно, дополнительными цветами является: голубой (Cyan, C), пурпурный (Magenta, M) и желтый (Yellow, Y).

Принцип декомпозиции произвольного цвета на составные компоненты можно применять не только для основных цветов, но и для дополнительных, то есть любой цвет можно представить в виде суммы голубой, пурпурной и желтой составляющей. Такой метод кодировки цвета принят в полиграфии, но в полиграфии используется еще и четвертая краска - черная (Black, K). Поэтому даная система кодировки отражается четырьмя буквами CMYK(черный цвет отражается буквой К, потому что буква В уже занятая синим цветом), и для представления цветной графики в этой системе нужно иметь 32 двоичных разряда.

Такой режим также называется полноцветным (True Color).

Если уменьшить количество двоичных разрядов, которые используются для кодировки цвета каждой точки, то можно сократить объем данных, но при этом диапазон кодируемых цветов заметно сокращается.

Кодировка цветной графики 16-разрядными двоичными числами называется режимом High Color.

При кодировке информации о цвете с помощью восьми бит данных можно передать только 256 цветовых оттенков.

Такой метод кодировки цвета называется индексным.

Значение названия в том, что, поскольку 256 значений абсолютно недостаточные, чтобы передать весь диапазон цветов, доступный человеческому глазу, код каждой точки растра выражает не цвет сам по себе, а только его номер (индекс) в справочной таблице, которая называется палитрой. Понятно, эта палитра должна прикладываться к графическим данным - без нее нельзя воспользоваться методами воссоздания информации на экране или бумаге.

Контрольные вопросы

  1. Какие методы и технические средства изучает дисциплина «Компьютерная схемотехника»?

  2. Объясните понятие информатика?

  3. Поясните, что такое сигнал?

  4. Поясните количественные меры информации – бит, байт, килобайт.

  5. Что такое данные.

  6. Какие этапы включает в себя информационный процесс.

  7. Определение компьютера с точки зрения информатики.

  8. Охарактеризуйте такое понятие как носитель информации.

  9. По каким признакам различают носители информации.

  10. Какие знаки используют для информационного обмена.

  11. По каким признакам характеризуют сигналы передачи информации.

  12. Что такое символ и слово для информационного обмена.

  13. Какие информационные меры количества и качества информации.

  14. Расскажите о семантическом подходе к измерению количества информации.

  15. Расскажите о структурном подходе к измерению количества информации.

  16. Какие формы представления чисел используют в компьютерах

  17. Как представляются числа в форме с фикси­рованной запятой (точкой). Пример.

  18. Как представляются числа в форме с плавающей запятой (точкой). Пример.

  19. Что такое диапазоном представления чисел в форме с фикси­рованной запятой.

  20. Диапазон представления чисел в форме с плавающей запятой

  21. Как происходит кодировка текстовых данных

  22. Как происходит кодировка графических данных

  23. Расскажите о системе кодировки ASCII

  24. Расскажите о системе кодировки UNICODE

  25. Расскажите о системе кодировки полноцветный (True Color).