Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Код-ние текс, звук, граф-ИНСТ.doc
Скачиваний:
6
Добавлен:
11.09.2019
Размер:
71.68 Кб
Скачать

3

Кодирование. Двоичное кодирование

Информация может быть представлена в различных формах – звуковая, печатная и т.д.

В процессе обмена информацией часто приходится производить операции кодирования и декодирования информации.

Кодирование – это операция преобразования знаков или группы знаков одной знаковой системы в знаки или группы знаков другой знаковой системы:

    • при вводе знака в компьютер путём нажатия соответствующей клавиши на клавиатуре происходит его кодирование, т.е. преобразование во внутренний компьютерный код,

    • и наоборот, при выводе знака на экран монитора или принтер происходит обратный процесс – декодирование: знак, из компьютерного кода преобразуется в его графическое изображение.

Средствами кодирования служит таблица соответствия знаковых систем, которая устанавливает взаимно однозначное соответствие между знаками или группами знаков двух различных знаковых систем.

Компьютер может обрабатывать информацию следующих видов:

  • числовую,

  • текстовую,

  • графическую,

  • видео,

  • звуковую

Все эти виды информации преобразуются в последовательности электрических импульсов: есть импульс (1), нет импульса (0), т.е. в последовательность нулей и единиц. Такое кодирование информации легко реализуется технически и называется двоичным кодированием.

Код – система условных знаков для представления информации

В компьютере для представления числовой информации используется двоичная система счисления. Числа могут быть записаны в естественной и экспоненциальной форме.

При представлении в памяти компьютера чисел в естественной форме устанавливается фиксированная длина разрядной сетки. Точку (запятую) можно зафиксировать в начале, середине или конце разрядной сетки; при этом распределение разрядов между целой и дробной частями остается неизменным для любых чисел. В связи с этим существует другое название естественной формы представления чисел с фиксированной точкой (запятой).

В современных компьютерах эта форма используется при представлении целых чисел.

Обычно целые числа занимают в памяти компьютера 1, 2 или 4 байта. Один бит — как правило, старший — отводится под знак числа. Знак положительного числа кодируется нулем, а знак отрицательного числа — единицей. Целые числа без знака в 2-байтовом формате могут принимать значения от 0 до 216 — 1 (до 65 535), а со знаком "-" от -215 до +215 - 1, т: е. от -32 768 до 32 767.

Достоинствами такой формы 'представления являются простота и наглядность, простота алгоритмов реализации операций и, следовательно, простота устройств и высокая скорость выполнения операций; недостатком — конечный диапазон представления величин. Неудобства проявляются при решении задач, и которых используются как очень малые, так п очень большие числа.

Обработка таких чисел производится в экспоненциальной форме.

В этом случае положение запятой в записи числа может изменяться, поэтому представление в памяти чисел в экспоненциальной форме называется представлением с плавающей точкой (запятой).

Любое число А в таком случае представляется в виде:

А = т х q р,

где т — мантисса числа;

qоснование системы счисления;

р — порядок числа.

Для однозначности представления чисел с плавающей точкой используется нормализованная форма, при которой мантисса отвечает условию: q-1 \ т | < 1, т. е. мантисса является правильной дробью и имеет после запятой цифру, отличную от нуля.

Число с плавающей точкой занимает в памяти 4 или 8 байт. При его записи выделяются разряды для хранения знака мантиссы, знака порядка, порядка и мантиссы.

Любое вещественное число в современных компьютерах представляется в экспоненциальной форме с нормализованной мантиссой. При этом мантисса является правильной дробью, а порядок - целым числом.

Представление текстовой, информации в компьютере

В настоящее время большая часть персональных компьютеров в мире занята обработкой текстовой информации. При вводе в память компьютера текстовой информации происходит ее двоичное кодирование, символ преобразуется в двоичный код. Пользователь нажимает на клавиатуре клавишу с символом, и в память компь­ютера поступает последовательность электрических импульсов (двоичный код символа). Код хранится в оперативной памяти компьютера. В процессе вывода на экран производится обратный процесс — декодирование.

В традиционных кодировках для кодирования одного символа используется 8 бит, такой 8-разрядный код позволяет закодировать 256 различных символов.

В качестве международного стандарта присвоения символу опреде­ленного числового кода принята кодовая таблица ASCII:

  • первые 33 кода (от 0 до 32) соответствуют функциональным клавишам,

  • коды с 33 по 127 являются интернациональными и соответствуют символам латинского алфавита, цифрам, знакам арифметических операции и знакам препинания.

  • коды 128—255 являются национальными, т. е. в национальных кодировках одному и тому же колу соответствуют раз­личные символы.

Существует несколько различных кодировок кириллицы (КОИ-8, Windows, MS-DOS. Macintosh, ISO), что вызывает дополнительные трудности при работе с русскоязычными документами.

В конце 90-х гг. появился международный стандарт Unicode, который использует два байта для размещения кода символа, и поэтому с его помощью можно закодировать 65 536 различных символов.

Представление графической информации в компьютере

Для кодирования графической информации используют два приема.

  1. Прием 1

Изображение представляют в виде графического объекта, состоящего из элементарных дуг и отрезков. У каждого такого элементарного объекта кодируются его положение через координаты точек и длину радиуса, тип линии (сплошная, пунктирная, штрих-пунктирная), толщина и цвет. Такое изображение называют векторным и все его перечисленные свойства и характеристики также кодируются двоичным кодом.

  1. Прием 2

На изображение накладывают прямоугольную сетку, состоящую из большого числа мельчайших точек - пикселей. Такая сетка называется растром и позволяет разбить рисунок на конечное количество элементов. Каждая такая точка изображения имеет свой цвет, который как раз и можно закодировать двоичным кодом. Записав код каждой точки, тем самым можно получить код этого изображения.

  1. Графическая информация представляет собой изображение, сформированное из определенного числа точек — пикселей. Процесс разбиения изображения на отдельные маленькие фрагменты (точки) называется пространственной дискретизацией. Это реализуется путем сканирования, результатом которого является растровое изображение. При этом каждой точке присваивается код цвета.

  2. От количества точек зависит качество изображения. Оно тем выше, чем меньше размер точки и соответственно большее их количество составляет изображение. Такое количество точек называется разрешающей способностью и обычно существуют четыре основных значений этого параметра: 640x480, 800x600, 1024x768, 1280x1024.

  3. Качество изображения зависит также от количества цветов, т.е. от количества возможных состояний точек изображения, т.к. при этом каждая точка несет большее количество информации. Используемый набор цветов образует палитру цветов.

Кодирование цвета.

Для кодирования цвета применяется принцип разложения цвета на основные составляющие. Их три: красный цвет (Red, R), синий (Blue, В) и зеленый (Green, G). Смешивая эти составляющие, можно получать различные оттенки и цвета - от белого до черного.

Если рисунок черно-белый, то общепринятым на сегодняшний день считается представление его в виде комбинации точек с 256 градациями серого цвета, т.е. для кодирования точки достаточно 1 байта.

Если же изображение цветное, то с помощью 1 байта можно также закодировать 256 разных оттенков цветов. Этого достаточно для рисования изображений типа тех, что мы видим в мультфильмах. Для изображений же живой природы этого недостаточно. Если увеличить количество байт до двух (16 бит), то цветов станет в два раза больше, т.е. 65536. Это уже похоже на то, что мы видим на фотографиях и на картинках в журналах, но все равно хуже, чем в живой природе. Увеличим еще количество байтов до трех (24 бита). В этом случае можно закодировать 16,5 миллионов различных цветов. Именно такой режим позволяет работать с изображениями наилучшего качества.