Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Инф и ИКТ лк 6 Принципы работы компьютера.docx
Скачиваний:
54
Добавлен:
10.05.2015
Размер:
63.44 Кб
Скачать

1.2. Кодирование информации и её представление в памяти компьютера

Вся информация в компьютере представляется в цифровой форме. Для чисел это представление является естественным. Для нечисловой информации (например, текста) используется стандартный прием: все возможные значения нумеруются и вместо самих значений хранятся их номера (которые играют роль кодов). Так, для представлении текстовой информации используется таблица символов, содержащая все символы алфавита, которые могут встретиться в тексте, а текст, хранящийся в памяти компьютера, заменяется списком номеров символов в этой таблице. Аналогично кодируется информация других видов. В любом случае содержание представляемых нечисловых данных, хранящихся в компьютере, зависит от таблиц нумерации (называемых таблицами кодирования).

Количество двоичных разрядов, необходимых для записи одного кода при таком способе записи, зависит от общего объема таблицы. Наибольшее число, которое в двоичной системе счисления можно записать с помощью N цифр, состоит из N единиц. Это число равно 1 + 2 + 4 + ... + 2N-1 = 2N— 1. Например, с помощью 8 двоичных цифр можно различать 28 = 256 символов текста. Следовательно, для хранения кодов значений, общий объем которых равен числу M, необходимо примерно log2M двоичных разрядов.

Это рассуждение настолько важно для всей идеологии хранения информации в двоичном коде, что в информатике принято измерять объем данных и памяти компьютеров не в десятичной системе счисления, а в специальных единицах измерения, основанных на степенях двойки. Используя то обстоятельство, что 210= 1024 не очень отличается от 103= 1000, принято 1024 байта называть килобайтом (1Кб). Аналогично мегабайт (1Мб) — это 024 килобайта, а гигабайт (1Гб) — 1024 мегабайта. Количество информации в современном мире столь велико, что приходится вводить дополнительную единицу — терабайт (1Т6), равный 1024 гигабайтам. Если не нужна особая точность, то можно считать, что приблизительно 1 терабайт = 1 тыс. гигабайтов = 1 млн мегабайтов = = 1 млрд килобайтов = 1 трлн байтов.

Размерность информации За единицу информации принимают количество информации, заключенное в выборе одного из двух равновероятных событий. Эта единица называется двоичной единицей, или битом (binary digit, bit).

В информатике и вычислительной технике принята система представления данных двоичным кодом. Наименьшей единицей такого представления является бит.

Байт  это группа взаимосвязанных битов. 1 байт = 8 бит. Одним байтом кодируется один символ текстовой информации.

1 Килобайт (Кб) = 1024 байт.

Однако, повсюду, где это не принципиально, считают, что 1 Кб равен 1000 байт. Условно можно считать, что одна страница неформатированного машинописного текста равна 2 Кб.

1 Мегабайт (Мб) = 1024 Кб.

1 Гигабайт (Гб) =1024 Мб.

1 Терабайт (Тб) = 1024 Гб.

Уже говорилось, что логически оперативная память компьютера представляет собой линейную последовательность байтов. Длина этой последовательности в современных персональных компьютерах достигает десятков и сотен мегабайтов. Еще больше память суперкомпьютеров.

Для хранения чисел в зависимости от их величины и точности выделяется несколько байтов памяти (от 1 до 10). Различают две основные формы представления числа в памяти компьютера. При первом способе все разряды выделенных для хранения числа байтов памяти последовательно нумеруются и двоичные цифры числа непосредственно записываются в соответствующие биты памяти. Один бит выделяется для представления знака числа (0 — плюс, 1 — минус). При втором способе число представляется в так называемой нормализованной (или экспоненциальной) форме: Х= М 10n, где число М (называемое мантиссой) заключено от 1 до 10, число п (называемое порядком) — целое.

Используется несколько форматов представления целых и нормализованных чисел, которые отличаются объемом и наличием или отсутствием знакового бита. От этого зависит диапазон чисел, которые могут быть представлены в данном формате. Например, если заранее известно, что какая-то целая величина положительна и не может быть больше 255, то для ее хранения достаточно 1 байта. Для хранения величин, изменяющихся в диапазоне от —215 = —32 768 до 215 — 1 = 32 767, выделяется 2 байта. Если целое число не вмещается в этот диапазон, то для его хранения выделяется 4 байта (диапазон от —231 до 231 - 1).

В принципе, подобный подход годится и для дробных чисел. L память компьютера заносятся цифры числа, но при этом считается, что на определенном месте этой записи стоит десятичная точка. Такая форма записи называется представлением числа с фиксированной точкой. Максимальное число цифр в числе и конкретное положение запятой определяются форматом числа. Предусмотрено несколько вариантов формата представления чисел с фиксированной точкой в памяти компьютера.

Представление нормализованных чисел называется представлением числа с плавающей точкой. Оно используется для хранения величин, которые могут принимать значения в очень большом диапазоне. В памяти компьютера порядок и мантисса хранятся отдельно в форме двоичных целых чисел со знаком. В современных компьютерах используется несколько форматов представления чисел с плавающей точкой, которые отличаются общим объемом представления чисел (6, 8 или 10 байтов), а также размерами памяти, отводимой отдельно для мантиссы и порядка. От этого зависят общий диапазон возможных значений числовой величины в компьютере и минимальная ошибка в вычислениях, проистекающая из-за невозможности запоминать в компьютере большее количество знаков после десятичной точки.

В действительности информация разнородна. Обычно делят данные на числовую, текстовую и логическую информацию. Под текстовой информацией понимается линейная последовательность символов. Для представления символа в памяти компьютера используется следующая схема: фиксируется множество допустимых символов текста (обычно их 28 = 256 символов), и каждому символу присваивается номер (от 0 до 255), который служит кодом символа. После этого последовательность символов заменяется на последовательность кодов, которые в памяти компьютера записываются в виде целых двоичных чисел (без знака). Код одного символа помещается в 1 байте памяти (именно поэтому исторически сложилось разбиение памяти на группы по 8 битов, так как оказалось, что оптимальное количество символов — 28, а не, например, 29).

Множество допустимых символов и их кодов составляют таблицу кодирования символов. Естественно, эта таблица не должна зависеть от произвола программиста или производителя компьютеров, поскольку обмен информацией в этом случае будет сильно затруднен. В настоя шее время существует стандарт ASC/f (American Standard Code for Informational Interchange), содержащий 128 основных символов (коды от 0 до 127) и 128 расширенных символов (коды от 128 до 255). Поскольку в этот стандарт не входят символы национальных алфавитов, в каждой стране 128 кодов расширенных символов (от 128 до 255) заменяются символами национального алфавита. Другими словами, каждый язык с алфавитом, отличным от английского, устанавливает свой стандарт. Осмысленный текст на одном языке будет бессмысленным на другом. Таким образом, для правильной работы с текстом важна не только сама информация, но и ее интерпретация. Программа, которая правильно интерпретирует коды символов в соответствии с таблицей кодирования в определенном алфавите, называется текстовым драйвером

Логическая величина — это величина, которая может принимать всего два значения: true и false («истина» и «ложь»). Для хранения значения логической переменной достаточно 1 бита. Обычно значение «единица» бита памяти ассоциируется с истиной, значение «ноль» — с ложью.

Для хранения в памяти компьютера более сложных объектов, таких, как видеоизображения или звуки, описания этих объектов преобразуются в числовую форму. Существует достаточно много способов кодирования такого вида информации, но в итоге изображение или звук представляются в виде последовательности нулей и единиц, которые размещаются в битах памяти компьютера и при необходимости извлекаются оттуда и интерпретируются определенным образом.