Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Тема 1_1инф.doc
Скачиваний:
24
Добавлен:
21.11.2019
Размер:
385.54 Кб
Скачать

2.2. Кибернетический (алфавитный) подход к измерению информации

В технике используют другой, простой и грубый объемный способ измерения информации (данных).

Рассматриваемый подход к измерению информации является альтернативным к содержательному подходу. Здесь речь идет об измерении количества информации в тексте (символьном сообщении), составленном из символов некоторого алфавита. К содержанию текста такая мера информации отношения не имеет. Поэтому такой подход можно назвать объективным, т.е. не зависящим от воспринимающего его субъекта.

Алфавитный подход — это единственный способ измерения информации, который может применяться по отношению к информации, циркулирующей в информационной технике, в компьютерах.

Опорным в этой теме является понятие алфавита. Алфавит — это конечное множество символов, используемых для представления информации. Число символов в алфавите называется мощностью алфавита (термин взят из математической теории множеств). В основном содержании базового курса алфавитный подход рассматривается лишь с позиции равновероятного приближения. Это значит, что допускается предположение о том, что вероятности появления всех символов алфавита в любой позиции в тексте одинаковы. Разумеется, это не соответствует реальности и является упрощающим предположением.

В рассматриваемом приближении количество информации, которое несет в тексте каждый символ (i), вычисляется из уравнения Хартли: 2i = N, где N — мощность алфавита. Величину i можно назвать информационным весом символа. Отсюда следует что количество информации во всем тексте (I), состоящем из К символов, равно произведению информационного веса символа на К : I = I x К. Эту величину можно назвать информационным объемом текста. Такой подход к измерению информации еще называют объемным подходом.

Вопрос: какова минимальная мощность алфавита, с помощью которого можно записывать (кодировать) информацию?

Предположим, что используемый алфавит состоит всего из одного символа, например «1». Интуитивно понятно, что сообщить что-либо с помощью единственного символа невозможно. Но это же доказывается строго с точки зрения алфавитного подхода. Информационный вес символа в таком алфавите находится из уравнения: 2i = 1. Но поскольку 1 = 20, то отсюда следует, что i = 0 бит.

Полученный вывод можно проиллюстрировать следующим образным примером. Представьте себе толстую книгу в 1000 страниц, на всех страницах которой написаны одни единицы (единственный символ используемого алфавита). Сколько информации в ней содержится? Ответ: нисколько, ноль. Причем такой ответ получается с любой позиции, как с содержательной, так и с алфавитной.

Минимальная мощность алфавита, пригодного для передачи информации, равна 2. Такой алфавит называется двоичным алфавитом. Информационный вес символа в двоичном алфавите легко определить. Поскольку 2i = 2, то i = 1 бит. Итак, один символ двоичного алфавита несет 1 бит информации. С этим обстоятельством встретимся, когда будем знакомиться с алфавитом внутреннего языка компьютера — языка двоичного кодирования.

Бит (двоичный разряд) — это один символ двоичного алфавита — основная единица измерения информации. Он позволяет пол­ностью передать информацию о реализации события, которое может иметь два исхода. Например, бросание монеты.

Кроме нее используются и другие единицы. 1 бит — это исходная единица. Следующая по величине единица — байт. Байт вводится как информационный вес символа из алфавита мощностью 256. Поскольку 256 = 28, то 1 байт = 8 бит. Иными словами, байт — это количество информации, которое можно передать с помощью 8 двоичных символов, восьмиразрядного двоичного кода. Он позволяет полностью передать информацию о реализации события, которое может иметь 28 = 256 исходов. Например, нажа­тие на одну из клавиш компьютера.

Компьютер для внешнего представления текстов и другой символьной информации использует алфавит мощностью 256 (во внутреннем представлении любая информация в компьютере кодируется в двоичном алфавите). Фактически, для выражения объема компьютерной информации в качестве основной единицы используется байт.

Более крупная единица измерения — килобайт (Кбайт). 1 Кбайт равен 210 байт (1024 байт). Пример: одна страница неформатированного машинописного текста составляет около 2 Кбайт.

Более крупные единицы измерения данных образуются добавлением префиксов мега-, гига-, тера-:.

1 Мбайт = 1024 Кбайт = 1020 байт

1 Гбайт = 1024 Мбайт = 1030 байт

1 Тбайт = 1024 Гбайт = 1040 байт

Рассматривая крупные единицы: килобайт, мегабайт, гигабайт, терабайт (в более крупных единицах пока нет практической надобности) — нужно обратить внимание на то, что мы привыкли приставку «кило» воспринимать, как увеличение в 1000 раз. В информатике это не так. Килобайт больше байта в 1024 раза, а число 1024 = 210. Также относится и «мега» по отношению к «кило» и т.д. Тем не менее, часто при приближенных вычислениях используют коэффициент 1000.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]