2.2. Кибернетический (алфавитный) подход к измерению информации

В технике используют другой, простой и грубый объемный способ измерения информации (данных).

Рассматриваемый подход к измерению информации является альтернативным к содержательному подходу. Здесь речь идет об измерении количества информации в тексте (символьном сообщении), составленном из символов некоторого алфавита. К содержанию текста такая мера информации отношения не имеет. Поэтому такой подход можно назвать объективным, т.е. не зависящим от воспринимающего его субъекта.

Алфавитный подход — это единственный способ измерения информации, который может применяться по отношению к информации, циркулирующей в информационной технике, в компьютерах.

Опорным в этой теме является понятие алфавита. Алфавит — это конечное множество символов, используемых для представления информации. Число символов в алфавите называется мощностью алфавита (термин взят из математической теории множеств). В основном содержании базового курса алфавитный подход рассматривается лишь с позиции равновероятного приближения. Это значит, что допускается предположение о том, что вероятности появления всех символов алфавита в любой позиции в тексте одинаковы. Разумеется, это не соответствует реальности и является упрощающим предположением.

В рассматриваемом приближении количество информации, которое несет в тексте каждый символ (i), вычисляется из уравнения Хартли: 2ⁱ = N, где N — мощность алфавита. Величину i можно назвать информационным весом символа. Отсюда следует что количество информации во всем тексте (I), состоящем из К символов, равно произведению информационного веса символа на К : I = I x К. Эту величину можно назвать информационным объемом текста. Такой подход к измерению информации еще называют объемным подходом.

Вопрос: какова минимальная мощность алфавита, с помощью которого можно записывать (кодировать) информацию?

Предположим, что используемый алфавит состоит всего из одного символа, например «1». Интуитивно понятно, что сообщить что-либо с помощью единственного символа невозможно. Но это же доказывается строго с точки зрения алфавитного подхода. Информационный вес символа в таком алфавите находится из уравнения: 2ⁱ = 1. Но поскольку 1 = 2⁰, то отсюда следует, что i = 0 бит.

Полученный вывод можно проиллюстрировать следующим образным примером. Представьте себе толстую книгу в 1000 страниц, на всех страницах которой написаны одни единицы (единственный символ используемого алфавита). Сколько информации в ней содержится? Ответ: нисколько, ноль. Причем такой ответ получается с любой позиции, как с содержательной, так и с алфавитной.

Минимальная мощность алфавита, пригодного для передачи информации, равна 2. Такой алфавит называется двоичным алфавитом. Информационный вес символа в двоичном алфавите легко определить. Поскольку 2ⁱ = 2, то i = 1 бит. Итак, один символ двоичного алфавита несет 1 бит информации. С этим обстоятельством встретимся, когда будем знакомиться с алфавитом внутреннего языка компьютера — языка двоичного кодирования.

Бит (двоичный разряд) — это один символ двоичного алфавита — основная единица измерения информации. Он позволяет полностью передать информацию о реализации события, которое может иметь два исхода. Например, бросание монеты.

Кроме нее используются и другие единицы. 1 бит — это исходная единица. Следующая по величине единица — байт. Байт вводится как информационный вес символа из алфавита мощностью 256. Поскольку 256 = 2⁸, то 1 байт = 8 бит. Иными словами, байт — это количество информации, которое можно передать с помощью 8 двоичных символов, восьмиразрядного двоичного кода. Он позволяет полностью передать информацию о реализации события, которое может иметь 2⁸ = 256 исходов. Например, нажатие на одну из клавиш компьютера.

Компьютер для внешнего представления текстов и другой символьной информации использует алфавит мощностью 256 (во внутреннем представлении любая информация в компьютере кодируется в двоичном алфавите). Фактически, для выражения объема компьютерной информации в качестве основной единицы используется байт.

Более крупная единица измерения — килобайт (Кбайт). 1 Кбайт равен 2¹⁰ байт (1024 байт). Пример: одна страница неформатированного машинописного текста составляет около 2 Кбайт.

Более крупные единицы измерения данных образуются добавлением префиксов мега-, гига-, тера-:.

1 Мбайт = 1024 Кбайт = 10²⁰ байт

1 Гбайт = 1024 Мбайт = 10³⁰ байт

1 Тбайт = 1024 Гбайт = 10⁴⁰ байт

Рассматривая крупные единицы: килобайт, мегабайт, гигабайт, терабайт (в более крупных единицах пока нет практической надобности) — нужно обратить внимание на то, что мы привыкли приставку «кило» воспринимать, как увеличение в 1000 раз. В информатике это не так. Килобайт больше байта в 1024 раза, а число 1024 = 2¹⁰. Также относится и «мега» по отношению к «кило» и т.д. Тем не менее, часто при приближенных вычислениях используют коэффициент 1000.

<<< < Предыдущая 1 2 3 4 5 6 78 / 168 9 10 11 12 13 14 15 16 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
26.05.201517.77 Кб13Таможенные платежи и таможенная стоимость.docx
#
26.04.201920.56 Кб5ТГП - Бочаров.docx
#
26.05.20151.38 Mб100ТЕМА 1-5-Курс лекций ЭКОН ОРГАН.doc
#
30.08.2019152.06 Кб10Тема 1.doc
#
26.05.2015652.29 Кб19ТЕМА 11-18-Курс лекций ЭКОН ОРГАН.doc
#
21.11.2019385.54 Кб24Тема 1_1инф.doc
#
26.05.2015301.57 Кб12Тема 25.doc
#
26.05.2015268.29 Кб19Тема 26.doc
#
26.05.2015299.01 Кб31Тема 27.doc
#
26.05.2015227.33 Кб46Тема 3.doc
#
26.05.2015266.75 Кб36Тема 4.doc