Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
СЕА_Лекция 1 (Теор. инф. и кодир.)_для студ.doc
Скачиваний:
144
Добавлен:
09.04.2015
Размер:
230.91 Кб
Скачать

1) Алфавитный подход

Здесь смысл информации не учитывается, а учитывается только длина её записи. Так, количество текстовой информации оценивается путём пересчёта всех имеющихся в ней символов. Например, текстовое сообщение длиной 100 символов.

Алфавитный подход оперирует с данными и, фактически, измеряет количество данных, а не информации. Общепринятыми единицами измерения данных являются биты и байты.

Алфавитный подход – объективный подход к измерению количества информации, поэтому он используется в вычислительной технике как основной. Алфавитный подход даёт ответ на вопрос, какой объём памяти потребуется, чтобы записать ту или иную информацию. Зная скорость передачи данных по некоторому каналу связи, можно будет также ответить на вопрос: сколько времени потребуется на передачу имеющейся информации по этому каналу.

2) Содержательный подход

Содержащиеся в поступающей информации сведения должны быть новыми и понятными. Если поступившая информация уже была известна или она непонятна получателю, то количество полученной информации считается равным нулю.

Содержательный подход применяется, если в сообщении содержится информация о наступлении одного из равновозможных событий.

3) Вероятностный подход

Вероятностный подход используется в тех случаях, когда имеется информация о наступлении событий с разной вероятностью.

[Все три подхода к измерению информации и применяемые расчетные формулы подробно рассмотрены на лекции № 1].

5. Представление (кодирование) информации, системы счисления

ЭВМ может обрабатывать информацию только в закодированном виде.

Код – набор условных обозначений для представления информации. Под термином кодирование понимают переход от одной формы представления информации к другой, более удобной для хранения, передачи или обработки. Иначе говоря, кодирование – процесс представления информации в виде кода.

Обратная процедура получения исходных символов по кодам символов называется декодированием. Очевидно, что для выполнения правильного декодирования код должен быть однозначным, т. е. одному исходному символу должен соответствовать точно один код и наоборот.

В зависимости от целей кодирования различают следующие его виды:

1) кодирование по образцу – используется всякий раз при вводе информации в компьютер для ее внутреннего представления;

2) криптографическое кодирование, или шифрование, – используется, когда нужно защитить информацию от несанкционированного доступа;

3) эффективное, или оптимальное, кодирование – используется для устранения избыточности информации, т. е. снижения ее объема, например, при архивации;

4) помехозащитное, или помехоустойчивое, кодирование – используется для обеспечения заданной достоверности в случае, когда на сигнал накладывается помеха, например, при передаче информации по каналам связи.

Любая информация кодируется в ЭВМ с помощью последовательностей двух цифр – 0 и 1, которые называют битами или двоичными разрядами. Последовательности 0 и 1 называются двоичными кодами, а такое кодирование информации на компьютере называется двоичным кодированием. Инженеров двоичное кодирование информации привлекает тем, что оно легко реализуется технически: электронные схемы для обработки двоичных кодов должны находиться только в одном из двух состояний (есть сигнал/нет сигнала или высокое напряжение/низкое напряжение).

Кодирование числовой информации

Для кодирования числовой информации используется двоичная система счисления.

[Системы счисления с основаниями 2, 8, 10, 16 и способы перевода чисел из одной системы в другую изучить самостоятельно по файлу Системы счисления (для ЗФ 2014).doc].

Кодирование текстовой информации

Внутреннее представление символов в компьютере реализуется с помощью кодовой таблицы. Во всем мире в качестве стандарта принята таблица ASCII (American Standard Code for Information Interchange – Американский стандартный код для обмена информацией). Для хранения двоичного кода одного символа выделен 1 байт (8 бит). Учитывая, что каждый бит принимает значение 0 или 1, количество их возможных сочетаний в байте равно 28 = 256. Каждому символу ставится в соответствие уникальный десятичной код от 0 до 255. Коды от 0 до 32 – специальные (управляющие) клавиши; от 33 до 127 – цифры, знаки и буквы латинского алфавита; от 128 до 255 – символы национальных алфавитов.

В 1991 г. появился новый международный стандарт кодирования Unicode (Юникод), который отводит на символ не один, а два байта (кодировка MS Windows и Office c 1997 г.). Он позволяет представить знаки практически всех письменных языков (китайские иероглифы, математические символы, буквы греческого алфавита, латиницы и кириллицы и др.). Первая версия Юникода представляла собой кодировку с фиксированным размером символа в 16 бит, то есть общее число кодов было 216 (65 536). По мере изменения и пополнения таблицы символов почти каждый год появляется новая версия этой системы. Формы записи Юникода UTF-8 и UTF-32 позволяют кодировать до 231 (2 147 483 648) кодовых позиций, однако в версии 6.0 (2012 г.) используется чуть менее 110 000 кодовых позиций. Кодовое пространство разбито на 17 плоскостей по 216 (65 536) символов. Нулевая плоскость называется базовой, в ней расположены символы наиболее употребительных письменностей.

Во многих программах MS Windows, чтобы получить символ Unicode, нужно при нажатой клавише Alt набрать десятичное значение кода символа на цифровой клавиатуре. Например, полезными при наборе кириллических текстов будут комбинации Alt+0171 (открывающая кавычка), Alt+0187 (закрывающая кавычка) и Alt+0769 (знак ударения). Интересны также комбинации Alt+0133 (…) и Alt+0151 (—).

Кодирование графической информации

Графическая информация на экране монитора представляется в виде растрового изображения, которое формируется из определенного количества строк, содержащих определенное количество точек (пикселей). Каждому элементу присваивается значение его цвета, т. е. код цвета (красный, зеленый, синий).

Графическая информация на экране дисплея представляется в виде изображения, которое формируется из точек (пикселей). Если это только чёрные и белые точки, то каждую из них можно закодировать 1 битом. Но если изображение имеет оттенки, то два бита позволяют закодировать 4 оттенка точек: 00 – белый цвет, 01 – светло-серый, 10 – тёмно-серый, 11 – чёрный. Три бита позволяют закодировать 8 оттенков и т. д.

Количество бит, необходимое для кодирования одного оттенка цвета, называется глубиной цвета.

Цветные изображения могут иметь различные режимы: 16 цветов, 256 цветов, 65 536 (=216) цветов (high color), 16 777 216 (=224) цветов (color). На одну точку для режима high color необходимо 16 бит или 2 байта, для режима true color – 24 бита или 3 байта.

[Подробнее эта тема будет изучена в разделе «Компьютерная графика»].

Кодирование звуковой информации

Звук представляет собой звуковую волну с непрерывно меняющейся амплитудой и частотой. Чем больше амплитуда сигнала, тем он громче; чем больше частота сигнала, тем выше тон. Для того чтобы компьютер мог обрабатывать непрерывный звуковой сигнал, он должен быть превращен в последовательность импульсов (двоичных 0 и 1).

При двоичном кодировании аналогового звукового сигнала непрерывный сигнал дискретизируется, т. е. заменяется серией его отдельных выборок – отсчётов. Качество двоичного кодирования зависит от двух параметров: количества дискретных уровней сигнала и количества выборок в секунду. Количество выборок или частота дискретизации в аудиоадаптерах бывает различной: 11 кГц, 22 кГц, 44,1 кГц и др. Если количество уровней равно 65 536 (216), то на один звуковой сигнал рассчитано 16 бит. 16-разрядный аудиоадаптер точнее кодирует и воспроизводит звук, чем 8-разрядный.

Количество бит, необходимое для кодирования одного уровня звука, называется глубиной звука. Объём моноаудиофайла (в байтах) определяется по формуле:

При стереофоническом звучании объём аудиофайла удваивается, при квадрофоническом звучании – учетверяется.

Если человек говорит по восемь часов в день без перерыва, то за 70 лет жизни он наговорит около 10 гигабайт информации (это 5 миллионов страниц – стопка бумаги высотой 500 метров).

стр. 15из15