Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Меры информации и качество информации

.docx
Скачиваний:
13
Добавлен:
17.04.2015
Размер:
22.13 Кб
Скачать

Меры информации семантического уровня

Под семантической информацией понимают смысловое содержание, извлекаемое получателем из сообщения. Общепринятой количественной меры для его измерения в настоящее время не существует. Наибольшее распространение получил тезаурусный подход, когда содержащийся в принятом сообщении смысл оценивается путем соотнесения с тезаурусом получателя, его способностью понимать и принимать поступившее сообщение.

Тезаурус – в широком смысле - совокупность сведений, которыми располагает пользователь (система), в более узком – запас знаний в виде словаря, отражающего семантические связи между словами и другими смысловыми элементами данного языка.

Относительной мерой количества семантической информации может служить коэффициент содержательности С, который определяется как отношение количества семантической информации к ее объему:

Меры информации прагматического уровня

Эта мера определяет полезность (ценность) информации для достижения пользователем поставленной цели – это также величина относительная. Российский ученый А. А. Харкевич предложил принять за меру ценности информации количество информации, необходимое для достижения поставленной цели, т.е. рассчитывать приращение вероятности достижения цели.

Качество информации

Эффективность применения и качество функционирования любых систем в значительной степени определяется качеством информации, на основе которой принимаются управляющие решения.

Качество информации – совокупность свойств информации, характеризующих степень соответствия потребностям (целям, ценностям) пользователей (средств автоматизации, персонала).

Основными потребительскими показателями качества являются:

  • Содержательность информации - совокупность сведений о конкретном объекте или процессе, содержащаяся в сообщениях и воспринимаемая получателем. Используется, как правило, для выработки и принятия управляющего воздействия.

  • Полнота. Информацию можно считать полной, когда она содержит минимальный, но достаточный для принятия правильного решения набор показателей. Как неполная, так и избыточная информация снижает эффективность принимаемых на основании информации решений.

  • Доступность информации – обеспечивается выполнением соответствующих процедур ее получения и преобразования.

  • Актуальность информации – определяется степенью сохранения ценности информации для управления в момент ее использования.

  • Своевременность – означает ее поступление не позже заранее назначенного момента времени.

  • Точность – определяется степенью близости получаемой информации к реальному состоянию объекта, процесса, явления.

  • Достоверность – свойство информации отражать реально существующие объекты с необходимой точностью.

  • Устойчивость информации отражает ее способность реагировать на изменения исходных данных без нарушения необходимой точности.

Указанные параметры качества информации целиком определяются на методическом уровне разработки информационных систем.

Двоичное кодирование информации

Компьютер может обрабатывать числовую, текстовую, графическую, звуковую и видеоинформации. Все эти виды информации кодируются в последовательности электрических импульсов: есть импульс (1), нет импульса (0), т.е. в последовательности 0 и 1. Такое кодирование информации в компьютере называется двоичным кодированием, а логические последовательности нулей и единиц – машинным языком.

  1. Двоичное кодирование числовой информации: числовую информацию компьютер обрабатывает в двоичной системе счисления. Числа в компьютере представлены в виде последовательностей 0 и 1 или битов.

  2. Двоичное кодирование текстовой информации: каждому символу ставится в соответствие своя уникальная последовательность из восьми нулей и единиц, свой уникальный двоичный код от 00000000 до 11111111 (десятичный код от 0 до 255, можно закодировать 256 символов), т.е. для кодирования одного символа требуется 1 байт информации (8 битов). Первые 33 кода с 0 по 32 соответствуют операциям (перевод строки, пробел…) Коды с 33 по 127 являются интернациональными и соответствуют символам латинского алфавита, цифрам, знакам арифметических операций и знакам препинания. Коды с 128 по 255 являются национальными. Определение числового кода символа: Вставка, символ (в диалоговом окне в нижней части экрана).

  3. Двоичное кодирование графической информации: наиболее распространенные методы представления изображений можно разделить на 2 большие категории:

  1. Растровые методы: изображение представляется как совокупность точек, называемых пикселями (это элемент изображения). Растровое кодирование позволяет использовать двоичный код для представления графических данных. Растровые редакторы (Adobe Photoshop) применяются в тех случаях, когда графические объекты представлены в виде комбинации точек, обладающих свойствами яркости и цвета. Такой подход эффективен, если изображение имеет много полутонов и информация о цвете важнее, чем информация о форме объекта. Это характерно для фотографических изображений, поэтому редакторы используются для ретуширования изображений, создания фотоэффектов, художественных композиций.

  2. Векторные методы: позволяют избежать проблем масштабирования, характерных для растрового метода. Здесь изображения представляются в виде совокупности линий и кривых. С помощью подобной технологии описываются различные шрифты. Характерен для чертежно-графических работ, где форма имеет преобладающее значение (Corel Draw, шрифт Word).

  1. Двоичное кодирование звуковой информации: звуковой сигнал – это непрерывная волна с изменяющейся амплитудой и частотой. Чем больше амплитуда сигнала, тем он громче для человека; чем больше частота сигнала, тем выше тон. Для того чтобы компьютер мог обрабатывать непрерывный звуковой сигнал, он должен быть превращен в последовательность электрических импульсов (двоичных нулей и единиц). С помощью специальных программных средств (редакторов аудиофайлов) открываются широкие возможности по созданию, редактированию и прослушиванию звуковых файлов. Создаются программы распознавания речи и появляется возможность управления компьютером при помощи голоса.

  2. Представление видеоинформации. В последнее время компьютер все чаще используется для работы с видеоинформацией. Простейшей такой работой является просмотр кинофильмов и видеоклипов. Следует четко представлять, что обработка видеоинформации требует очень высокого быстродействия компьютерной системы.

Что представляет собой фильм с точки зрения информатики? Прежде всего, это сочетание звуковой и графической информации. Кроме того, для создания на экране эффекта движения используется дискретная по своей сути технология быстрой смены статических картинок. Исследования показали, что если за одну секунду сменяется более 10-12 кадров, то человеческий глаз воспринимает изменения на них как непрерывные.

Существует множество различных форматов представления видеоданных. В среде Windows, например, уже боле 10 лет (начиная с версии 3.1) применятся формат Video for Windows, базирующийся на универсальных файлах с расширением AVI (Audio Video Interleave - чередование аудио и видео).

Большое распространение получила технология под названием DivX (происходит от сокращения слова Digital Video Express). Благодаря DivX удалось достигнуть степени сжатия, позволившей вместить качественную запись полнометражного фильма на один компакт диск - сжать 4,7 Гб DVD-фильма до 650 Мб.