Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
SAOD..doc
Скачиваний:
142
Добавлен:
11.05.2015
Размер:
959.49 Кб
Скачать

1.4 Представление информации об объектах

Для любого объекта существует некоторая совокупность информации, которую можно назвать записью. Отдельные атрибуты образуют поля записи. Совокупность записей об объектах называют набором данных или файлом.

С точки зрения программиста объекту ПО соответствует тип записи. Отдельные атрибуты образуют поля записи.

Между этими категориями существует следующая связь:

  • файл соответствует объекту;

  • число экземпляров объекта равно числу записей в файле;

  • число атрибутов, описывающих объект, равно числу полей в каждой записи. Каждому полю соответствует имя поля. Поле записи имеет свое значение поля. Значение (содержимое)

поля описывает атрибут.

Реальный мир

анные

Элемент данных (поле)

t

Значение элемента данных

Информация

Атрибуты

Г

Значение атрибута

Атрибуты вес рост

фамилия дата рождения.

Объект

Предметная область

Рис. 1

Имя поля Таблица 1

ФИО

Пол

Дата рождения

Вес

Рост

1

Иванов П.И.

м

17.6.75

68

175

2

Петров И.С.

м

8.9.80

75

180

/

Поле атрибутов

1.5 Абстрактные алфавиты. Кодирование

Цифровая информация – это в действительности частный случай т.н. алфавитного способа представления дискретной информации. Основа этого способа – произвольный фиксированный конечный набор символов любой природы, называемый абстрактным алфавитом или просто алфавитом.

Совокупность десятичных цифр вместе с запятой для отделения дробной части числа есть частный случай алфавита с 11 символами – буквами этого алфавита. Другой пример – алфавит естественного человеческого языка (например, русского). Язык математических и др. научных текстов может включать наряду с обычными буквами данного языка буквы других языков (например, греческого), а также различные специальные символы (знаки арифметических операций и т.д.).

При обработке информации часто возникает необходимость представлять средствами одного алфавита бу­квы других алфавитов. Такое представление называется кодированием.

Проблема решается просто, если нужно закодировать буквы алфавита Х с меньшим числом букв, чем у кодирующего алфавита У.

Например, Х – цифры, У – русские буквы. Тогда для кодирования достаточно положить 0 = а, 1 = б, 2 = в, …, 8 = и.

Разумеется, возможны и др. способы кодирования (буквы Х кодируются несколькими буквами У: ноль, один, два и т.д.).

В том случае, когда в Х больше букв, чем в У, обязательно приходится использовать для кодирования по­следовательности букв. Так, например, буквы русского алфавита можно закодировать парами десятичных цифр:

а = 01, б = 02, …, к = 10, л = 11, …

Число представляемых алфавитом символов называется мощностью данного алфавита.

Двоичный алфавит

Простейшим абстрактным алфавитом, достаточным для кодирования любого другого алфавита, является алфавит, состоящий из двух букв. Такой алфавит называется двоичным, а его буквы чаще всего обозначают как 0 и 1. Или:

true

false

Да

Нет

Y

N

Величина, способная принимать лишь два различных значения, представляет собой своеобразный инфор­мационный атом, получивший специальное название бит (binary unit).

Все современные ЭВМ построены на элементах, имеющих два устойчивых состояния. Поэтому основой кодирования данных в ЭВМ является двоичный алфавит.

Байтовый алфавит

Двоичный алфавит из-за своей простоты наиболее широко распространен в технических информационных устройствах, в первую очередь, в ЭВМ. Для кодирования же алфавитов, которыми привык пользоваться чело­век, употребляются последовательности двоичных цифр. Легко видеть, что последовательностями из n двоич­ных цифр можно закодировать N=2n различных символов. При n = 8 N = 256. Этого вполне достаточно для ко­дирования большинства встречающихся на практике алфавитов (кроме иероглифического письма).

В связи с этим последовательность из 8 двоичных цифр получила название байт. Составляемый же раз­личными последовательностями алфавит из 256 букв называется байтовым алфавитом.

Память всех современных ЭВМ построена по байтовому принципу. Байт - наименьший адресуемый эле­мент памяти. Оперативная память ЭВМ физически состоит из 8-разрядных ячеек (байтов). Каждая ячейка име­ет порядковый номер – адрес.

В мировой практике укоренился единый стандарт байтового кодирования строчных и прописных букв ла­тинского и русского алфавитов, знаков препинания, десятичных цифр и т.д.

Стандартные коды: ASCII – American Standard Code for Information Interchange

EBCDIC – Expanded Binary Coded Decimal Interchange Code (ДКОИ)

Контрольные вопросы

  1. Непрерывная и дискретная информация.

  2. Данные и ЭВМ.

  3. Объекты предметной области.

  4. Представление информации об объектах.

  5. Абстрактные алфавиты. Кодирование.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]