Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Теория информации - курс лекций.doc
Скачиваний:
435
Добавлен:
13.03.2015
Размер:
4.65 Mб
Скачать

Лекция 15. Классификация данных. Представление данных в памяти компьютера

  1. Классификация данных

  2. Представление элементарных данных в ОЗУ

1. Классификация данных

Как было отмечено ранее, параллельно с термином «информация» при описании информационных процессов часто используется термин «данные». Определим его следующим образом:

Данные – это сведения, характеризующие какую-то систему, явление, процесс или объект, представленные в определенной форме и предназначенные для дальнейшего использования.

К данному определению необходимо сделать следующие замечания, разъясняющие соотношение между понятиями «информация» и «данные»:

  • Данныеэто конкретная форма представления информации(например, информацию о результатах наблюдений за температурой окружающей среды можно представить в виде числового массива (таблицы), но можно и в виде графика, и в виде текстового описания);

  • В отличие от ненаправленной (неадресной) информации, существующей в природе независимо от нас и наших потребностей в ней, данными называется только такая информация, которая имеет значение для потребителя и, следовательно, предусматривается ее использование для решения каких-либо задач.

При решении практических задач с помощью технических устройств формы представления информации всегда конкретны, в этой информации кто-то заинтересован, и поэтому употребление термина «данные» вполне оправдано.

Содержание понятия «данные» весьма обширно. Оно охватывает как какую-то отдельную величину, например год рождения человека, так и показания какого-либо датчика или производственные сведения фирмы. В компьютерных системах любая информация, представленная в допустимой для компьютера форме – тексты, рисунки, музыка и др. – считается данными. В информатике к данным относятся также тексты программ.

Данные имеют несколько классификационных признаков: данные бывают различных типов, делятся на простые и структурированные, подразделяются на переменные и постоянные, могут являться входными, промежуточными и выходными.

Ниже рассмотрим подробнее каждый из перечисленных классификационных признаков.

Тип данныхопределяет:

  • Набор их допустимых значений;

  • Правила их обработки (преобразования);

  • Порядок их размещения в памяти компьютера при хранении;

  • Порядок доступа к ним (обращения и извлечения с места хранения);

Допустимый набор типов данных и их особенности определяются программной системой или языком программирования, на котором система написана. При этом возможности различных языков по разнообразию допустимых типов данных, а также по построению новых типов данных различаются весьма сильно. Ясно, что чем более широкой и гибкой оказывается типизация данных в языке программирования, тем больше возможностей предоставляется пользователю при решении задач оптимального представления, хранения и применения данных. Типизация данных влияет и на компактность самой исполняемой программы.

Следующим классификационным признаком является деление даных на элементарные (простые) и структурированные (сложные). К элементарным данным относятся символы, числа (целые и вещественные) и логические данные. Общей и обязательной особенностью одиночных данных является то, что каждое из них имеетодно значениеисобственное имя.Значение – это содержимое тех ячеек памяти, где данное располагается.Имя (его называют также идентификатор) – это обозначение данного в тексте программы. Правила построения идентификаторов элементарных данных определяются языком программирования.

Из элементарных данных строятся структурированные данные.

Структурированные данные – это информационный массив, включающий в себя элементарные данные и связи между ними.

Структура данных – это перечень объединяемых элементарных данных, их характеристики и особенности связей между ними.

Одним из примеров структурированных данных является телефонный справочник.

Перечень допустимых структур данных определяется языком программирования или прикладной программой. Этот перечень может быть фиксированным (нерасширяемым), как в языке BASICили прикладных программах без встроенных возможностей программирования. В развитых языках программирования (PASCAL,Cи др.) и ряде прикладных программ наряду с зарезервированными типами структур данных допускается создание новых типов; при этом элементами структуры могут быть сложные (структурированные) данные.

Сложные (структурированные) данные, как и элементарные, имеют значенияиидентификаторы (имена). Значения размещаются в ячейках памяти по определенным схемам. Правила построения идентификатора устанавливаются языком программирования или прикладной программой. Исключение составляют правила формирования имен файлов – эти правила задаются операционной системой и должны соблюдаться всеми работающими в ней программами и языками программирования. Например, вMS-DOSв качестве имен файлов допустимы комбинации из латинских букв, цифр и некоторых специальных символов общей длиной не более 8 знаков; вWindows-95 (и выше) разрешены имена файлов длиной до 255 знаков.

По возможности изменения значений данных (как простых, так и структурированных) при их обработке данные подразделяют на переменные и постоянные (константы). Из названия очевидно, что переменные могут изменять свое значение в ходе исполнения программы, а константы – нет. На уровне операционной системы различие между переменными и постоянными величинами отсутствует, поэтому у них одинаковый порядок размещения в памяти и доступа к ним. Различие между переменными и константами подчеркивается в языках программирования и в созданных с их помощью прикладных программах.

В зависимости от того, на каком этапе обработки информации данные используются, они подразделяются на входные,промежуточныеивыходные.

Входные данные– это данные, необходимые для исполнения программы и вводимые в компьютер до начала работы или в процессе работы программы. Входные данные могут быть предварительно записаны на некотором носителе и вводиться в компьютер с него, поступать по линиям связи от каких-либо датчиков или с других компьютеров, вводиться пользователем программы.

Промежуточные данные– это данные, формирующиеся в ходе исполнения программы; чаще всего они пользователю недоступны, не отображаются на устройствах вывода, но существуют в памяти компьютера. Идентификаторы промежуточным данным присваивают разработчики программы или задает сама программа по заложенным в нее правилам.

Выходные данные– это данные, являющиеся результатам работы программы, ради них и производится обработка входных данных. Выходные данные, предназначенные для человека, представляются в удобной для него форме (тексты, рисунки, звуки); при хранении выходных данных на носителях или при передаче их по сетям сохраняется двоичный компьютерный формат их представления. Таким образом, работу программы можно рассматривать как действия по преобразованию входных данных в выходные через необходимые для этого промежуточные.

С точки зрения самой программы все эти виды данных – входные , промежуточные, выходные – равноправны, то есть обрабатываются только в соответствии с их типом, а не в соответствии с функциональным назначением.

Представление данных при их хранении и обработке требует решения трех основных задач:

  • Определить способы представления элементарных данных;

  • Определить способы объединения данных в структуры;

  • Установить способы размещения (при хранении) информации на материальном носителе.

Выделяют три уровня представления данныхконцептуальный,логическийифизический.

На концептуальном уровнеопределяется общая структура информационного массива; эта структура называетсямоделью данных. Известны и используются несколько моделей данных:иерархическая, сетевая, реляционная, объектно-ориентированная. В соответствии с выбранной моделью данных строится информационная система, в которой данные будут храниться, а также строятся программы, ведущие обработку данных (манипулирование данными).

Логический уровеньопределяет способы представления элементарных данных, их перечень при объединении их в структуру, а также связи между ними в рамках выбранной модели данных.

Физический уровеньопределяет форматы размещения созданной логической структуры данных на материальных носителях информации (бумаге, магнитных или оптиеских дисках, в микросхемах памяти и так далее).