- •Глава 5. Организация интерфейса пользователя в информационных системах 72
- •Глава 1. Производство. Информация. Общество
- •1.1. Информатизация общества
- •1.2. Информационный характер процесса управления производством
- •1.3. Элементы субъекта управления и функции управления
- •1.4. Уровни управления и информация
- •1.5. Превращение информации в ресурс общества
- •Глава 2. Понятие информационной системы
- •2.1. Общая характеристика информационной системы
- •2.2. Классификация информационных систем
- •2.3. Хранение данных как важнейшая общая задача ис
- •Глава 3. Фактографические информационные системы
- •3.1. Основные понятия
- •3.2. Проектирование структуры данных3
- •3.3. Логическое проектирование структур данных
- •3.4. Физическое проектирование структур данных
- •3.4.1. Методы физического проектирования для реляционных моделей
- •3.4.1.1. Последовательная организация
- •3.4.1.2. Индексно-последовательная организация
- •3.4.1.3. Индексно-произвольная организация
- •3.4.1.4. Рандомизация
- •3.4.1.5. Цепь подобных записей
- •3.4.1.6. Инвертированные файлы
- •3.4.2. Методы физического проектирования для иерархических моделей
- •3.4.2.1. Множественные ссылки на порожденные записи
- •3.4.2.2. Ссылки на подобные и порожденные записи
- •3.4.2.3. Кольцевые структуры
- •3.4.2.4. Справочники
- •3.4.2.5. Битовые отображения
- •3.4.3. Методы физического проектирования для сетевых моделей
- •3.4.3.1. Множественные ссылки на порожденные записи
- •Кафедра должность
- •3.4.3.2. Ссылки на подобные и порожденные записи
- •3.4.3.3. Кольцевые структуры
- •Выполнение поисковых задач осуществляется аналогично иерархическим структурам.
- •3.4.3.5. Справочники
- •3.4.3.6. Битовые отображения
- •Глава 4. Документальные информационные системы
- •4.1. Методы организации хранения неструктурированных данных
- •4.1.1. Последовательные файлы
- •4.1.2. Цепочечные файлы
- •4.1.3. Инвертированные файлы
- •4.1.4. Кластерные файлы
- •4.2. Методы индексирования
- •4.2.1. Позиционные методы назначения весов
- •4.2.2. Статистические методы назначения весов
- •4.2.2.1. Частотные модели
- •4.2.2.2. Модель, учитывающая различительную силу термина
- •4.2.3. Динамический метод назначения весов
- •4.3. Кластеризация текстов
- •4.4. Поиск релевантных текстов
- •4.4.1. Поиск в инвертированных файлах
- •4.5.2. Поиск при кластерной организации хранения
- •4.5. Методы расширенного поиска
- •4.5.1. Построение словаря синонимов
- •4.5.2. Ассоциативное индексирование терминов
- •4.5.3. Вероятностное индексирование терминов
- •Глава 5. Организация интерфейса пользователя в информационных системах
- •5.1. Типы диалогов
- •5.2. Эргономичность интерфейса
- •Индивидуальные задания Реляционные модели
- •Деревья
- •Литература
Глава 3. Фактографические информационные системы
3.1. Основные понятия
Данный класс ИС использует для организации информационных массивов структурированные данные, в которых отражаются отдельные факты источника информации - предметной области.
Предметная область – это часть реального мира, которая представляется с помощью информационных массивов и использующих их приложений (программного обеспечения). Это может быть предприятие в целом, некоторая его функциональная часть или подразделение, процесс, система и т.д. Предметная область моделируется с использованием понятий информационных объектов, связей между ними и функций, выполняемых этими объектами или для них.
Информационный объект – это идентифицируемый (т.е. такой, который можно выделить в предметной области) объект реального мира, понятие, процесс или явление. В роли информационных объектов в зависимости от прикладных задач, которые должна решать ИС, могут выступать люди, изделия, счета и т.д.
Информационный объект описывается с помощью характеристик, существенных для модели. Каждая из характеристик определяется именем и значением.
Например, если ИС предназначена для учета успеваемости студентов вуза, то в качестве информационного объекта можно рассматривать студента как участника учебного процесса. Его характеристиками являются фамилия, телефон (для связи деканата), средняя оценка в сессию (для назначения стипендии) и т.д. Это – имена характеристик.
Если задаться конкретным студентом, то характеристики приобретают значения. Например (в порядке перечисления характеристик), Иванов, 123456, 4.
Совокупность имени и всех значений характеристики информационного объекта называется элементом данных.
Для нашего примера элементами данных являются (в каждой строке представлен элемент данных):
фамилия (Иванов);
телефон (123456);
средний балл (4).
Если студентов трое, элементы данных приобретут вид (каждая строка по-прежнему - элемент данных):
фамилия (Иванов; Федоров; Петров);
телефон (123456, 234567, 345678);
средний балл (4, 5, 4).
Подобные данные привычнее (и удобнее) представлять таблицей:
фамилия |
телефон |
средний балл |
Иванов |
123456 |
4 |
Федоров |
234567 |
5 |
Петров |
345678 |
4 |
Здесь элементом данных является каждый столбец, который, как должен подсказывать читателю его программистский опыт, является полем данных для соответствующего файла. Видно, что структура каждого столбца единообразна: есть заголовок – суть имя характеристики информационного объекта, а также имеется множество значений данной характеристики – под заголовком.
Запись об объекте – совокупность значений элементов данных, которые описывают конкретный экземпляр объекта.
Для нашего примера, представленного таблицей, запись об объекте – это одна из строк таблицы со значениями, например,
Иванов |
123456 |
4 |
Очевидно, совокупность записей об объекте представляется на машинном носителе файлом, играющим роль информационного массива для структурированных данных.
Для различения экземпляров объектов в файле (т.е. записей файла) применяется идентификатор – элемент данных (или совокупность элементов данных), используемый для определения записи (или нескольких записей). Идентификация может быть уникальной (или однозначной), когда идентификатору сопоставим один экземпляр объектов, и неуникальной (многозначной), когда идентификатору сопоставимо множество (возможно, одноэлементное) экземпляров объекта.
Так, в нашем примере поля «фамилия» и «телефон» могут служить однозначным идентификатором – каждое значение соответствующей характеристики определяет только одну запись. В то же время поле «средний балл» является примером многозначного идентификатора – одинаковые результаты сдачи сессии принадлежат разным студентам.