- •О.М. Топоркова информационные технологии и системы
- •Введение
- •Глава 1. Производство. Информация. Общество
- •1.1. Информационный характер процесса управления
- •1.2. Элементы субъекта управления и функции управления
- •1.3. Уровни управления и информация
- •1.4. Превращение информации в ресурс общества
- •Глава 2. Структура информационного процесса
- •2.1. Формирование данных
- •2.2. Передача данных
- •2.3. Обработка данных
- •2.4. Хранение данных
- •2.4.1. Оценка данных
- •2.4.2. Защита данных
- •2.4.2.1. Замки и ключи
- •2.4.2.2. Таблицы управления доступом
- •2.4.2.3. Протоколирование и аудит
- •2.4.2.4. Экранирование
- •2.4.2.5. Криптография
- •2.4.2.6. Обеспечение достоверности данных
- •2.4.2.7. Управление параллелизмом
- •2.4.2.8. Восстановление данных
- •Глава 3. Знания как вид информационного ресурса4
- •3.1. Виды знаний
- •3.2. Теоретические аспекты извлечения знаний
- •3.2.1. Психологический аспект
- •3.2.1.1. Контактный слой
- •3.2.1.2. Процедурный слой
- •3.2.1.3. Когнитивный слой
- •3.2.2. Лингвистический аспект
- •3.2.2.1.Общий код
- •3.2.2.2. Понятийная структура
- •3.2.2.3. Словарь пользователя
- •3.2.3. Гносеологический аспект
- •3.3. Методы извлечения знаний
- •3.3.1. Пассивные методы
- •3.3.1.1. Наблюдения
- •3.3.1.2. Мысли вслух
- •3.3.1.3. Лекции
- •3.3.2. Активные методы
- •3.3.2.1. Анкетирование
- •3.3.2.2. Интервью
- •3.3.2.3. Свободный диалог
- •3.3.2.4. Деловые игры
- •3.3.2.5. Круглый стол
- •3.3.2.6. Мозговой штурм
- •3.3.3. Текстологические методы
- •Глава 4. Понятия информационной технологии и информационной системы
- •4.1. Понятие и эволюция информационной технологии в производстве
- •4.2. Характеристика информационной технологии как системы
- •4.3. Структура базовой информационной технологии
- •4.3.1. Концептуальный уровень базовой информационной технологии
- •4.3.2. Логический уровень базовой информационной технологии
- •4.3.3. Физический уровень базовой информационной технологии
- •4.4. Понятие и эволюция информационных систем
- •4.5. Классификация информационных систем
- •Глава 5. Новые информационные технологии
- •5.1. Представление знаний в компьютере
- •5.1.1. Продукционная модель
- •5.1.2. Сетевая модель
- •Полная семья
- •5.1.3. Фреймовая модель
- •5.1.4. Логическая модель
- •5.2. Интеллектуальные информационно-поисковые системы
- •5.2.1. Морфологический анализ
- •5.2.2. Синтаксический анализ
- •5.2.3. Семантический анализ
- •5.3. Расчетно-логические системы
- •5.4. Экспертные системы
- •Глава 6. Организация интерфейса пользователя в информационных технологиях и системах
- •6.1. Типы диалогов
- •6.2. Эргономичность интерфейса
- •Глава 7. Современные тенденции в области информационных технологий и систем
- •7.1. Км-технологии9
- •7.2. Cals-технологии
- •7.3. Erp-технологии
- •7.4. Scm-технологии
- •7.5. Crm-технологии
- •7.6. WorkFlow-технологии
- •7.7. Ит-стратегия предприятия
- •7.7.1. Источники экономической эффективности
- •7.7.2. Выбор системы и команды внедрения
- •7.7.3. Внедрение системы
- •7.8. Itil-технологии
- •7.9. Отечественный рынок решений в области информационных технологий
- •7.9.1. Renaissance
- •7.9.2. Axapta
- •7.9.3. Шереметьево-Карго
- •7.9.4. Eli Lilly
- •Список литературы
- •Оглавление
Глава 5. Новые информационные технологии
Как отмечалось ранее, новые информационные технологии связаны с использованием знаний.
5.1. Представление знаний в компьютере
Информация, с которой имеют дело компьютеры, разделяется на процедурную и декларативную. Процедурная информация выражена в программах, которые выполняются в процессе решения задач, декларативная - в данных, с которыми эти программы работают. В любом случае во внутреннем формате, т.е. на физическом уровне, и программы, и данные представлены в двоичной системе счисления. Это соответствует принципу двоичной системы счисления, введенному в проекте Принстонской машины. Тем не менее, в современной информатике разделяют знания и данные, когда говорят о декларативной информации (объединим знания и данные в понятие информационной единицы). Отличия знаний от данных заключаются в следующих свойствах знаний:
внутренняя интерпретируемость. Каждая информационная единица должна иметь уникальное имя, по которому ее находит некоторая процедура обработки или которое использует в запросах пользователь. При переходе к знаниям в память ЭВМ вводится информация о некоторой протоструктуре информационных единиц. В ней указано, в каких элементах памяти компьютера хранятся сведения о конкретных данных, характеризующих предметную область, например, о фамилиях, номерах зачетных книжек. При этом должны быть заданы специальные словари, в которых перечислены имеющиеся в памяти системы данные. Все эти атрибуты могут играть роль имен данных, по которым можно осуществлять поиск нужной информации. В настоящее время СУБД обеспечивают реализацию внутренней интерпретируемости всех информационных единиц, хранящихся в базе данных: имена столбцов являются атрибутами отношений, имена которых указаны в строках. Вместе с информационной единицей в ЭВМ также хранится система имен, принятая для нее в той или иной предметной области. Это позволяет ЭВМ «знать» что хранится в ее памяти и уметь отвечать на вопросы;
структурированность (внутренняя связь). Это свойство можно рассматривать как свойство декомпозиции сложных объектов на более простые и установления связей между простыми объектами. Для этого используются иерархические отношения: «род-вид», «класс-подкласс», «часть-целое» и т.п. Отношения этого вида встречаются в иерархических, сетевых, а также и в табличных (реляционных) структурах данных.
Например, для учебного процесса имеет место следующая структура учебной нагрузки студента (рисунок 5.1):
Учебная нагрузка
аудиторная неаудиторная
упражнения лекции лабораторные семинары курсовое самостоятельная
занятия проектирование работа
Рисунок 5.1 – Структура понятия «Учебная нагрузка»
связность. Знания отражают закономерности относительно фактов, процессов, явлений и причинно-следственные связи между ними. Семантика этих закономерностей может носить декларативный или процедурный характер. Это свойство практически не имеет аналогов в структурах данных.
Например, две или более информационные единицы могут быть связаны отношением "одновременно", две информационные единицы - отношением "причина - следствие" или отношением "быть рядом". Приведенные отношения характеризуют декларативные знания. Если между двумя информационными единицами установлено отношение "аргумент - функция", то оно характеризует процедурное знание, связанное с вычислением определенных функций. Между информационными единицами могут устанавливаться и иные связи, например, определяющие порядок выбора информационных единиц из памяти или указывающие на то, что две информационные единицы несовместимы друг с другом в одном описании.
наличие семантического пространства с метрикой (шкалирование пространства или семантическая метрика). На множестве информационных единиц в некоторых случаях полезно задавать отношение, характеризующее ситуационную близость информационных единиц, т.е. силу ассоциативной связи между информационными единицами. Такое отношение, называемое отношением релевантности, дает возможность выделять в информационной базе некоторые типовые ситуации (например, "экзамен", "учебное занятие"). Отношение релевантности при работе с информационными единицами позволяет находить знания, близкие к уже найденным.
Для фиксации соотношений различных данных используют шкалы. Типичными являются:
метрические – простейшие. С их помощью устанавливаются количественные соотношения и порядок данных. Например, шкала оценок:
1 2 3 4 5
размытые порядковые. Например, шкала оценки качества учебы студента включает следующие качественные оценки, которые называются лингвистическими переменными:
плохо слабо удовлетворительно хорошо отлично превосходно
Бывает важным связать метрические и размытые порядковые шкалы (говорят – определить значения лингвистических переменных на терм-множествах). Для этого поступают одним из способов:
порядковую шкалу равномерно разбивают на столько делений, сколько их у метрической шкалы, и устанавливают взаимно-однозначное соответствие между ними;
привлекают экспертов для разбиения порядковой шкалы на деления и для установления отношения соответствия между метрической и порядковой шкалами;
используют функцию принадлежности , которая вводится в теории нечетких множеств, для связывания двух шкал. Тогда, например,отлично(5) = 1,отлично(4) = 0,3;
активность. С момента появления ЭВМ и разделения используемых в ней информационных единиц на данные и команды создалась ситуация, при которой данные пассивны, а команды активны. Все процессы, протекающие в ЭВМ, инициируются командами, а данные используются этими командами лишь в случае необходимости. При работе со знаниями эта ситуация не приемлема. Как и у человека, в знаниях актуализации тех или иных действий способствуют другие знания, имеющиеся в системе. Таким образом, выполнение программ должно инициироваться текущим состоянием информационной базы. Появление в базе фактов или описаний событий, установление связей может стать источником активности системы. Те или иные процедуры должны активизироваться из-за возникновения некоторой ситуации в данных.
Например, появление в БД факта о том, что студент Х получил двойку по экзамену Y должно вызывать процедуру подготовки приказа на его отчисление.
Существуют два типа методов представления знаний в компьютере: формальные и неформальные (семантические, реляционные) модели.
В отличие от формальных моделей, в основе которых лежит строгая математическая теория, неформальные модели такой теории не придерживаются. Каждая неформальная модель годится только для конкретной предметной области и поэтому не обладает универсальностью, которая присуща моделям формальным. Получение новых знаний (логический вывод) в формальных системах строг и корректен, поскольку подчинен жестким аксиоматическим правилам. Вывод в неформальных системах во многом определяется самим исследователем, который и отвечает за его корректность. Каждому из методов представления знаний соответствует свой способ описания знаний: продукционная модель, сетевая модель, фреймовая модель, логическая модель.