Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Ответики.doc
Скачиваний:
9
Добавлен:
26.08.2019
Размер:
865.28 Кб
Скачать

1 Определение ИС. Задачи и функции ИС. Состав и структура ИС, основные элементы, порядок функционирования. классификация ИС. Области применения и примеры реализации ИС.

ИНФ.СИСТ. – представляет собой систему, реализующую автоматизированный сбор, обработку и манипулирование данными и включающие технические средства обработки данных, программное обеспечение и обслуживающий персонал. Информационные системы предназначена для хранения, обработки, поиска, распространения, передачи и предоставления информации.

Система- любой объект, который одновременно рассматривается и как единое целое, и как объединенное в интересах достижения поставленной цели, совокупность разнородных элементов. В общем случае под системой следует понимать множество взаимосвязанных объектов или процессов, выполняющих определенные функции и приводящих к определенному результату.

Каждая система включает в себя след компоненты: - структура системы это множество элементов системы и взаимосвязи между ними, - функции каждого элемента системы, - вход и выход каждого элемента системы и системы в целом., - цепи и ограничения системы и ее отдельных элементов.

  • Данные сведения: - полученные путем измерения, наблюдения, логических или арифметических операций; и - представленные в форме, пригодной для постоянного хранения, передачи и (автоматизированной) обработки.

  • Информация

  • Знанияв широком смысле — совокупность понятий, теоретических построений и представлений. в узком смысле — признак определённого объёма информации, определяющий её статус и отделяющий от всей прочей информации по критерию способности к решению поставленной задачи.

  • Базы данных- структурированный организованный набор данных, описывающих характеристики каких-либо физических или виртуальных систем. (Поименованная совокупность структурированных данных предметной области).

  • База знаний— это особого рода база данных, разработанная для управления знаниями (метаданными), то есть сбором, хранением, поиском и выдачей знаний. Раздел искусственного интеллекта, изучающий базы знаний и методы работы со знаниями, называется инженерией знаний.

  • программное обеспечение - важнейшая составляющая информационных технологий, включающая компьютерные программы и данные, предназначенные для решения определённого круга задач и хранящиеся на машинных носителях. Программное обеспечение представляет собой либо данные для использования в других программах, либо алгоритм, реализованный в виде последовательности инструкций для процессора.

  • экспертные системы  — компьютерная программа, способная заменить специалиста-эксперта в разрешении проблемной ситуации. ЭС начали разрабатываться исследователями искусственного интеллекта в 1970-х годах, а в 1980-х получили коммерческое подкрепление.

  • локальные сетикомпьютерная сеть, покрывающая обычно относительно небольшую территорию или небольшую группу зданий

  • защита информации - совокупность методов и средств, обеспечивающих целостность, конфиденциальность, достоверность, аутентичность и доступность информации в условиях воздействия на нее угроз естественного или искусственного характера.

  • информационная безопасность — это состояние защищённости информационной среды, защита информации представляет собой деятельность по предотвращению утечки защищаемой информации, несанкционированных и непреднамеренных воздействий на защищаемую информацию, то есть процесс, направленный на достижение этого состояния.

Процессы, обеспечивающие работу информационной системы любого назначения, условно можно представить в виде схемы (рис. 1), состоящей из блоков:

   ввод информации из внешних или внутренних источников;

   обработка входной информации и представление ее в удобном виде;

   вывод информации для представления потребителям или передачи в другую систему;

  • обратная связь — это информация, переработанная людьми данной организации для коррекции входной информации.

Кроме того, отсутствие технических интерфейсов между подсистемами, обеспечивающими целостность информационного процесса, обуславливает необходимость использования людей для сопряжения подсистем. Поэтому «узким» местом информационных процессов становится «человеческий» фактор, поскольку упомянутые интерфейсы вынужденно осуществляются людьми.

Уникальность. Каждое состояние информационной системы уникально и требует при информационном обеспечении учета всех ее особенностей и, следовательно индивидуального применения различных воздействий.

Динамичность. Информационные системы с течением времени сменяют свою структуру и состояние элементов.

Распределенность означает пространственное расположение отдельных компонентов системы.

2 Предметная область документальных ИС. Информационно-поисковый язык, система индексирования, технология обработки данных, поисковый аппарат.         

Документальные системы, назначение, основной процесс функционирования.

Документальные системы служат для работы с документальными, написанными на словесном я зыке, наиболее распространенные информационно-поисковые системы.

ИПС – система, выполняющая функции: - хранение больших объемов информации; - быстрого поиска инф-ии; - модифицирования инф-ии; - вывода инф-ии в удобной форме.

  Документальные информационные системы предназначены для решения задач, не предусматривающих однозначного ответа на вопрос. Информация – документы написанные на словесном языке.

Главное назначение Документальных ИПС – обработка запросов, главная процедура- поиск, причем поиск идет не по самим документам, а по их поисковым образам(индивидуальный код документа), которые содержат информ-ии(адрес о местонахождении документов).

Поиск документов соответствует двум понятиям: - пертинентность - смысловое соответствие документа информационным потребностям пользователя, - релевантность – соответствие содержания документов информационному запросу, в том виде, как он сформулирован.

Для автоматического поиска, запросы на предоставление информации предоставляются в виде информационного предписания – поискового предписания, а документы в виде поискового образа документа.Пиоск информации предлагает сравнение смыслового содоржания запроса со смысловым содержанием хранящихся в ИПС документах. При наличии спец языка, который носит название ИПЯ(информационно-поисковый язык).

Осуществляется перевод содержания документов и/или запроса с естественного языка на ИПЯ(процесс индексирования текстов), в результате индексирования, полный текст документов(запросов) заменяется некоторой характеристикой, отражающей его смысловое содержание, эта характеристика носит название ПОД(поисковый образ документов) и/или ПОЗ(поисковый образ запросов) иногда ПОЗ называют поисковым предписанием. Осуществляется представление ПОД-ов и ПОЗ-ов в машинных кодах. Поиск информации(документов), содержание которых соответствует поисковым предписаниям. Эта операция осуществляется в соответствии с критерием смыслового соответствия поискового образа документа поисковому образу запроса. Выдача пользовательской инфо-ии. Корректировка запросов или поисковых предписаний. Процесс функционирования ИПС.

Документальные системы. Информационно-поисковые языки. Алфавит, лексика и грамматика ИПЯ.

ИпЯ : Эти языки применяются для смыслового описания текста, строится на базе естественных языков и отличаются четкими грамматическими правилами. Все языки ДПС делятся на: - классические, - дескрипторные.

В классических языках кроме простых понятий включены сложные(сочетания слов) при этом, каждое слово во фразе обозначает класс. Частным случаем таких языков является рубрикаторы, в которых слова – название тематических рубрик по уровням и иерархиям. Такая структура наз-ся классификатором, в нем сложены понятия, связанные между собой жесткими связями. Группа связанных классификаторов- систематизаторы. Классифицированные языки в инете и пс(rambler, Yohoo). Основными элементами ИПЯ является: алфавит – система знаков, используемях для записи слов и выражения, - лексика – словарный состав ИПЯ, в качестве лексической единицы могут быть использованы: слова, фрагмнты слов, словосочетания и выражения любого естественного язвка, коды и шифры(цифровые, буквенные, буквенно-цифровые) словосочетания слов и выражений, выступающих в роли имен соответствующих классов, шифры и коды в сочетании со словами, словосочетаниями и выражениями, - грамматика- правила составления выражений. Грамматика во многих ИПЯ формальна, а в некоторых вообще отсутствует. Существуют различные способы задания словесного состава ИПЯ: - перечислением вех лексических единиц, - перечислением частей лексических единиц и заданием правил формирования из них лексических единиц, слов и выражений.

Грамматика ИПЯ – совокупность средств и способов построения изменения и сочетания лексических едини, включает морфологию и синтаксис. Морфология – совокупность средств и способов построения слов. Синтаксис- совокупность средств и способов соединения слов в выражения и фразы.

Различают дескрипторные ИПЯ с грамматикой и без грамматики. Первые характеризуются наличием ряда жестких правил формирования синтаксических конструкций. Например, при использовании дескрипторного ИПЯ с позиционной грамматикой, в котором при описании действий принято на первом месте записывать наименование действия, далее субъекта, а затем объекта этого действия, фраза: "Иванов владеет автомобилем" может выглядеть так: "владеть Иванов автомобиль". В дескрипторных ИПЯ без грамматики такие правила отсутствуют, и порядок следования ЛЕ в поисковом образе документа или поисковом предписании не играет роли. Т.е. приведенный выше пример может быть одинаково представлен последовательностями "владеть Иванов автомобиль", "Иванов владеть автомобиль" и т.п.Кроме того, различают дескрипторные ИПЯ с контролируемой и со свободной лексикой. Лексический состав первых строго ограничен и зафиксирован в словаре ИПЯ, в то время как на лексический состав вторых не налагается никаких ограничений, и он может постоянно пополняться за счет включения новых ЛЕ.

Документальные системы. Системы индексирования.

Информационно-поисковый язык (ИПЯ) — искусственный язык, представляющий совокупность средств для описания формальной и содержательной структуры для поиска (путем индексирования) по запросу пользователя. Система индексирования представляет собой большое скопление информации (базу данных), приносимых в нее роботом-посетителем. Эта информация определенным образом структурируется и индексируется, чтобы впоследствии было легче выделить список сайтов по конкретным ключевым словам. Представление документа обычно конструируется на основе множества каких-либо его свойств (атрибутов). В простых системах текстового поиска эти атрибуты, как уже указывалось, вообще не являются какими-либо компонентами текста документа. В качестве атрибутов документа могут использоваться какие-либо внешние (по отношению к его тексту) характеристики, и совсем не обязательно, чтобы они идентифицировали документ уникальным образом. Можно, например, использовать регистрационный номер документа в архиве, дату его регистрации, название организации - получателя документа, указание места его хранения и прочее. В качестве таких внешних атрибутов документов могут также использоваться рубрики классификаторов документов или элементы метаданных Дублинского ядра (см. ниже). В системах контекстного полнотекстового поиска атрибуты представления документа - это термы, извлеченные из его текста - слова, словосочетания и т.п., или значения каких-либо специально подобранных функций, вычисленные на основе этих извлеченных термов. В любом случае ассоциированные с документом атрибуты, идентифицирующие документ и/или характеризующие его содержание, называются его индексирующими свойствами. На основе индексирующих свойств документов в системе текстового поиска строится вспомогательная структура данных, позволяющая по их значениям или по значениям некоторой функции, использующей их в качестве аргументов, эффективным образом (без полного просмотра текстов документов и без полного их перебора) обнаруживать в системных коллекциях документ или документы, которым эти атрибуты соответствуют, и при необходимости осуществлять быстрый доступ к ним. Такая вспомогательная структура данных называется индексом, а процесс назначения документу указанных атрибутов - индексированием документа. Заметим, что аналогичная техника индексирования используется в технологиях баз данных для обеспечения прямого доступа к данным в базе данных. В ранних системах текстового поиска использовалось простейшее представление документов, которое имело большую популярность благодаря его простоте, хотя и не могло обеспечить высокого качества поиска. В качестве такого представления служила совокупность слов или словосочетаний лексики предметной области системы, характеризующая содержание данного документа. Эти слова и словосочетания называются дескрипторами. Представление документа в дескрипторных системах называется поисковым образом документа. ИПС, в которых используется рассматриваемый подход, называются дескрипторными. Такие системы используются до настоящего времени. Индексирование документа в них сводится к назначению для него совокупности дескрипторов. Индексирование документов в системах текстового поиска может осуществляться на основе их названий, аннотаций или полного текста. Оно может производиться вручную авторами документов, экспертами в предметной области системы, подготавливающими документы к вводу в систему, или автоматически системными механизмами на основе анализа текста документа.Методы формирования представления и индексирования документов в современных развитых системах текстового поиска используют довольно трудоемкие вычислительные процедуры. Поэтому они могут быть реализованы только автоматически.

3 Фактографические ИС Понятие предметной области, информационный объект ПО. Понятие сущности. Реализация сущности. Целостность данных.

Фактографические ИС, определение, назначение. Понятие предметной области (ПО). Объекты ПО.

Фактографическая информационно-поисковая система - информационно-поисковая система, обеспечивающая выдачу непосредственно фактических сведений, затребованных потребителем в информационном запросе. Поисковый массив фактографической ИПС состоит из описаний фактов, извлеченных из документов и представленных на некотором формальном языке.

В фотографических информационных системах регистрируются факты – конкретные значения данных об объектах реального мира, объектом может быть человек, предмет, событие о котором записаны данные. Объект – (единичная реализация сущности) – часть мира, выделяемое как единое целое в течение некоторого отрезка времени.

Объекты могут быть материальными или абстрактными. Материальные объекты могут быть естественными(животными и т.п) и созданные человеком(аэропорт, здания). Абстрактные объекты(муз сочинения, стихи, законы) обычно создаются человеком. Информация с которой работает ФИС имеет четкую структуру, позволяющую ПК или ЭВМ отличать одно данное от другого. Предметная облась ФИС – информационная база с жестко структурированной информацией, основные средства работы с данными – языки описания и манипулирования данными.

Предметная область ФИС. Каждая информационная система, соотносится с конкретной частью реального мира, которая ориентирована на выполнение определенной функции. Та часть реального мира, информация о которой подлежит хранению в информационной системе называется предметной областью ИС. Предметная область может относиться к любому типу организации(банк, вуз, магазин).различа.т полную и организационную единицу предметной области. Организационная единица по некоторой предметной области может представлять собой свою предметную область. Например: факультет- кафедра: группа, преподы. Информацию о некоторой предметной области можно представить с помощью набора объектов, при этом эти объекты должны носить целостный характер и обладать конечным набором свойств. Совокупность объектов, о которых можно задавать вопросы, образует объективное ядро предметной области(студент,аудитория, слова).

Информационный объект(ИО) – информационное отображение реальных объектов, явлений, процессов, событий о которых должна быть предоставлена информация(данные) в информационной системе.

Понятие сущности, свойства сущности. Реализация сущности. Целостность данных.

Сущность – класс относительных объектов, информация о которых должна быть учтена в модели. Сущность (entity) - это "предмет" рассматриваемой предметной области, который может быть идентифицирован некоторым способом, отличающим его от других "предметов". Конкретные человек, компания или событие являются примерами сущности. Синоним сущности – ИС

Сущность – любой конкретный или абстрактный объект в рассматриваемой предметной области. Сущности – это базовые типы информации, которые хранятся в БД (в реляционной БД каждой сущности назначается таблица). Экземпляр сущности и тип сущности - это разные понятия. Понятие тип сущности относится к набору однородных личностей, предметов или событий, выступающих как целое (например, студент, клиент и т.д.). Экземпляр сущности относится, например, к конкретной личности в наборе. Типом сущности может быть студент, а экземпляром – Петров, Сидоров и т. д

Та часть реального мира, информация о котором подлежит хранению в ИС наз. предметной областью.

Свойства сущности (Entity Properties) — отбор определений, характеризующих её текущее состояние. Каждый объект (сущность) в конкретный момент времени характеризуется определенным состоянием, это состояние описывается с помощью ограниченного набора свойств и связи (отношений) с др. объектами. Свойства объекта в виде данных можно запоминать и хранить в ИС.

Атрибут есть свойство сущности. Например, атрибутами,

Которые могут быть свойствами сущности преподаватель, являются: фамилия,

звание, должность.

Атрибут, или набор атрибутов, используемый для идентификации

экземпляра сущности, называется ключом сущности.

Атрибут – это свойство сущности в предметной области. Его наименование должно быть уникальным для конкретного типа сущности. Например, для сущности студент могут быть использованы следующие атрибуты: фамилия, имя, отчество, дата и место рождения, паспортные данные и т.д. В реляционной БД атрибуты хранятся в полях таблиц.