Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
58.doc
Скачиваний:
3
Добавлен:
22.04.2019
Размер:
68.61 Кб
Скачать

58 Единая форма представления информации – основа появления и развития новейших информационных технологий.

Информационные технологии (ИТ, от англ. information technology, IT) — это класс областей деятельности, относящихся к технологиям управления и обработкой огромного потока информации с применением вычислительной техники.

Согласно определению, принятому ЮНЕСКО, Информационные Технологии (ИТ) — это комплекс взаимосвязанных научных, технологических, инженерных наук, изучающих методы эффективной организации труда людей, занятых обработкой и хранением информации с помощью вычислительной техники и методы организации и взаимодействия с людьми и производственным оборудованием, их практические применение, а также связанные со всем этим социальные, экономические и культурные проблемы.Основные черты современных ИТ:  -компьютерная обработка информации;  -хранение больших объёмов информации на машинных носителях;  -передача информации на любые расстояния в кротчайшие сроки. Современное материальное производство и другие сферы деятельности все больше нуждаются в информационном обслуживании, переработке огромного количества информа­ции. Универсальным техническим средством обработки любой информации является ком­пьютер, который играет роль усилителя интеллектуальных возможностей человека и общества в целом, а коммуникационные средства, использующие компьютеры, служат для связи и передачи информации. Появление и развитие компьютеров — это необходимая со­ставляющая процесса информатизации общества.  Информатизация на базе внедрения компьютерных и телекоммуникационных технологий является реакцией общества на потребность в существенном увеличении производи­тельности труда в информационном секторе общественного производства, где сосредоточено более половины трудоспособного населения. Так, например, в информаци­онной сфере США занято более 60% трудоспособного населения, в СНГ — около 40%.[1]  Современные информационные технологии   

Современные информационные технологии с их стремительно растущим потенциалом и быстро снижающимися издержками открывают большие возможности для новых форм организации труда и занятости в рамках как отдельных корпораций, так и общества в целом. Спектр таких возможностей значительно расширяется - нововведения воздействуют на все сферы жизни людей, семью, образование, работу, географические границы человеческих общностей и т. д. Сегодня информационные технологии могут внести решающий вклад в укрепление взаимосвязи между ростом производительности труда, объемов производства, инвестиций и занятости. Новые виды услуг, распространяющиеся по сетям, в состоянии создать немало рабочих мест, что подтверждает практика последних лет. 

70 Адресный и семантический поиск. Основное различие.

Два подхода к информационному поиску. Адресный и семантический поиск.

Виды поиска.

Мы познакомились с основными средствами поиска информации в Интернете – поисковыми системами и гипертекстовой навигацией. Они применяются в том случае, если мы не знаем Интернет-адреса интересующего нас информационного ресурса. Если же адрес известен, по нему мы сразу попадаем на нужный сайт.

В соответствии с этими возможностями выделяют два подхода к ин-формационному поиску адресный и семантический.

В рамках первого подхода документ рассматривается как объект, адрес которого в хранилище задан и известен пользователю. При адресном поиске достаточно указать адрес нужного документа без обращения к его содержанию (по адресу http://www.museum.ru/ мы попадаем на сайт музеев России, а по адресу http://www.sciencemuseum.org.uk/ – на сайт музея науки в Лондоне).

При втором подходе осуществляется поиск информации путем обращения к содержанию документов, то есть семантический поиск.

В семантическом поиске выделяют документальный и фактографический поиск.

Документальный поиск – информационный поиск, проводимый с целью нахождения документов, содержание которых соответствует запросу.

Фактографический поиск информационный поиск, проводимый с целью нахождения фактографических данных, соответствующих запросу.

При документальном поиске на запрос пользователя система выдает списки документов, соответствующих запросу.

При фактографическом система должна выдать конкретные данные по интересующему вопросу.

Так, на запрос технические характеристики поисковых машин при документальном поиске поисковая система выдаст список документов, содержащих сведения о технических характеристиках ИПС (http://www.yandex.ru/):

При фактографическом – должна выдать перечень технических характеристик. Однако современные информационно-поисковые системы такой поиск, как вы понимаете, пока не осуществляют.

Поскольку возможность получения конкретной (фактографической) информации по запросу отсутствует, предпринимаются попытки сделать более качественным документальный поиск. Это достигается двумя основными приемами – разработкой стратегии поиска и определением типа запроса, позволяющего наиболее точно выразить нашу информационную потребность.

71 Виды семантического поиска.

Написать, что такое семантический поиск

В семантическом поиске выделяют документальный и фактографический поиск.

Документальный поиск – информационный поиск, проводимый с целью нахождения документов, содержание которых соответствует запросу.

Фактографический поиск информационный поиск, проводимый с целью нахождения фактографических данных, соответствующих запросу.

При документальном поиске на запрос пользователя система выдает списки документов, соответствующих запросу.

При фактографическом система должна выдать конкретные данные по интересующему вопросу.

Так, на запрос технические характеристики поисковых машин при документальном поиске поисковая система выдаст список документов, содержащих сведения о технических характеристиках ИПС (http://www.yandex.ru/):

При фактографическом – должна выдать перечень технических характеристик. Однако современные информационно-поисковые системы такой поиск, как вы понимаете, пока не осуществляют.

Поскольку возможность получения конкретной (фактографической) информации по запросу отсутствует, предпринимаются попытки сделать более качественным документальный поиск. Это достигается двумя основными приемами – разработкой стратегии поиска и определением типа запроса, позволяющего наиболее точно выразить нашу информационную потребность.

72 Документальный и библиографический поиск.

Документальный поиск это один из видов семантичекского поиска. Документальный поиск – информационный поиск, проводимый с целью нахождения документов, содержание которых соответствует запросу.

Библиографический поиск - документальный, осуществляемый с целью нахождения данных о первичных документах и их адресов. Информационно-поисковая система, обеспечивающая хранение вторичных документов и библиографический поиск, называется библиографической ИПС.

Библиотечный поиск - документальный, осуществляемый с целью нахождения первичных документов в их собрании (фонде). Соответствующая ИПС называется библиотечной.

При документальном поиске потребитель информации сам извлекает из документов интересующие его факты и идеи.

Документальный поиск

Процесс поиска в хранилище информационно-поисковой системы первичных документов или в базе данных вторичных документов, соответствующих запросу пользователя.

Два вида документального поиска:

Библиотечный, направленный на нахождение первичных документов.

Библиографический, направленный на нахождение сведений о документах, представленных в виде библиографических записей.

Библиографические ресурсы Интернет представлены прежде всего электронными каталогами библиотек.

Помимо библиотечных каталогов большой массив информации содержится в библиографических базах данных, которые в отличии от каталогов отражают сведения об отдельных статьях из периодических изданий и сборников. Крупнейшей среди библиографических баз данных является UnCover, - единственная англоязычная база универсального профиля (http://uncweb.carl.org:80/cgi-bin/unCover). Она образовалась как побочный продукт коммерческого предприятия, специализирующегося на доставке потребителям полных текстов документов, в том числе и статей из журналов и сборников. Методика поиска очень проста, чему способствует максимально облегченный дружественный интерфейс. Разыскание может вестись по фамилии автора, ключевым словам или названию периодического издания. В запросе возможно применение булевых операторов (AND, OR, NOT) и усечение терминов с помощью “*”. Получаемые в результате поиска библиографические записи содержат полный набор элементов, необходимых для идентификации документа.

73 Фактографический поиск и его отличие от документального.

Факториальний и документальный это виды семантического поиска информации.

Различают документальный и Фактографический поиск. Документальный поиск - это информационный поиск, цель которого - нахождение в хранилище ИПС документов, соответствующих подученному запросу (с последующей выдачей самих документов или их копий). Существуют хранилища первичных документов (книгохранилица библиотек, массивы микродокументов и т.д.) и вторичных (картотеки, каталоги, записи в памяти ЭВМ и т.п.).

Библиографический поиск - документальный, осуществляемый с целью нахождения данных о первичных документах и их адресов. Информационно-поисковая система, обеспечивающая хранение вторичных документов и библиографический поиск, называется библиографической ИПС.

Библиотечный поиск - документальный, осуществляемый с целью нахождения первичных документов в их собрании (фонде). Соответствующая ИПС называется библиотечной.

При документальном поиске потребитель информации сам извлекает из документов интересующие его факты и идеи.

Фактографический поиск представляет собой поиск фактов, непосредственно отвечающих на запрос. Например, на запрос "Суда на подводных крыльях, выпускаемые промышленностью СССР", документальная ИПС выдает книги, статьи, информационные материалы, содержащие сведения об этих судах; фактографический поиск выдает перечень судов с их техническими характеристиками..

Фактографическая ИПС - информационно-поисковая система, обеспечивающая хранение и поиск фактографической информации. ФИПС используется в системах экономического управления, научно-технической информации, в городских справочных службах.

К фактографической информации относят как сведения, извлекаемые из документов (первичных или вторичных), так и получаемые непосредственно от источников их возникновения (специалистов, измерительных систем и т.д.). Чтобы обеспечить хранение и поиск такой информации, ее фиксируют на специальных форматах в виде фактографических описаний. Фактографическое описание - совокупность данных (признаков, характеристик), относящихся к некоторому объекту (процессу, явлению).

74 Соотношение информационного запроса и документа.

Информационно-поисковая система – это совокупность средств и методов, организованных в функциональную систему, выполняющую хранение и поиск информации.

Хранение и поиск информации предполагает, в свою очередь, наличие в системе двух взаимосвязанных режимов работы по обработке документов с целью их последующего хранения и обслуживанию запросов, поступающих от пользователей при поиске ими необходимой информации. Остановимся на них подробнее.

Режимы работы ИПС.

На вход ИПС поступает информация двух типов:

Информация первого типа отражает знания в какой-либо области и поступает в виде документов, образующих поисковый массив, хранящийся в БД.

В соответствии с этой структурой, в ИПС реализуется два режима работы:

  1. режим формирования и пополнения поискового массива документов;

  2. режим поиска информации по запросу пользователя.

Так в самом общем виде можно описать принцип работы любой информационно-поисковой системы. Вместе с тем реализация этого принципа может существенно отличаться в различных ИПС. От чего зависит это различие и в чем оно может состоять? Зависит, прежде всего, от наличия или отсутствия в системе инструментов анализа семантики документов (семантических словарей). А состоит – в качестве работы инструмента семантической обработки текстов, реализованного в конкретной системе (тезаурус, онтологии и проч.). Классическим средством описания языковой семантики является тезаурус и именно он входит в состав классической информационно-поисковой системы.

79 Принципы поиска информации в кластерных пм.

Кластерный поисковик, как и обычная поисковая система, сначала находит в своей базе соответствующие запросу веб-страницы. Акробатика начинается на этапе сортировки результатов. Система проводит анализ подобранных ресурсов и находит на них дополнительные ключевые слова, встречающиеся вместе с терминами из поступившего запроса. Полученные в результате такого анализа подмножества страниц с большой вероятностью связаны тематически и относятся к разным аспектам темы запроса. Далее в недрах поисковика происходит второе важное событие: определение релевантности ссылок и их позиции в результатах поиска. Кластерная машина проделывает эту операцию отдельно для каждого кластера. При этом ссылки со страниц одного кластера, то есть аналогичной или похожей тематики, ценятся выше, чем ссылки с посторонних, пусть даже очень популярных ресурсов. Таким образом, позиция сайта в выдаче по кластеру является своеобразным отражением ее оценки коллегами по тематическому цеху, что повышает качество поиска. Кроме того, ранжирование ссылок по отдельным кластерам позволяет вытащить на свет божий полезные, но не «раскрученные» ресурсы, которым в обычных поисковиках с выдачей результатов единым списком и бесконечными войнами «оптимизаторов» мало что светит.

К таким кластерным поисковикам модно отнести nigma.ru и ask.com

80.Семантический web

Семантического Web выдвинул Тим Бернерс-Ли, Основная идея этого проекта заключается в организации такого представления данных в сети, чтобы допускалась не только их визуализация, но и их эффективная автоматическая обработка программами разных производителей. Путем таких радикальных преобразований концепции уже традиционного Web предполагается превращение его в систему семантического уровня. По замыслу создателей Семантический Web должен обеспечить "понимание" информации компьютерами, выделение ими наиболее подходящих по тем или иным критериям данных, и уже после этого - предоставление информации пользователям.

При автоматической обработке информации в рамках Семантического Web взаимодействующие друг с другом сервисы на основе анализа смысловых связей между объектами и понятиями, хранящимися в Сети должны отбирать лишь ту информацию, которая будет реально полезна пользователям.По определению консорциума W3C Семантический Web представляет собой расширение существующей сети Internet, в котором информация представляется в четком и определенном смысловом значении, дающем возможность людям и компьютерам работать с более высокой степенью взаимопонимания и согласованности. Семантический Web предусматривает объединение разнообразных видов информации в единую структуру, где каждому смысловому элементу данных будет соответствовать специальный синтаксический блок (тэг). Тэги должны составлять единую иерархическую структуру, на основе которой и должен функционировать Семантический Web. По словам Бернерса-Ли, в рамках проекта "Семантический Web" разрабатываются языки для выражения информации в форме, доступной для машинной обработки, на которых можно будет описывать как данные, так и принципы трактования этих данных. В процессе реализации концепции Семантического Web получили широкое развитие синтаксические методы представления информации языковыми средствами XML и его дополнений, предназначенных для описания типовых свойств элементов XML- документов, их структуры и семантики: рекомендации W3C, регламентирующие DTD (Document Type Definition), XML Schema, XQuery (язык запросов к базам XML-данных) и т.д.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]