Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Билет 2 ч.doc
Скачиваний:
21
Добавлен:
20.12.2018
Размер:
395.26 Кб
Скачать
  1. Второй период истории автоматизированных информационных систем

Второй период с известной долей условности можно поместить между серединой 60-х и серединой 70-х годов ХХ в.

Дуглас Энгельбарт (1968) продемонстрировал использование клавиатуры, манипулятора мышь, системы окон, текстового процессора, гипертекста, динамическую связь файлов, одновременную совместную работу связанных в сеть компьютеров. Белл Лабс разрабатывает Unix, операционную систему, ставшую основной для микрокомпьютеров и рабочих станций. Фирма IBM внедряет первый гибкий магнитный диск (8 дюймов)

Завершается 1968 год разработка системы кодов ASCII (American Standard Code for Information Interchange) системы единых кодов представления символов.

Развиваются системы телекоммуникации, сетевые технологии, возникают огромные информационные системы, позже разросшиеся до размеров монстров (OCLC, RLN и т.д.). Именно в это время возникает термин «Информационное общество»

В 1960-е годы начинаются активные разработки проекта глобальной сети. Еще в 1958 году в США инициирован так называемый проект ARPA (Advanced Research Project Agency). Этот проект ведет секретные военные разработки по созданию информационной глобальной сети.

В эти же годы начинается внедрение компьютеров и в работу библиотек.

В середине 60-х годов начинают создаваться массивы электронных библиографических записей (т.е. мета- документов). В 1965-66 годах в библиотеке Конгресса США создаётся первый электронный каталог, а в 1968 году в Великобритании – электронный массив национальной библиографии. В это время, можно сказать, осмысляется и подходит вплотную к реализации принцип многоцелевого использования электронной библиографической записи.

Это ведет к стандартизации электронной библиографической записи. В ходе экспериментов с электронными каталогами разрабатывается формат MARC. Издается первая редакция англо-американских правил каталогизации (1967), внедряется система стандартных номеров издания (ISBN) (1967), принимается решение о создании стандартного библиографического описания (ISBD) (1969), На пленарном заседании ISO в Стокгольме создается рабочая группа (WG-4) "Автоматизация и документация", издается первая редакция международного стандарта ISO 2709 нормирующего структуру электронной библиографической записи (1973).

На завершающем этапе периода начинают создаваться межбиблиотечные проекты – то есть временные организации, созданные для решения определенных технических, организационных и других проблем.

Для данного периода характерен повышенный интерес к информационно-поисковым языкам (ИПЯ) и методам индексирования. Индексирование повсеместно осуществлялось вручную. Типичная ИПС тех лет – это человеко-машинная система, где анализ содержания документов и индексирование выполняются вручную, а поиск проводится машиной. Поиск заключался в автоматическом сравнении поисковых образов документов и поисковых образов запросов, составленных на основе дескрипторных словарей или тезаурусов.

Эти ИПС, как правило, используются в режиме избирательного распространения информации, и функционируют как автономные системы, не связанные с библиотеками. Особенно это характерно для СССР, где в те годы создается Государственная автоматизированная система научно-технической информации (ГАСНТИ).

В целом для работ этого периода развития ИПС и ИПЯ характерно выявление природы ИПЯ через его сопоставление с естественным языком. Большое внимание уделялось разработке конкретных языков, разработке и использованию методик индексирования. Основная тема исследований – это уже не доказательство возможности или невозможности автоматизированного информационного поиска как такового, а выявление и разработка средств и методов, обеспечивающих наиболее эффективное решение задачи нахождения в информационном массиве документов, релевантных запросу.

Большое значение имел так называемый Второй Крэнфилдский эксперимент (1966) i. Его целью была сравнительная оценка эффективности различных средств и стратегий поиска. Было осознано, что многие поисковые средства или не приводят к улучшению показателей поиска, или незначительно улучшая одну из основных характеристик (полнота, точность), заметно ухудшают другую. Еще одна причина «отступления» семантически и синтаксически мощных языков – это переход от ручного интеллектуального индексирования к автоматизированному.

Билет № 2.

Информационная потребность, релевантность, пертинентность

ИП - Представление некоторой проблемы в сознании пользователя.

Запрос на поиск рождается из потребности людей в информации, нужной для решения каких-то задач (включая удовлетворение собственного любопытства).

Известно, что людям свойственно, правда, в разной степени, неумение, а может быть, неспособность сразу адекватно выражать свои подлинные информационные потребности.

Поэтому реальная система может обеспечить отыскание, в основном, лишь таких документов, которые отвечают на запрос в том виде, в каком он сформулирован в системе, а не на информационную потребность, существующую в сознании пользователя.

Релевантность - Свойство смысловой близости между двумя и более текстами (в данном случае – между документом и информационным запросом) – релевантностью (от англ. relevant – соответствующий).

Пертинентность - Соответствие полученных при поиске документов действительной информационной потребности пользователя

Билет № 3

Информационно -поисковые система (ИПС),

Упорядоченная совокупность данных (документов) и информационных технологий, предназначенных для хранения и поиска информации – текстов (документов) или данных (фактов).

Информационно-поисковыми системами являются любые определенным образом организованные хранилища информации.

Информационно-поисковые системы могут быть и неавтоматизированными. Главное – это целевая функция: хранение и поиск информации.

ИПС (информационно-поисковая система) - это система, обеспечивающая поиск и отбор необходимых данных в специальной базе с описаниями источников информации (индексе) на основе информационно-поискового языка и соответствующих правил поиска.

Главной задачей любой ИПС является поиск информации релевантной информационным потребностям пользователя. Очень важно в результате проведенного поиска ничего не потерять, то есть найти все документы, относящиеся к запросу, и не найти ничего лишнего. Поэтому вводится качественная характеристика процедуры поиска - релевантность.

Билет № 4

Элементы документа HTML

HyperText Markup Language (HTML) является стандартным языком, предназначенным для создания гипертекстовых документов в среде WEB. HTML-документы могут просматриваться различными типами WEB-броузеров. Использование HTML позволяет форматировать документы для их представления с использованием шрифтов, линий и других графических элементов на любой системе, их просматривающей.

Большинство документов имеют стандартные элементы, такие, как заголовок, параграфы или списки. Используя тэги HTML вы можете обозначать данные элементы, обеспечивая WEB-броузеры минимальной информацией для отображения данных элементов, сохраняя в целом общую структуру и информационную полноту документов. Все что необходимо, чтобы прочитать HTML-документ - это WEB-броузер, который интерпретирует тэги HTML и воспроизводит на экране документ в виде, который ему придает автор.

Элемент HTML — эта основная структурная единица веб-страницы.

HTML — это теговый язык разметки документов, то есть любой документ на языке HTML представляет собой набор элементов, причем начало и конец каждого элемента обозначается специальными пометками, называемыми тегами. Регистр, в котором набрано имя тега, в HTML значения не имеет. Элементы могут быть пустыми, то есть не содержащими никакого текста и других данных (например, тег перевода строки <br>). В этом случае обычно не указывается закрывающий тег. Кроме того, элементы могут иметь атрибуты, определяющие какие-либо их свойства (например, размер шрифта для тега <font>). Атрибуты указываются в открывающем теге.

HTML-тэги могут быть условно разделены на две категории:

  • тэги, определяющие, как будет отображаться WEB-броузером тело документа в целом

  • тэги, описывающие общие свойства документа, такие как заголовок или автор документа

Запомните, что основное преимущество HTML заключается в том, что ваш документ может быть просмотрен на WEB-броузерах различных типов и на различных платформах.

Как создаются html документы?

HTML-документы могут быть созданы при помощи любого текстового редактора или специализированных HTML-редакторов и конвертеров. Выбор редактора, который будет использоваться для создания HTML-документов, зависит исключительно от понятия удобства и личных пристрастий каждого автора.

Например, HTML редакторы, такие, как "Netscape Navigator Gold" компании Netscape позволяют создавать документы графически с использованием технологии WYSIWYG (What You See Is What You Get). С другой стороны, большинство традиционных средств для создания документов имеют конвертеры, позволяющие преобразовывать документы к формату HTML.

Основные положения

Все тэги HTML начинаются с "<" (левой угловой скобки) и заканчиваются символом ">" (правой угловой скобки). Как правило, существует стартовый тэг и завершающий тэг. Для примера приведем тэги заголовка, определяющие текст, находящийся внутри стартового и завершающего тэга и описывающий заголовок документа:

<TITLE> Заголовок документа </TITLE>

Завершающий тэг выглядит также, как стартовый, и отличается от него прямым слэшем перед текстом внутри угловых скобок. В данном примере тэг <TITLE> говорит WEB-броузеру об использовании формата заголовка, а тэг </TITLE> - о завершении текста заголовка.

Некоторые тэги, такие, как <P> (тэг, определяющий абзац), не требуют завершающего тэга, но его использование придает исходному тексту документа улучшенную читаемость и структурируемость.

HTML не реагирует на регистр символов, описывающих тэг, и приведенный ранее пример может выглядеть следующим образом:

<title> Заголовок документа </title>

Внимание! Дополнительные пробелы, символы табуляции и возврата каретки, добавленные в исходный текст HTML-документа для его лучшей читаемости, будут проигнорированы WEB-броузером при интерпретации документа. HTML-документ может включать вышеописанные элементы только если они помещены внутрь тэгов <PRE> и </PRE>. Более подробно о тэгах <PRE> будет написано ниже.

Билет № 5

Мета данные в документе HTML (Дублинское ядро)

Метатэги - очень важная составляющая HTML документа, позволяющая задать такие параметры просмотра документа как: кодовую страницу языка просмотра документа, параметры кэширования документа, ключевые слова, по которым вашу страничку будут искать поисковые системы интернета, и т.д. Метаданные размещаются на странице между тэгами <HEAD> и </HEAD>.

Описание мета-тэгов.

Группа HTTP-EQUIV

  1. EXPIRES (дата устаревания документа) После истечения указанного срока документ будет каждый раз загружаться заново, а не браться из кэша. Формат даты: RFC850 Пример: <META HTTP-EQUIV="EXPIRES" CONTENT="Wed, 26 Feb 1997 08:21:57 GMT">

  2. PRAGMA (управление кэшированием) Возможно одно значение NO-CACHE, то есть данный документ не кэшируется броузером. Пример: <META HTTP-EQUIV="PRAGMA" CONTENT="NO-CACHE">

  3. CONTENT-TYPE (Тип документа и его кодировка) Выбор кодовой страницы для правильного отображения символов браузером. Пример: <META HTTP-EQUIV="CONTENT-TYPE" CONTENT="text/html; charset=windows-1251">

  4. CONTENT-LANGUAGE Явное указание языка документа. Данные этого тэга могут использоваться как поисковыми роботами, так и WEB-серверами. Формат: <Язык>-<Диалект> Пример: <META HTTP-EQUIV="CONTENT-LANGUAGE" CONTENT="en-GB">

  5. REFRESH Время (в секундах), через которое произойдет автоматическая перезагрузка документа или переход на другой документ с заданным URL. Формат: <ВРЕМЯ> или <ВРЕМЯ>; <URL> Пример: <META HTTP-EQUIV="REFRESH" CONTENT="5; http://www.microsoft.com">

  6. CACHE-CONTROL (управление кэшированием) Возможные случаи: кэширование в общем (PUBLIC) / частном (PRIVATE) кэше. Документ вообще не кэшируется (NO-CACHE) или кэшируется но не сохраняется (NO-STORE). Пример: <META HTTP-EQUIV="CACHE-CONTROL" CONTENT="NO-STORE">

Группа NAME

  1. DESCRIPTION (описание документа) Один из наиболее важных тэгов. Информация, содержащаяся в нем влияет на результаты поиска поисковыми системами. В общем случае вид результатов поиска как правило выглядит так: а) URL документа б) Название документа (содержимое <TITLE>...</TITLE>) в) Описание документа, то есть DESCRIPTION или кусок начала документа, если DESCRIPTION отсутствует. В первом случае пользователь получает достаточно краткое и информативное описание документа, а во втором случае это может быть бессмысленный набор слов или несколько первых фраз. г) Рейтинг (коэффициент соответствия документа запросу пользователя). Пример: <META NAME="DESCRIPTION" CONTENT="Описание данного документа, до 100 символов">

  2. KEYWORDS (ключевые слова) Набор слов и фраз, наиболее полно характеризующих данный документ. Являются основным критерием поиска вашей странички поисковыми системами. В конечном счете эти слова учитываются при выдаче результатов поиска и способствуют повышению рейтинга. Пример: <META NAME="KEYWORDS" CONTENT="Ключевые слова, разделенные запятой, до 1000 символов">

  3. DOCUMENT-STATE (статус документа) Данный тэг управляет частотой индексации и может принимать два значения: STATIC (документ статичен, то есть не меняется, и, следовательно, индексировать его нужно только один раз) и DYNAMIC (для часто изменяющися документов, которые нужно реиндексировать) Пример: <META NAME="DOCUMENT-STATE" CONTENT="STATIC">

  4. ROBOTS (управление процессом индексации) Возможные варианты: a) INDEX - возможность индексирования данного документа (иначе NOINDEX) б) FOLLOW - возможность индексирования всех документов, на которые есть ссылки в данном HTML файле (иначе NOFOLLOW) в) ALL - одновременное выполнение условий INDEX и FOLLOW г) NONE - одновременное выполнение условий NOINDEX и NOFOLLOW Пример: <META NAME="ROBOTS" CONTENT="INDEX,NOFOLLOW">

  5. RESOURCE-TYPE (тип ресурса) Для обычных HTML документов значение этого мета тэга устанавливается равным "DOCUMENT" Пример: <META NAME="RESOURCE-TYPE" CONTENT="DOCUMENT">

  6. URL (расположение основного сайта) Базовый URL определяет какой документ следует индексировать (чтобы не обрабатывать "зеркала") Пример: <META NAME="URL" CONTENT="http://www.microsoft.com">

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]