Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ответы13-16.doc
Скачиваний:
0
Добавлен:
17.09.2019
Размер:
79.87 Кб
Скачать

15. Ипя. Классификационные языки.

КЯ – язык, основанный на классификации. В основе любой классификации лежит принцип деления объектов рассматриваемой предметной области. Каждый объект характеризуется фиксированным множеством свойств, совокупность значений которых может говорить об эквивалентности или близости данного объекта некоторому множеству объектов. Такие характеристические свойства называются атрибутами. Классификация – выделение из некоторого множества объектов, принадлежащих универсальному классу, всех подклассов на основе значений выделенных в предметной области атрибутов и установление между выделенными подклассами отношений порядка. Атрибуты – основания деления.

Классификации бывают иерархическими (если между классами установлено отношение порядка при пустом попарном пересечении соподчиненных классов), фасетными (при создании классификации возможна такая ситуация: деление на классы проводится на основе всех возможных комбинаций атрибутов; значения, которые может принимать отдельный атрибут, объединяются в фасет). Частным случаем фасетной классификации является булева классификация, которая строится на основе всего одного возможного значения для каждого из атрибутов: «имеет» или «обладает».

Классификационные ИПС реализуют навигацию в веб-пространстве на основе специальных указателей, представляющих собой тематические «деревья», строящиеся на основе классификаций. Схемы классификации ресурсов в Интернете — это, как правило, древесные структуры, узлы которых названы словами естественного языка. Различные классификационные схемы отличаются друг от друга по объему и методологии их составления. Одним из недостатков универсальных иерархических классификаций является то, что они консервативны и отстают от развития науки, техники и жизни вообще. Главная проблема классификационных поисковых служб — это автоматизация классификации. До сих пор задача автоматической классификации удовлетворительного решения не нашла. Регистрация веб-сайтов и веб-страниц в каталогах, как правило, осуществляется людьми — индексаторами и модераторами данной системы. И поэтому объем базы данных систем классификационного типа сравнительно невелик по сравнению с информационной емкостью всего Интернета.

У Захарова:

В иерархической системе классификации каждый объект на любом уровне должен быть отнесен к одному классу, который характеризуется конкретным значением выбранного классификационного признака. Для последующей группировки в каждом новом классе могут быть заданы свои классификационные признаки и их значения. Алфавитно-предметные и фасетные классификации также основываются на предварительном составлении перечня основных категорий и классов предметов, встречающихся в конкретной предметной области.

В алфавитно-предметных классификациях классы понятий называются словами естественного языка и располагаются в алфавитном порядке. Они предназначены для узкопредметного поиска документов, главная тема которых обозначается именем соответствующего предметного класса (предметным заголовком). Классы понятий в них называются предметными рубриками. В отличие от иерархических, алфавитно-предметные классификации содержат большое число фиксированных рубрик верхнего уровня (заголовков) с незначительной глубиной дальнейшего деления (на подзаголовки). В основу фасетных классификаций положен принцип классификации одного и того же множества предметов и явлений по разным основаниям, а именно: для одного и того же множества объектов строится несколько иерархических классификаций. Основные категории – основания для классификации – называются фасетами (от англ. facet – аспект, рамка). Каждый фасет (Фi) содержит совокупность однородных значений данного классификационного признака. Причем значения в фасете могут располагаться в произвольном порядке, хотя предпочтительнее их упорядочение.

В дескрипторных ИПЯ семантическая задача описания содержания документов и запросов решается, по сути дела, приблизительно. Гораздо ближе к этой проблеме подошли создатели семантических и синтагматических языков, среди которых наиболее известны семантический код Перри–Кента, язык RХ-кодов и язык СИНТОЛ. Их разработчики основную задачу видели в обеспечении однозначного перевода с естественного языка на ИПЯ с учетом семантических и синтаксических факторов. Характерная особенность этих языков – наличие средств, явно описывающих семантическую и семантико-синтаксическую структуру понятий и выражений (семантические множители, термы, реляторы, предикаты, сущности и т.п.).

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]