Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Alik_--_Semantic_Web-1

.pdf
Скачиваний:
16
Добавлен:
10.02.2015
Размер:
2.43 Mб
Скачать

Технологии

Semantic Web

RDF

OWL

Description Logics

Алик Кириллович

(http://www.alik.su, alik@alik.su) Сообщество SemanticFuture.net

Содержание

I. Введение в Semantic Web II. RDF

III. SPARQL IV. OWL

V. Дескрипционная логика VI. Логический вывод в ДЛ

World Wide Web

• Крупнейшее в мире хранилище информации

• IDC, 2008:

Объем информации в интернете составляет 5444 петабайт.

Для сравнения: объем информации во всех книгах, изданных в истории человечества, составляет только 200 петабайт, т.е. почти в 30 раз меньше.

• Яндекс, «Контент Рунета», 2009:

Объем Рунета (6% мировой паутины) соответствует 35 миллионам книг.

Информация понятна людям, но непонятна машинам

Компьютеры обрабатывают документы как набор символов, но не понимают их смысл

Решение: Semantic Web.

Semantic Web

Semantic Web — надстройка над WWW, позволяющая сделать информацию в Web понятной не только людям, но и машинам

Возможности:

Семантический поиск

Объединение знаний

Логический вывод

Агенты

Возможности

1.Семантический поиск — поиск не по ключевым словам, а по смыслу

Предположим, Вы хотите найти некую госпожу Кук *Ms. Cook+, с которой Вы познакомились на профсоюзной конференции в прошлом году. Вы не помните её имени, однако помните, что она работала в какой-то компании, которая является Вашим клиентом, и что её сын учится в том же университете *alma mater+, который окончили Вы. Умная поисковая система просканирует все страницы людей с фамилией Кук (при этом пропуская страницы о поварах [cooks+, приготовлении пищи *cooking], Кукских островах *Cook Islands+ и т.п.), выберет среди них те, на которых упоминаемый человек работает в компании, входящей в список Ваших клиентов, а также пробежит по ссылкам на вебстраницы учебных заведений, в которых учатся их дети, чтобы проверить, не тот ли самый это университет.

2.Объединение знаний

На одном сайте написано, что Путин — премьер-министр России. На другом, что Конни — собака Путина.

Ни один сайт напрямую не говорит о собаке премьер-министра.

Но система Semantic Web поймет, что Конни — собака премьер-министра России.

3.Логический вывод — вычисление новых знаний из уже имеющихся

Известно, что КГУ находится в Казани; а также, что Казань — российский город.

Поскольку отношение «находится в» транзитивно, система Semantic Web сделает вывод и поймет, что КГУ — российский университет.

Эти возможности создают почву для работы интеллектуальных агентов.

Агенты

Интеллектуальный агент — программа, способная автономно выполнять указанное человеком задание по поиску и обработке информации

Примеры заданий:

«Закажи для меня эту книгу в ближайшей библиотеке»

«Посмотри на расписание электричек и мое расписание и выбери билеты в театр, чтобы я мог успеть после работы»

«Скажите, какое вино мне нужно купить к каждому из блюд в этом меню. И, кстати, я не люблю Сотерн»

«Микроволновка, сходи на сайт производителя продукта и загрузи оптимальные параметры подогрева»

Архитектура Semantic Web

Для этого требуется:

Синтаксис, с помощью которого можно записать высказывания.

Семантика, с помощью которой машина сможет интерпретировать высказывания.

Язык запросов.

Решение: RDF, RDFs и OWL, SPARQL.

Архитектура Semantic Web

Технологии:

RDF — язык, позволяющий записать высказывания в понятном машине виде.

RDFs и OWL — языки описания онтологий, с помощью которых машина может интерпретировать высказывания и проводить над ними рассуждения.

Онтология описывает понятия предметной области и отношения между ними.

• SPARQL — язык запросов.

Содержание

I. Введение в Semantic Web II. RDF

III. SPARQL IV. OWL

V. Дескрипционная логика VI. Логический вывод в ДЛ

RDF

RDF позволяет кому угодно сказать что угодно о каком угодно ресурсе — объекте реального мира, электронном документе или абстрактном понятии.

Все ресурсы идентифицируются с помощью URI.

Высказывания о ресурсах представляются в виде триплетов, состоящих из субъекта (описываемого ресурса), предиката (его свойства) и объекта (значения свойства).

Триплеты объединяются в RDF-граф.

Множество всех RDF-графов в сети представляет собой единый глобальный граф (GGG). Это развитие паутины документов (WWW).

В качестве URI ресурса может выступать URL онтологии с его описанием, с помощью которой в RDF-графе могут выводиться новые данные.

Абстрактный RDF-граф может быть представлен в текстовом виде в одном из форматов сериализации, например: XML, Turtle или RDFa.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]