Alik_--_Semantic_Web-1
.pdfТехнологии
Semantic Web
RDF |
OWL |
Description Logics |
Алик Кириллович
(http://www.alik.su, alik@alik.su) Сообщество SemanticFuture.net
Содержание
I. Введение в Semantic Web II. RDF
III. SPARQL IV. OWL
V. Дескрипционная логика VI. Логический вывод в ДЛ
World Wide Web
• Крупнейшее в мире хранилище информации
• IDC, 2008:
Объем информации в интернете составляет 5444 петабайт.
Для сравнения: объем информации во всех книгах, изданных в истории человечества, составляет только 200 петабайт, т.е. почти в 30 раз меньше.
• Яндекс, «Контент Рунета», 2009:
Объем Рунета (6% мировой паутины) соответствует 35 миллионам книг.
•Информация понятна людям, но непонятна машинам
•Компьютеры обрабатывают документы как набор символов, но не понимают их смысл
Решение: Semantic Web.
Semantic Web
Semantic Web — надстройка над WWW, позволяющая сделать информацию в Web понятной не только людям, но и машинам
Возможности:
•Семантический поиск
•Объединение знаний
•Логический вывод
•Агенты
Возможности
1.Семантический поиск — поиск не по ключевым словам, а по смыслу
Предположим, Вы хотите найти некую госпожу Кук *Ms. Cook+, с которой Вы познакомились на профсоюзной конференции в прошлом году. Вы не помните её имени, однако помните, что она работала в какой-то компании, которая является Вашим клиентом, и что её сын учится в том же университете *alma mater+, который окончили Вы. Умная поисковая система просканирует все страницы людей с фамилией Кук (при этом пропуская страницы о поварах [cooks+, приготовлении пищи *cooking], Кукских островах *Cook Islands+ и т.п.), выберет среди них те, на которых упоминаемый человек работает в компании, входящей в список Ваших клиентов, а также пробежит по ссылкам на вебстраницы учебных заведений, в которых учатся их дети, чтобы проверить, не тот ли самый это университет.
2.Объединение знаний
На одном сайте написано, что Путин — премьер-министр России. На другом, что Конни — собака Путина.
Ни один сайт напрямую не говорит о собаке премьер-министра.
Но система Semantic Web поймет, что Конни — собака премьер-министра России.
3.Логический вывод — вычисление новых знаний из уже имеющихся
Известно, что КГУ находится в Казани; а также, что Казань — российский город.
Поскольку отношение «находится в» транзитивно, система Semantic Web сделает вывод и поймет, что КГУ — российский университет.
Эти возможности создают почву для работы интеллектуальных агентов.
Агенты
Интеллектуальный агент — программа, способная автономно выполнять указанное человеком задание по поиску и обработке информации
Примеры заданий:
«Закажи для меня эту книгу в ближайшей библиотеке»
«Посмотри на расписание электричек и мое расписание и выбери билеты в театр, чтобы я мог успеть после работы»
«Скажите, какое вино мне нужно купить к каждому из блюд в этом меню. И, кстати, я не люблю Сотерн»
«Микроволновка, сходи на сайт производителя продукта и загрузи оптимальные параметры подогрева»
Архитектура Semantic Web
Для этого требуется:
•Синтаксис, с помощью которого можно записать высказывания.
•Семантика, с помощью которой машина сможет интерпретировать высказывания.
•Язык запросов.
Решение: RDF, RDFs и OWL, SPARQL.
Архитектура Semantic Web
Технологии:
•RDF — язык, позволяющий записать высказывания в понятном машине виде.
•RDFs и OWL — языки описания онтологий, с помощью которых машина может интерпретировать высказывания и проводить над ними рассуждения.
Онтология описывает понятия предметной области и отношения между ними.
• SPARQL — язык запросов.
Содержание
I. Введение в Semantic Web II. RDF
III. SPARQL IV. OWL
V. Дескрипционная логика VI. Логический вывод в ДЛ
RDF
•RDF позволяет кому угодно сказать что угодно о каком угодно ресурсе — объекте реального мира, электронном документе или абстрактном понятии.
•Все ресурсы идентифицируются с помощью URI.
•Высказывания о ресурсах представляются в виде триплетов, состоящих из субъекта (описываемого ресурса), предиката (его свойства) и объекта (значения свойства).
•Триплеты объединяются в RDF-граф.
•Множество всех RDF-графов в сети представляет собой единый глобальный граф (GGG). Это развитие паутины документов (WWW).
•В качестве URI ресурса может выступать URL онтологии с его описанием, с помощью которой в RDF-графе могут выводиться новые данные.
•Абстрактный RDF-граф может быть представлен в текстовом виде в одном из форматов сериализации, например: XML, Turtle или RDFa.