- •Стоимость знаний.
- •Организация информации и доступ к ней.
- •Каталоги — лучше, чем поиск?
- •Аннотирование.
- •Гипертекст.
- •Автоматизированное извлечение знаний.
- •Извлечение простейших знаний.
- •Автоматическое построение гипертекстов.
- •Машинное аннотирование.
- •Автоматическая классификация документов.
- •Виртуальный собеседник.
Виртуальный собеседник.
Следующим шагом по развитию средств доступа к знаниям должны стать виртуальные собеседники. В очень многих областях человечеством накоплено достаточно знаний, чтобы можно было организовать диалог с виртуальным собеседником, например поговорить с виртуальным «сотрудником» службы технической поддержки (если накоплено достаточно наиболее частых вопросов и ответов) или с электронным воплощением Сократа, диалоги которого у Платона и Ксенофонта также дают обширный материал для организации виртуального общения. Собственно организация диалога с машиной не представляет собой сверхъестественной сложности, что было доказано знаменитой программой «Элиза» — виртуальным психотерапевтом, созданным в 80-х годах Джорджем Вейценбаумом. Весь вопрос — в правильной подготовке данных и их объеме. Я думаю, первые виртуальные собеседники появятся в ближайшие тричетыре года и вызовут новый шум в прессе и всплеск мифов вокруг возможностей и границ применимости искусственного интеллекта. Но это уже вопрос не технический, а нравственный, как справедливо пишет Дж. Вейценбаум в своей книге «Возможности вычислительных машин и человеческий разум», поэтому здесь я позволю себе закончить.
1 Чтобы воспользоваться одной из этих служб имен, пользователь должен скачать из сети или получить другим способом небольшую программу-драйвер, которая позволит его прогрмме просмотра отличать естественно-языковые имена. 2 Различительная сила термина — верятность того, что при обнаружении данного термина в документе этот документ относится к данной рубрике. Самый простой способ для вычисления различительной силы термина таков: нужно частоту появления термина в данной рубрике разделить на число его появлений во всем множестве документов. Если термин почти не встречается вне рубрики, данное число будет близко к единице, а в противоположной ситуации — к нулю.