Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Lecture 21.doc
Скачиваний:
33
Добавлен:
08.06.2015
Размер:
1.9 Mб
Скачать

2.1.1. Основные классы естественно-языковых систем

Естественно-языковые системы используются для поиска информации, распознавания и синтеза речи, голосового управления, и обработки данных. (13) В данном направлении выделяются следующие категории информационных продуктов:

    • средства, обеспечивающие ЕЯ интерфейс к базам данных;

    • средства ЕЯ поиска в текстах и обработки текстовой информации;

    • средства распознавания речи;

    • средства голосового ввода, управления и сбора данных;

    • средства понимания речи и текстов;

    • средства синтеза речи и текстов;

    • компоненты искусственно-интеллектуальных систем;

    • онтологии и тезаурусы;

    • речевые базы и базы текстов.

(14) Программные продукты первой категории преобразуют ЕЯ запросы пользователя в запросы к базам данных. (15) Средства ЕЯ поиска в текстах осуществляют по запросам пользователей поиск и фильтрацию текстовой информации. В отличие от продуктов предыдущей группы, где поиск осуществляется в базах данных, имеющих четкую и заранее известную структуру, средства данной категории осуществляют поиск в неструктурированных текстах, оформленных в соответствии с правилами грамматики того или иного естественного языка. Поиск осуществляется в распределенных (таких как Сеть), а также специализированных хранилищах, в том числе, в цифровых библиотеках. (16) Средства для распознавания речи распознают голосовую информацию и преобразуют ее в последовательность символов. Они ориентированы на работу со словарями объемом от 10000 до 150000 слов. В отличие от этого, (17) средства голосового ввода ориентированы на работу со словарем до 1000 слов и существенно ограничены в возможностях распознавания. Программные средства этого типа предназначены для ввода голосовых команд, управляющих работой некоторой системы, например, программы сбора данных в тех случаях, когда у пользователя заняты руки. (18) Средства понимания речи и текста восстанавливают смысловую структуру текста, или речевого сообщения его содержащего. (19) Средства синтеза текста и речи осуществляют формирование корректного текста по его смысловой структуре, и синтез речи по тексту.

(20) Компоненты ЕЯ обработки предназначены для использования в искусственно-интеллектуальных приложениях, в которые необходимо добавить возможности распознавания и синтеза речи, а также – анализа текстов. Помимо перечисленных выше, в качестве компонент ЕЯ обработки могут использоваться (19) системы клонирования голоса. Системы клонирования голоса позволяют изменить окраску и другие просодические характеристики голоса говорящего в различных целях (сокрытия личности говорящего, для применения в играх и системах моделирования личности для имитации голоса известного человека, и т.д.).

Помимо собственно ЕЯ-систем и их компонент имеются также (21) средства лингвистической и речевой поддержки этих систем. К ним относятся онтологии и тезаурусы, которые используются в качестве источников знаний верхних уровней в системах распознавания речи и анализа текстов. (22) Речевые базы и базы текстов служат для обучения систем распознавания речи и анализа текстов, соответственно.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]