- •Новые информационные технологии (3)
- •2. Основные классы естественно-языковых систем
- •2.1. Основные классы естественно-языковых систем
- •2.1.1. Основные классы естественно-языковых систем
- •2.1.2. Основные классы систем общения с эвм, включающие в свой состав ея-системы
- •2.2. Функциональные компоненты естественно-языковых систем 2.3. Сравнительная характеристика основных классов естественно-языковых систем
- •2.1.1. Основные классы естественно-языковых систем
- •2.1.2. Основные классы систем общения с эвм, включающие в свой состав ея-системы
- •Функциональные компоненты естественно-языковых систем
- •Сравнительная характеристика основных классов естественно-языковых систем
2.1.1. Основные классы естественно-языковых систем
Естественно-языковые системы используются для поиска информации, распознавания и синтеза речи, голосового управления, и обработки данных. (13) В данном направлении выделяются следующие категории информационных продуктов:
-
средства, обеспечивающие ЕЯ интерфейс к базам данных;
-
средства ЕЯ поиска в текстах и обработки текстовой информации;
-
средства распознавания речи;
-
средства голосового ввода, управления и сбора данных;
-
средства понимания речи и текстов;
-
средства синтеза речи и текстов;
-
компоненты искусственно-интеллектуальных систем;
-
онтологии и тезаурусы;
-
речевые базы и базы текстов.
(14) Программные продукты первой категории преобразуют ЕЯ запросы пользователя в запросы к базам данных. (15) Средства ЕЯ поиска в текстах осуществляют по запросам пользователей поиск и фильтрацию текстовой информации. В отличие от продуктов предыдущей группы, где поиск осуществляется в базах данных, имеющих четкую и заранее известную структуру, средства данной категории осуществляют поиск в неструктурированных текстах, оформленных в соответствии с правилами грамматики того или иного естественного языка. Поиск осуществляется в распределенных (таких как Сеть), а также специализированных хранилищах, в том числе, в цифровых библиотеках. (16) Средства для распознавания речи распознают голосовую информацию и преобразуют ее в последовательность символов. Они ориентированы на работу со словарями объемом от 10000 до 150000 слов. В отличие от этого, (17) средства голосового ввода ориентированы на работу со словарем до 1000 слов и существенно ограничены в возможностях распознавания. Программные средства этого типа предназначены для ввода голосовых команд, управляющих работой некоторой системы, например, программы сбора данных в тех случаях, когда у пользователя заняты руки. (18) Средства понимания речи и текста восстанавливают смысловую структуру текста, или речевого сообщения его содержащего. (19) Средства синтеза текста и речи осуществляют формирование корректного текста по его смысловой структуре, и синтез речи по тексту.
(20) Компоненты ЕЯ обработки предназначены для использования в искусственно-интеллектуальных приложениях, в которые необходимо добавить возможности распознавания и синтеза речи, а также – анализа текстов. Помимо перечисленных выше, в качестве компонент ЕЯ обработки могут использоваться (19) системы клонирования голоса. Системы клонирования голоса позволяют изменить окраску и другие просодические характеристики голоса говорящего в различных целях (сокрытия личности говорящего, для применения в играх и системах моделирования личности для имитации голоса известного человека, и т.д.).
Помимо собственно ЕЯ-систем и их компонент имеются также (21) средства лингвистической и речевой поддержки этих систем. К ним относятся онтологии и тезаурусы, которые используются в качестве источников знаний верхних уровней в системах распознавания речи и анализа текстов. (22) Речевые базы и базы текстов служат для обучения систем распознавания речи и анализа текстов, соответственно.