Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Lecture 2.doc
Скачиваний:
6
Добавлен:
14.09.2019
Размер:
2.72 Mб
Скачать
        1. Системы обработки связных текстов

Системы данного класса моделируют процесс понимания законченных описаний определенных фрагментов действительности (историй, рассказов, эпизодов и т. п.), выраженных в виде текста на естественном языке, т. е. последовательности связанных друг с другом предложений. Понимание текста трактуется как извлечение из него всей существенной с точки зрения системы информации и присоединение ее к собственной базе знаний. После этого система может отвечать на вопросы относительно фактов, событий, явлений и прочих сущностей, которые явно или косвенно описаны во введенных текстах. Очевидно, что в практическом плане модели и методы, развиваемые в системах обработки связных текстов, могут быть полезны при создании интеллектуальных систем автоматического индексирования и реферирования.

Для примера рассмотрим системы Researcher и Tailor, которые образуют единый комплекс, позволяющий пользователю получать сведения из рефератов-патентов, описывающих сложные физические объекты. Система Researcher получает рефераты патентов, стрит на их основе базу знаний и делает обобщения различных патентов, которые могут служить для изучения содержащихся в рефератах сведений, относящихся к различным объектам. Вопросно-ответные функции выполняет система Tailor.

Каждый из классов ЕЯ систем обладает специфическими особенностями, которые хорошо заметны при рассмотрении характера задач, решаемых основными функциональными компонентами этих систем (таблица 2.1).

1.1.2.3.1. Системы реферирования текстов

1.1.2.3.2. Системы сравнения и классификации текстов

1.1.2.3.3. Системы кластеризации текстов

        1. Системы машинного перевода. Системы понимания речи (текстов)

Особым классом ЕЯ-систем, требующим наличия всех трех компонент, являются системы машинного перевода. Рассмотрим функциональное назначение и лингвистическое обеспечение систем машинного перевода, а также принципы организации систем понимания речи.

Машинный перевод (МП), или автоматический перевод (АП) – интенсивно развивающаяся область научных исследований, экспериментальных разработок и уже функционирующих систем (СМП), в которых к процессу перевода с одного естественного языка на другой привлекается компьютер. СМП открывают быстрый и систематический доступ к информации на иностранных языках, обеспечивают оперативность и единообразие в переводе больших потоков текстов, в основном научно-технических. Работающие в промышленном масштабе СМП опираются на большие терминологические банки данных и, как правило, требуют привлечения человека в качестве пред-, интер-, или постредактора. Современные СМП, и в особенности те, которые опираются при переводе на базы знаний в определенной предметной области, относят к классу систем искусственного интеллекта. Необходимо отметить, тем не менее, что существующие СПМ пока являются только системами фразового перевода: они более или менее корректно переводят отдельные предложения, но они пока не связываются между собой.

Основные сферы использования МП:

1. В отраслевых службах информации при наличии большого массива или постоянного потока иноязычных источников. Если СМП используются для выдачи сигнальной информации, постредактирование не требуется.

2. В крупных международных организациях, имеющих дело с многоязычными политематическими массивами документов. Поскольку требования к переводу здесь высоки, МП нуждается в постредактировании.

3. В службах, осуществляющих перевод технической документации, сопровождающей экспортируемую продукцию. Структура и язык технической документации достаточно стандартны, что облегчает МП, и даже делает его предпочтительным перед ручным переводом, так как гарантирует единый стиль всего массива. Поскольку перевод спецификаций должен быть полным и точным, продукция МП нуждается в постредактировании.

Помимо практической потребности делового мира в СМП, существуют и чисто научные стимулы к развитию МП: стабильно работающие экспериментальные системы МП являются опытным полем для проверки различных аспектов общей теории понимания, речевого общения, преобразования информации, а также для создания новых, более эффективных моделей самого МП.

Под переводом будем понимать формирование текста на языке перевода, который ставится в соответствие тексту на исходном языке, при этом обеспечивается их смысловая эквивалентность. Необходимо понимать следующее. Поскольку в любых парах языков не существует семантического тождества, лингвистически точный перевод невозможен в принципе. Возможна лишь правильная интерепретация текста на исходном языке средствами языка перевода.

Системы машинного перевода можно разделить на три типа. К первому относятся системы, осуществляющие пословный (подстрочный) перевод. Ко второму типу – наиболее распространенные системы фразового перевода (переводящие отдельные предложения независимо друг от друга). Системы третьего типа (они практически отсутствуют и их только сейчас начинают всерьез разрабатывать) это системы контекстного перевода, которые переводят отдельные предложения в зависимости от перевода других предложений текста.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]