Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Информационные технологии.docx
Скачиваний:
27
Добавлен:
08.06.2015
Размер:
112.98 Кб
Скачать

1. Кратко изложить его содержание (аннотация, реферат)

2. ответить на вопросы к этому тексту

3. на основе текста нарисовать картинку или схему

4. приведенные в тексте сведения представить в другой форме (таблица, график)

5. на основе анализа текста, написанного на одном языке, выдать адекватную информацию на другом

6. сравнить содержание двух разных текстов и выдать инфу, что в них общего и в чем различия

7. путем анализа одного или нескольких разных текстов извлечь такие знания, которые можно поместить в некоторую базу знаний

Соотнося уровни понимания текста компом с основными уровнями языка, можно выделить следующие уровни автоматического понимания:

1. морфологический

2. синтаксический

3. семантический

4. гиперсинтаксический или прагматический

Морфологическое понимание сводится к автоматическому приписыванию каждому слову текста его морфологических признаков. Суть синтаксического понимания текста заключается в автоматическом выделении в каждом предложении текста главных и второстепенных членов предложения и установления между ними различных типов связи. В процессе семантического понимания текста автоматически устанавливаются значения, выделенные на синтаксическом уровне, составляющих предложение (подлежащее – одушевленное/неодушевленное, сказуемое – глагол движения/чувствования, обстоятельство – места/времени/действия)

Связано с выяснением семантических отношений между предложениями текста и с выявлением соответствующей тексту ситуации реальной действительности.

Типы автоматического понимания

Компьютерная система, понимающая письменный текст, должна иметь в своей базе данных следующую инфу:

1. Знания о языке, на котором написан текст

2. правила использования знаний о языке

3. знания о реальном мире (предметной области)

4. правила использования знаний о фрагменте реальной действительности (предметной области)

5. знания о пользователе системы, желающем получить от ПК некоторое понимание, вложенного в его память текста

В зависимости от сложности использования знаний и их количества различают следующие типы автоматического понимания:

1. понимание/узнавание

Компьютерная система должна меть знания лишь о языке. Суть понимания сводится к тому, что ПК узнает морфологическую структуру каждого слова в предложении, проводит синтаксический анализ, узнает в исходном тексте ключевые слова, словосочетания и предложения

2. понимание/уподобление

Правила их использования. Считается, что эта система понимает текст, если она может ответить на вопросы по этому тексту. При этом понимании ПК просто находит готовые ответы в своей базе знаний, ранее занесенные человеком. Таким образом, ПК уподобляется человеку.

3. понимание/пронозирование

Для очень узкой предметной области. ПК должен иметь:

- знания о языке

- правила их использования

- знания по предметной области

Считается, что система понимает текст, если она может определить какой объект или предмет, или событие предметной области соответствует отдельным фрагментам этого текста. Однако одним и тем же фрагментом текста могут соответствовать различные объекты или события. Поэтому соотносить их можно лишь с определенной степенью вероятности – отсюда термин «прогнозирование»

4. понимание/объединение

В базе знаний представлены 4 вида знаний, объединяя эти виды знаний компьютерная система должна уметь делать выводы, умозаключения по тексту, объяснить почему она сформулировала то или иной вывод (это работа экспертной системы)

5. понимание/объяснение

Имеют в БЗ все 5видов знаний, включая знания о целях профессиональной компетенции пользователя. Компьютерная система должна уметь объяснить пользователю, каким образом она поняла текст, т.к. свое понимание система должна давать любому конкретному пользователю с учетом уровня его образования опыта, в таких системах используется диалог комп - пользователь.

Проблема автоматического понимания текста

1. Система автоматического индексирования, аннотирования, реферирования и машинного перевода текста

2. Информационная и информационно-поисковые системы

3. Экспертные системы (выступающие в роли высокопрофессионального специалиста в какой-то предметной области)

4. Системы автоматического порождения письменного текста

До сих пор нет единой теории текста образования, и она все еще находится в стадии становления. Известны многочисленные подходы к процедуре порождения текстов, которые в основном зависят от цели создания:

1.Системы, используемые в обучении в информационном обслуживанию

2. Системы по порождению практических документов (метеосводки, статотчеты)

3. Системы порождения небольших газетных сообщений по текущих событиях

4. Экспериментальные компьютерные системы, порождающие сказки, пословицы, стихи…

Сегодня не может быть создана единая теория порождения текста.

Основная причина – неоднозначное определение понятия «текст»

Создатели системы под текстом понимают мобильную реплику, состоящую из нескольких предложений.

Создатели системы генерации метеосводок и статотчетов под текстом понимают таблицу.

Для создающихся событий это цепочка несвязанных между собой предложений, относящихся к одному объекту.

Художественный, публицистический текст:

- здесь необходимы законы построения текста разных стилей и жанров

Установлено, что процесс текстообразования состоит из 2 этапов: