Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Информационные технологии.docx
Скачиваний:
27
Добавлен:
08.06.2015
Размер:
112.98 Кб
Скачать

1. Подготовительный – референт читает текст, пытается понять и осмыслить документ в целом

2. аналитический – референт делит текст на фрагменты, каждый фрагмент изучает и выделяет в нем основные смысловые единицы. Строится план будущего реферата.

3. этап построения реферата – выделенные ранее смысловые единицы, их комбинации располагаются в единый вторичный текст в соответствии с планом реферата.

Основные смысловые единицы

- ключевые слова – термины, относящиеся к основному содержанию текста и повторяющиеся в нем несколько раз

- ключевые словосочетания – сочетания слов, среди которых есть ключевые слова

- ключевые предложения – предложения, содержащие два и более ключевых слов

В качестве смысловых единиц реферата могут быть:

1. полное (без изменения) ключевое предложение исходного текста

2. перефразированное ключевое предложение

3. предложение, составленное из ключевых слов или словосочетаний с помощью связующих элементов

4. предложение, обобщающее несколько предложений исходного текста, не обязательно ключевых

Смысловыми единицами аннотации могут быть:

1. ключевые слова или словосочетания исходного текста с предшествующими им словами-реляторами (заранее заготовленные слова)

2. специальные предложения исходного текста, содержащие оценочные элементы («рассматривается важная проблема», «ставится задача»)

Комп должен уметь:

1. находить в тексте ключевые слова, словосочетания, предложения

2. находить в тексте менее значимые единицы

3. составлять из текстовых единиц (ключевых слов, словосочетаний) смысловые единицы реферата

4. составлять предложения – текст реферата

Рефераты – в табличном/текстовом виде.

Ключевые слова и словосочетания используются компьютером для построения табличных рефератов.

Методы автоматического реферирования и аннотирования текстов:

- статистический – где ключевое слово – знаменательное слово текста, которое с учетом всех его синонимов встречается в тексте наибольшее число раз. Ключевое предложение – предложение, где два и более ключевых слов.

Принадлежность слова, словосочетания к числу ключевых определяется специальным статистическим коэффициентом.

- позиционный – где ключевое предложение – это предложение, входящее в заголовок, подзаголовок, начало и конец некоторого фрагмента текста

- логико-семантический – где ключевое предложение – это предложение с наибольшим функциональным весом, на величину которого влияют разные факторы (связь с левым и правым предложениями, наличие в предложении семантически значимых слов)

Составление реферата (аннотации) статистическим методом

Используя для выделения ключевых слов текста, один из вариантов статистического метода = F*m / N*n

F – частота употребления слова в тексте

m – число абзацев, в которых встретилось слово

N – число слов в тексте

n – число абзацев в тексте

а) Составить алгоритм, позволяющий получить аннотацию текста в виде релятора со следующими за ним ключевыми словосочетаниями текста. Ключевым словосочетанием – ключ, имя существительное со стоящими перед ним определением, выраженным именем прилагательным или причастием, не относящихся к числу общеупотребительных.

б) словесный реферат текста в виде последовательной цепочки ключевых предложений. Ключевым считается предложение, содержащее три и более ключевых слов.

Словоупотребление – это цепочка символов, заключенных между двумя знаками пробелов. Словоупотребление, находящееся вне текста (предложения) является словоформой.

Несколько словоформ, имеющие одинаково лексическое значение образуют слово (лексему). Цепочка словоупотреблений между двумя знаками конца предложения – предложение.

Алгоритм решения задачи