Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
SIT.doc
Скачиваний:
38
Добавлен:
27.10.2018
Размер:
275.97 Кб
Скачать
  1. Прикладные инструментальные средства

Различные средства разработки ПО: языки и системы программирования

Язык программирования - искусственный язык, используемый для представления алгоритма решения задачи в виде, понятном компу. 4 типа:

1) я ассемблера (действия алгоритма представлены в виде машинных кодов)

2) я системного уровня (в виде отдельных англ слов или их частей),

3) я описания сценариев (для связ-я готовых прог в новые более сложн прог)

4) я промежуточного типа (2+3)

Система программирования - интегрированный набор средств разработки программ, обычно включающий яз программирования, средства компоновки и отладки прогр, а также обширную библиотеку готовых к использованию программных модулей.

23. Компьютерная лингвистика как наука о принципах и способах моделирования ея на пк. Основные приложения кл.

Термин «прикл лингв-ка» возник в сер 20 в = инженерная/ комп/ структурн л-ка

Прикл л-ка делится на: квантитативную (матем) (изучает статистику, количеств методы исследования) и компьютерную (вычислит., инженерн) (разрабатывает автоматизиров системы обработки текст. и реч. сообщений, т.е. лингв процессоров)

КЛ – раздел прикладного языкознания, кот. разрабатывает теорию моделирования языка, речи, речемыслительной деятельности чела, и представляет свои результаты в виде алгоритмов и программ.

Науки, связанные с КЛ: кибернетика, математика, статистика, теория вероятности, теория алгоритмов, психология, лингводидактика.

Приоритетные направления. Разработка/создание:

- лингвистического обеспечения систем И интеллекта (напр., информацион. экспертн. систем)

- систем автоматического распознавания и синтеза речи

- автоматизирован систем поиска информации

- автоматич переводных словарей

- методов автоматическ. компресии текста (аннотирования, реферирования)

- системы машинного перевода

- систем автоматич атрибуции текста, т.е. опред-е принадл-сти текста

- лингвистического обеспечения автоматизир систем управления

- стандартизация научно-технич терминологии

Метод решения задач КЛ

Метод моделирования

Модель – формализ описание объекта, системы, нескольких объектов, процесса или явления, выраженных конечным набором предложений языка, таблицами, схемами.

Св-ва модели:

  • М не д б сложнее оригинала

  • М – упрощенный аналог изучаемого явления или объекта

  • М д отражать наиболее существ черты

  • М д б логически правильной, не содержать противоречий

  • Максимально экономичной

Виды моделей:

  • структурные (для изучения внутренней структуры)

  • функц-е (поведение объекта)

  • динамические

Приложения КЛ

- Системы искусственного интеллекта (автом обуч системы, обработка текстов, перевод)

- Системы автоматич аннотир, реферир, индексир текста.

24. Методы автоматич аннотирования и реферирования текста

Реферат – связный текст, который кратко выражает центральную тему или предмет какого-либо документа, а также цель, применяемые методы и основные результаты описанного исследования или разработки. Процесс составления реферата – реферирование.

Аннотация – краткое изложение содержания документа, дающее общее представление о его теме. Процесс составления аннотации – аннотирование.

Методы аннотирования и реферирования:

1) Статистические (их целая группа,1 из первых – метод Швайсхаймера)

Ключевыми считаются такие знаменательные слова текста, которые с учетом всех синонимов встречаются в тексте наибольшее число раз. Ключевое предложение – а) имеет несколько ключевых слов, б) содержит их на небольшом расстоянии друг от друга. Принадлежность слова, СС, предложения к ключевым определяется специальными статистическим коэффициентами.

Основные этапы авт. анн-ния и реф-ния на основе статистич. метода:

  1. составление алфавитно-частотных словарей словоформ абзацев

  2. создание распределительного алф-частотного словаря (ук-тся абсолютн. частота слова в тексте, число и №№ абзацев)

  3. создание словаря потенциальных ключевых (опорных) словоформ текста (минус общеупотреб и служебн. слова, объединение грам форм и синонимов)

  4. создание словарей главных и ключевых словоформ текста (сокращение с помощью коэф-та вожности слова)

  5. выделение ключ словосоч-ний для аннотации (ключ существит-е + словоформа перед ним)

  6. выделе ключ предлож для реферата (более 3 главн или второстеп опорных словоформ)

  7. печать аннотации на экране (фраза-релятор (клише: в тексте реч идет) либо оценочное предлож (важн аспектом явл-ся) + ключ словосочетания)

  8. печать реферата (полные ключ предложения)

Кваж=F*m/N*n, где F – абсол. Частота слова в тексте; m – кол-во абзацев, в которых встретилась словоформа; N – общее число слов в тексте; n – общее число абзацев в тексте.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]