- •I часть. «Прикладная и компьютерная лингвистика»
- •Язык и теория знаков. Семиотика (предмет, объект, методы, задачи).
- •Структурная и Математическая лингвистика. Моделирование в лингвистике. Понятие лингвистической модели. Основные требования к модели. Понятие формализации.
- •Аналитический вид
- •Синтетический вид
- •Языки и модели представления знаний и семантики (семантические сети, фреймы, логика предикатов, продукции, сценарии и др.).
- •Лингвистические модели (исследовательские, модели анализа и синтеза, порождающие). Задачи Теории формальных языков. Иерархия Хомского.
- •Иерархия Хомского:
- •Компьютерные программы поддержки лексикографических работ
- •Новые разработки в лексикографии
- •Основные понятия
- •Типы корпусов
- •Основные требования к корпусам и основная задача
- •Опыт разработки корпусов текстов
- •Технологии анализа и синтеза естественного языка. Области использования. Уровневый анализ ея, начиная с технологий ocr/icr и т.Д.
- •Морфологический анализ. Виды ма. Лингвистическое обеспечение морфоанализаторов (словарь Зализняка и др.). Лексико-грамматический анализ и разметка (pos-tagging). Области применения.
- •Синтаксический анализ, задачи вывода и разбора (формальные грамматики, модели составляющих и зависимостей, нисходящий и восходящий парсинг).
- •Формальные системы, используемые в автоматизированных и синтаксических анализах.
- •3 Основных способа представления синтаксической структуры предложения.
- •Дерево вывода.
- •Стилистика. Прикладной характер стилистических исследований. Стилистические средства языка. Функциональные стили речи. Основные особенности.
- •II) Некоторые понятия звуковых технологий
- •Синтез речи – задачи и принцип работы систем. Методы синтеза речи, способы моделирования человеческой речи, типы синтезаторов речи. Системы синтеза текст-речь.
- •II)Классификация программ call.
- •III)Дистанционное обучение ( Distant Learning)
- •3 Основных компонента в www:
- •2.2 Гипертекстовая технология
- •Как указывать ключевые слова?
- •Социолингвистика
- •Информационный язык
- •Прямой поиск
- •Инвертированный файл
- •Область технической коммуникации как новое направление прикладной лингвистики. Компетенции разработчика технической документации. Стандартизация документов.
- •Прикладная и теоретическая лингвистика – проблемы взаимовлияния.
Структурная и Математическая лингвистика. Моделирование в лингвистике. Понятие лингвистической модели. Основные требования к модели. Понятие формализации.
Общим признаком описания специализированных искусственных языков является формальный метод их описания. Математическая лингвистика является смежной со структурной и компьютерной лингвистикой.
В Математической лингвистике используются широко известные в информатике структуры:
1. формальные грамматики
2. синтаксические диаграммы
3. БНФ
Структурная и математическая лингвистика.
На пересечении методов классификации языкознания, логики, математики и семиотики выросла современная структурная лингвистика. Это целая наука о методах моделирования в языкознании. На границе между лингвистикой и математикой проявилась математическая лингвистика. Появление данной науки было связано с появлением структуры языка, подхода к языку как системе, осознание языковой системы как сложной структуры, выявление разных типов отношений между лингвистическими объектами и их атрибутами.
Основной предмет этих двух дисциплин – разработка и совершенствование структурных и формальных методов анализа описания языка.
Математическая лингвистика разрабатывает формальный аппарат для описания естественных и некоторых искусственных языков. В ней используются идеи и методы алгебры, теории алгоритмов и автоматов.
Моделирование в компьютерной лингвистике. Модели знаний в искусственном интеллекте.
В разных науках приходится иметь дело с различными моделями (образцами) тех или иных объектов исследования этих наук. В лингвистике объектом исследования является язык, следовательно, будем рассматривать именно моделирование языковых способностей человека на основе моделирования знаний, что является одной из центральных задач Искусственного Интеллекта и компьютерной лингвистики.
Любая формальная модель предполагает наличие однозначно заданных объектов, связывающих их отношений и правил обращения с ними.
Модели в лингвистике это:
а) описание (задание формы) текста (формальным методом);
б) способ записи некоторых данных или текста (символьный, графический);
в) метаязык, в терминах которого фиксируются исходные данные для построения правильных текстов.
Метод моделирования языка и языковых процессов широко используется лингвистами, т.к. дает возможность реализовать теоретические знания на практике. Прикладная лингвистика стремится строить модели, отображающие конкретные процессы речемыслительной деятельности человека в той или иной ситуации.
Моделирование языкового и человеческого мышления – это задачи «Искусственного Интеллекта» как одного из ведущих научных направлений информатики, которое занимается созданием машин, способных понимать, моделировать и анализировать тексты, хранить и перерабатывать информацию, принимать решения. Моделирование языка необходимо для полноценного общения в человеко-компьютерной среде, а моделирование логических рассуждений – для решения различных задач интеллектуальной системой (ИС). Система «Искусственного Интеллекта» должна решать творческие задачи и вести диалог с человеком на основе заложенных в нее знаний (процедурных и декларативных). Примером интеллектуальной искусственной системы является Экспертная система (ЭС). Качество ЭС определяется в первую очередь тем, насколько естественно общение с ней человека при решении задач.
Структура экспертной системы
пользователь
Моделирование и формализация. Понятие модели. Лингвистическая модель
Моделирование в науке – это выяснение свойств какого-либо предмета при помощи его модели.
Модель – это некоторый объект, заменяющий исследуемый объект с сохранением свойственных ему свойств
Существуют разнообразные модели: математические, лингвистические, кибернетические и т.д.
Моделирование – это метод познания, состоящий в создании и исследовании моделей.
Основные принципы формализации:
На начальном этапе моделирования выделяются существенные признаки изучаемого объекта и дается развернутое содержательное описание связи между ними (системный анализ), т.е. осуществляется неформальная постановка задачи.
Формализация содержательного описания связей между выделяемыми признаками с помощью некоторого языка: языка схем, языка математики и т.д. (перевод полученной структуры в какую-либо заранее определенную форму)
Формализация – это процесс построения информационных моделей с помощью формальных языков.
Одним из самых распространенных формальных языков является алгебраический язык формул математики, который позволяет описывать функциональную зависимость между величинами. Модели, построенные с использованием понятных формул, называются математическими моделями.
Моделирование любой системы невозможно без предварительной формализации, т.к. это первый и очень важный этап моделирования.
В тех случаях, когда моделирование ориентируется на исследование модели с помощью компьютера, результатом формальной модели должно быть программное средство, поэтому принцип формирования моделирования сформировался в следующем виде:
разработка неформализованного описания модели (слов. описание)
составление формализованного описания на некотором языке кодирования
реализация формализованного описания в виде программы на некотором языке программирования.
Лингвистическая модель
Лингвистическая модель – это модель некоторого языка, имеет вид формализованной записи, позволяющая получать правильные тексты.
Любая формальная модель предполагает наличие однозначно заданных объектов, связывающих их отношений и правил обращения с ними.
Задачи:
описание текста формальными методами;
способ записи некоторых данных или текста (символьных, графических);
метаязык, в терминах, которые фиксируют исходные данные для построения правильных текстов.
Таким образом, модель в лингвистике – синоним формальной структуры с фиксированным метаязыком, служащий образцом для исследования порождаемого языка, анализа его характера и функций.
Метаязык – это формальная грамматика, изложенная по определенным правилам.
В зависимости от области применения, модели делятся на синтаксическую, фонологическую, морфологическую, лексическую.
Существует два вида моделей: аналитический и синтетический.