Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Voprosy_TiPL.doc
Скачиваний:
5
Добавлен:
21.04.2019
Размер:
1.1 Mб
Скачать

Обучение и самообучение (machine learning)

Активно развивающаяся область искусственного интеллекта. Включает модели, методы и алгоритмы, ориентированные на автоматическое накопление и формирование знаний на основе анализа и обобщения данных [Гаек, Гавранек, 1983; Гладун, 1994; Финн, 1991]. Включает обучение по примерам (или индуктивное), а также традиционные подходы из теории распознавания образов.

В последние годы к этому направлению тесно примыкают стремительно развивающиеся системы data mining - анализа данных и knowledge discovery - поиска закономерностей в базах данных.

Распознавание образов (pattern recognition)

Традиционно - одно из направлений искусственного интеллекта, берущее начало у самых его истоков, но в настоящее время практически выделившееся в самостоятельную науку. Ее основной подход - описание классов объектов через определенные значения значимых признаков. Каждому объекту ставится в соот- ветствие матрица признаков, по которой происходит его распознавание. Процедура распознавания использует чаще всего специальные математические процедуры и функции, разделяющие объекты на классы. Это направление близко к машинному обучению и тесно связано с нейрокибернетикой [Справочник по ИИ, 1990].

Новые архитектуры компьютеров (new hardware platforms and architectures)

Самые современные процессоры сегодня основаны на традиционной последовательной архитектуре фон Неймана, используемой еще в компьютерах первых поколений. Эта архитектура крайне неэффективна для символьной обработки. Поэтому усилия многих научных коллективов и фирм уже десятки лет нацелены на разработку аппаратных архитектур, предназначенных для обработки символьных и логических данных. Создаются Пролог- и Лисп-машины, компьютеры V и VI поколений. Последние разработки посвящены компьютерам баз данных, параллельным и векторным компьютерам [Амамия, Танака, 1993].

И хотя удачные промышленные решения существуют, высокая стоимость, недостаточное программное оснащение и аппаратная несовместимость с традиционными компьютерами существенно тормозят широкое использование новых архитектур.

Игры и машинное творчество

Это, ставшее скорее историческим, направление связано с тем, что на заре исследований ИИ традиционно включал в себя игровые интеллектуальные задачи - шахматы, шашки, го. В основе первых программ лежит один из ранних подходов - лабиринтная модель мышления плюс эвристики. Сейчас это скорее коммерческое направление, так как в научном плане эти идеи считаются тупиковыми.

Кроме того, это направление охватывает сочинение компьютером музыки [Зарипов, 1983], стихов, сказок [Справочник по ИИ, 1986] и даже афоризмов [Любич, 1998]. Основным методом подобного "творчества" является метод пермутаций (перестановок) плюс использование некоторых баз знаний и данных, содержащих результаты исследований по структурам текстов, рифм, сценариям и т. п.

Искусственный интеллект - это одно из направлений информатики, целью которого является разработка аппаратно-программных средств, позволяющих пользователю-непрограммисту ставить и решать свои, традиционно считающиеся интеллектуальными задачи, общаясь с ЭВМ на ограниченном подмножестве естественного языка.

Среди множества направлений искусственного интеллекта есть несколько ведущих, которые в настоящее время вызывают наибольший интерес у исследователей и практиков. Опишем их чуть подробнее.

Представление знаний и разработка систем, основанных на знаниях (knowledge-based systems)

Это основное направление в области изучения искусственного интеллекта. Оно связано с разработкой моделей представления знаний, созданием баз знаний, образующих ядро экспертных систем. В последнее время включает в себя модели и методы извлечения и структурирования знаний и сливается с инженерией знаний. Именно исследованиям в этой области посвящена данная книга. Подробнее см. гл. 2-5.

Программное обеспечение систем ИИ (software engineering for AI)

В рамках этого направления разрабатываются специальные языки для решения интеллектуальных задач, в которых традиционно упор делается на преобладание логической и символьной обработки над вычислительными процедурами. Эти языки ориентированы на символьную обработку информации - LISP, PROLOG, SMALLTALК, РЕФАЛ и др. Помимо этого создаются пакеты прикладных программ, ориентированные на промышленную разработку интеллектуальных систем, или программные инструментарии искусственного интеллекта, например KEE, ARTS, G2 [Хейес-Рот и др., 1987; Попов, Фоминых, Кисель, Шапот, 1996]. Достаточно популярно также создание так называемых пустых экспертных систем или "оболочек" - KAPPA, EXSYS, M1, ЭКО и др., базы знаний которых можно наполнять конкретными знаниями, создавая различные прикладные системы.  

Разработка естественно-языковых интерфейсов и машинный перевод (natural language processing)

Начиная с 50-х годов одной из популярных тем исследований в области ИИ является компьютерная лингвистика, и, в частности, машинный перевод (МП). Идея машинного перевода оказалась совсем не так проста, как казалось первым исследователям и разработчикам.   Уже первая программа в области естественно-языковых (ЕЯ) интерфейсов - пе- реводчик с английского на русский язык - продемонстрировала неэффективность первоначального подхода, основанного на пословном переводе. Однако еще долго разработчики пытались создать программы на основе морфологического анализа. Неплодотворность такого подхода связана с очевидным фактом: человек может перевести текст только на основе понимания его смысла и в контексте предшествующей информации, или контекста. Иначе появляются переводы в стиле "Моя дорогая Маша - my expensive Masha". В дальнейшем системы МП усложнялись и в настоящее время используется несколько более сложных моделей:

-применение так называемых "языков-посредников" или языков смысла, в результате происходит дополнительная трансляция "исходный язык оригинала - язык смысла - язык перевода";

-ассоциативный поиск аналогичных фрагментов текста и их переводов в специальных текстовых репозиториях или базах данных;

-структурный подход, включающий последовательный анализ и синтез естественно-языковых сообщений. Традиционно такой подход предполагает наличие нескольких фаз анализа:

1.     Морфологический анализ - анализ слов в тексте.

2.     Синтаксический анализ - разбор состава предложений и грамматических связей между словами.

3.     Семантический анализ - анализ смысла составных частей каждого предложения на основе некоторой предметно-ориентированной базы знаний.

4.     Прагматический анализ - анализ смысла предложений в реальном контексте на основе собственной базы знаний.

Синтез ЕЯ -сообщений включает аналогичные этапы, но несколько в другом порядке.

Интеллектуальные роботы (robotics)

Идея создания роботов далеко не нова. Само слово "робот" появилось в 20-х годах, как производное от чешского "робота" - тяжелой грязной работы. Его автор - чешский писатель Карел Чапек, описавший роботов в своем рассказе "Р.У.Р".

Роботы - это электротехнические устройства, предназначенные для автоматизации человеческого труда.

Можно условно выделить несколько поколений в истории создания и развития робототехники:

I поколение. Роботы с жесткой схемой управления. Практически все современные промышленные роботы принадлежат к первому поколению. Фактически это программируемые манипуляторы.

II поколение. Адаптивные роботы с сенсорными устройствами. Есть образцы таких роботов, но в промышленности они пока используются мало.

III поколение. Самоорганизующиеся или интеллектуальные роботы. Это - конечная цель развития робототехники. Основные нерешенные проблемы при создании интеллектуальных роботов - проблема машинного зрения и адекватного хранения и обработки трехмерной визуальной информации.

В настоящее время в мире изготавливается более 60 000 роботов в год. Фактически робототехника сегодня - это инженерная наука, не отвергающая технологий ИИ, но не готовая пока к их внедрению в силу различных причин.

Обучение и самообучение (machine learning)

Активно развивающаяся область искусственного интеллекта. Включает модели, методы и алгоритмы, ориентированные на автоматическое накопление и формирование знаний на основе анализа и обобщения данных [Гаек, Гавранек, 1983; Гладун, 1994; Финн, 1991]. Включает обучение по примерам (или индуктивное), а также традиционные подходы из теории распознавания образов.  В последние годы к этому направлению тесно примыкают стремительно развивающиеся системы data mining - анализа данных и knowledge discovery - поиска закономерностей в базах данных.

Распознавание образов (pattern recognition)

Традиционно - одно из направлений искусственного интеллекта, берущее начало у самых его истоков, но в настоящее время практически выделившееся в самостоятельную науку. Ее основной подход - описание классов объектов через определенные значения значимых признаков. Каждому объекту ставится в соот- ветствие матрица признаков, по которой происходит его распознавание. Процедура распознавания использует чаще всего специальные математические процедуры и функции, разделяющие объекты на классы. Это направление близко к машинному обучению и тесно связано с нейрокибернетикой [Справочник по ИИ, 1990].

Новые архитектуры компьютеров (new hardware platforms and architectures)

Самые современные процессоры сегодня основаны на традиционной последовательной архитектуре фон Неймана, используемой еще в компьютерах первых поколений. Эта архитектура крайне неэффективна для символьной обработки. Поэтому усилия многих научных коллективов и фирм уже десятки лет нацелены на разработку аппаратных архитектур, предназначенных для обработки символьных и логических данных. Создаются Пролог- и Лисп-машины, компьютеры V и VI поколений. Последние разработки посвящены компьютерам баз данных, параллельным и векторным компьютерам [Амамия, Танака, 1993].  И хотя удачные промышленные решения существуют, высокая стоимость, недостаточное программное оснащение и аппаратная несовместимость с традиционными компьютерами существенно тормозят широкое использование новых архитектур.

Игры и машинное творчество

Это, ставшее скорее историческим, направление связано с тем, что на заре исследований ИИ традиционно включал в себя игровые интеллектуальные задачи - шахматы, шашки, го. В основе первых программ лежит один из ранних подходов - лабиринтная модель мышления плюс эвристики. Сейчас это скорее коммерческое направление, так как в научном плане эти идеи считаются тупиковыми.  Кроме того, это направление охватывает сочинение компьютером музыки [Зарипов, 1983], стихов, сказок [Справочник по ИИ, 1986] и даже афоризмов [Любич, 1998]. Основным методом подобного "творчества" является метод пермутаций(перестановок) плюс использование некоторых баз знаний и данных, содержащих результаты исследований по структурам текстов, рифм, сценариям и т. п.

Другие направления

ИИ - междисциплинарная наука, которая, как мощная река по дороге к морю, вбирает в себя ручейки и речки смежных наук. Выше перечислены лишь те направления, которые прямо или косвенно связаны с основной тематикой учебника - инженерией знаний. Стоит лишь взглянуть на основные рубрикаторы конференций по ИИ, чтобы понять, насколько широко простирается область исследований по ИИ:

  генетические алгоритмы;

  когнитивное моделирование;

  интеллектуальные интерфейсы;

  распознавание и синтез речи;

  дедуктивные модели;

  многоагентные системы;

  онтологии;

  менеджмент знаний;

  логический вывод;

  формальные модели;

  мягкие вычисления и многое другое.

Разработка интеллектуальных систем, основанных на знаниях. До недавнего времени это направление считалось основным и наиболее плодотворным в развитии искусственного интеллекта. Оно связано с разработкой моделей представления знаний, созданием баз знаний, образующих ядро экспертных систем.

Нейросетевые и нейрокомпьютерные технологии. Это направление является альтернативным предыдущему как в идеологическом, так и в практическом плане. Искусственные нейронные сети и нейрокомпьютеры в значительной мере заимствуют принципы работы головного мозга. Знания в них не отделены от процессора, а равномерно распределены и существуют неявно в виде сил синаптических связей. Такие знания не закладываются изначально, а приобретаются в процессе обучения.

Распознавание образов. К распознаванию образов в искусственном интеллекте относят широкий круг проблем: распознавание изображений, символов, текстов, запахов, звуков, шумов. На рынке программных средств имеются системы, основанные на распознавании по признакам, оснащенные базами данных и знаний, имеющих возможность адаптации и обучения. Однако в последнее время становятся популярными гибридные системы, в которых наряду с технологиями экспертных систем используются и нейросетевые технологии.

Игры и творчество. Традиционно искусственный интеллект включает в себя интеллектуальные задачи, решаемые при игре в шахматы, шашки, го, каллах. В основе этого направления лежит один из ранних подходов - лабиринтная модель плюс эвристики. Кроме того, в современных программах-игроках наиболее полно удалось реализовать центральную идею искусственного интеллекта - обучение, самообучение и самоорганизацию.

В широком смысле слова под игрой понимается некая конфликтная ситуация, участники которой своими действиями не только достигают своих личных целей, но и влияют на достижимость целей другими участниками игры. Ясно, что под такое толкование игры подпадают многие экономические, политические и военные конфликты.

Компьютерное творчество представляет пока чисто теоретический интерес. Наибольший прогресс достигнут в сочинении компьютерной музыки. Разработаны различные модели художественного и поэтического творчества, имеющие больше познавательный, чем практический интерес.

Компьютерная лингвистика. Начиная с 50-х гг. XX в. и по настоящее время одной из популярных тем исследований искусственного интеллекта является область машинного перевода. Первая программа в этой области - переводчик с английского языка на русский. Первая идея - пословный перевод. В настоящее время используются более сложные структуры естественно-языковых интерфейсов, которые включают в себя:

  • морфологический анализ - анализ слов в тексте;

  • синтаксический анализ - анализ предложений, грамматики и связей между словами;

  • семантический анализ - анализ смысла каждого предложения на основе базы знаний, на которую ориентирована конкретная программа-переводчик;

  • прагматический анализ - анализ смысла предложений в окружающем контексте с помощью базы знаний.

Другой проблемой компьютерной лингвистики является разработка естественно-языкового интерфейса между человеком и машиной. Здесь немаловажную роль могут сыграть нейросетевые технологии, с помощью которых удается научить компьютер правильному произношению слов. В проектах создания компьютеров V и VI поколений решению этой проблемы уделено первостепенное внимание.

Интеллектуальные роботы. Роботы - это технические устройства, предназначенные для автоматизации человеческого труда. Само слово «робот» появилось в 20-х гг. XX в. Его автор - чешский писатель Карел Чапек.

В настоящее время в промышленности применяется огромное количество роботов-манипуляторов, работающих по жесткой схеме управления. В отличие от них интеллектуальные роботы обладают способностью самообучаться и самоорганизовываться, адаптироваться к изменяющейся окружающей обстановке.

Компьютерные вирусы. Сегодня трудно назвать компьютерного пользователя, избежавшего знакомства с этим видом программной продукции.

Последние поколения вирусов обладают всеми атрибутами систем искусственного интеллекта. Они свободно перемещаются по компьютерам, мутируют и размножаются, обучаются, меняют свои параметры и структуру.

Воздействие компьютерных вирусов значительно возросло с появлением сети Internet. По прогнозам специалистов, неприятности, которые мы испытываем сегодня, представляются ничтожными по сравнению с теми перспективами, которые ожидают нас с проникновением компьютерных вирусов в сферу интеллектуальных роботов.

Интеллектуальное математическое моделирование. Это компьютерное математическое моделирование с использованием методов искусственного интеллекта.

Интеллектуальные системы подобного рода имитируют творческую деятельность математика-профессионала, занимающегося решением краевых задач математической физики. Они обладают базами знаний, содержащими нужные теоремы, математические зависимости и эвристические правила, обобщающие опыт и интуицию математика-профессионала, способны к обучению с помощью учителя и к самообучению. 

Существуют различные подходы к построению систем ИИ. Это разделение не является историческим, когда одно мнение постепенно сменяет другое, и различные подходы существуют и сейчас. Кроме того, поскольку по-настоящему полных систем ИИ в настоящее время нет, то нельзя сказать, что какой-то подход является правильным, а какой-то ошибочным.

Для начала кратко рассмотрим логический подход. Почему он возник? Ведь человек занимается отнюдь не только логическими измышлениями. Это высказывание конечно верно, но именно способность к логическому мышлению очень сильно отличает человека от животных.

Основой для данного логического подхода служит Булева алгебра. Каждый программист знаком с нею и с логическими операторами с тех пор, когда он осваивал оператор IF. Свое дальнейшее развитие Булева алгебра получила в виде исчисления предикатов - в котором она расширена за счет введения предметных символов, отношений между ними, кванторов существования и всеобщности. Практически каждая система ИИ, построенная на логическом принципе, представляет собой машину доказательства теорем. При этом исходные данные хранятся в базе данных в виде аксиом, правила логического вывода как отношения между ними. Кроме того, каждая такая машина имеет блок генерации цели, и система вывода пытается доказать данную цель как теорему. Если цель доказана, то трассировка примененных правил позволяет получить цепочку действий, необходимых для реализации поставленной цели. Мощность такой системы определяется возможностями генератора целей и машиной доказательства теорем.

Конечно можно сказать, что выразительности алгебры высказываний не хватит для полноценной реализации ИИ, но стоит вспомнить, что основой всех существующих ЭВМ является бит - ячейка памяти, которая может принимать значения только 0 и 1. Таким образом было бы логично предположить, что все, что возможно реализовать на ЭВМ, можно было бы реализовать и в виде логики предикатов. Хотя здесь ничего не говорится о том, за какое время.

Добиться большей выразительности логическому подходу позволяет такое сравнительно новое направление, какнечеткая логика. Основным ее отличием является то, что правдивость высказывания может принимать в ней кроме да/нет (1/0) еще и промежуточные значения - не знаю (0.5), пациент скорее жив, чем мертв (0.75), пациент скорее мертв, чем жив (0.25). Данный подход больше похож на мышление человека, поскольку он на вопросы редко отвечает только да или нет. Хотя правда на экзамене будут приниматься только ответы из разряда классической булевой алгебры.

Для большинства логических методов характерна большая трудоемкость, поскольку во время поиска доказательства возможен полный перебор вариантов. Поэтому данный подход требует эффективной реализации вычислительного процесса, и хорошая работа обычно гарантируется при сравнительно небольшом размере базы данных.

Под структурным подходом мы подразумеваем здесь попытки построения ИИ путем моделирования структуры человеческого мозга. Одной из первых таких попыток был перцептрон Френка Розенблатта. Основной моделируемой структурной единицей в перцептронах (как и в большинстве других вариантов моделирования мозга) является нейрон.

Позднее возникли и другие модели, которые в простонародье обычно известны под термином "нейронные сети" (НС). Эти модели различаются по строению отдельных нейронов, по топологии связей между ними и по алгоритмам обучения. Среди наиболее известных сейчас вариантов НС можно назвать НС с обратным распространением ошибки, сети Хопфилда, стохастические нейронные сети.

НС наиболее успешно применяются в задачах распознавания образов, в том числе сильно зашумленных, однако имеются и примеры успешного применения их для построения собственно систем ИИ, это уже ранее упоминавшийся ТАИР.

Для моделей, построенных по мотивам человеческого мозга характерна не слишком большая выразительность, легкое распараллеливание алгоритмов, и связанная с этим высокая производительность параллельно реализованных НС. Также для таких сетей характерно одно свойство, которое очень сближает их с человеческим мозгом - нейронные сети работают даже при условии неполной информации об окружающей среде, то есть как и человек, они на вопросы могут отвечать не только "да" и "нет" но и "не знаю точно, но скорее да".

Довольно большое распространение получил и эволюционный подход. При построении систем ИИ по данному подходу основное внимание уделяется построению начальной модели, и правилам, по которым она может изменяться (эволюционировать). Причем модель может быть составлена по самым различным методам, это может быть и НС и набор логических правил и любая другая модель. После этого мы включаем компьютер и он, на основании проверки моделей отбирает самые лучшие из них, на основании которых по самым различным правилам генерируются новые модели, из которых опять выбираются самые лучшие и т. д.

В принципе можно сказать, что эволюционных моделей как таковых не существует, существует только эволюционные алгоритмы обучения, но модели, полученные при эволюционном подходе имеют некоторые характерные особенности, что позволяет выделить их в отдельный класс.

Такими особенностями являются перенесение основной работы разработчика с построения модели на алгоритм ее модификации и то, что полученные модели практически не сопутствуют извлечению новых знаний о среде, окружающей систему ИИ, то есть она становится как бы вещью в себе.

Еще один широко используемый подход к построению систем ИИ — имитационный. Данный подход является классическим для кибернетики с одним из ее базовых понятий - "черным ящиком" (ЧЯ). ЧЯ — устройство, информация о внутренней структуре и содержании которого отсутствует полностью, но известны входные и выходные данные. Объект, поведение которого имитируется, как раз и представляет собой такой "черный ящик". Нам не важно, что у него и у модели внутри и как он функционирует, главное, чтобы наша модель в аналогичных ситуациях вела себя точно так же.

Таким образом здесь моделируется другое свойство человека - способность копировать то, что делают другие, не вдаваясь в подробности, зачем это нужно. Зачастую эта способность экономит ему массу времени, особенно в начале его жизни.

Основным недостатком имитационного подхода также является низкая информационная способность большинства моделей, построенных с его помощью.

На практике очень четкой границы между подходами нет. Очень часто встречаются смешанные системы, где часть работы выполняется по одному типу, а часть по другому.

21 Границы предмета лингвистики. Язык как система систем.

Лингви́стика (языкозна́ниеязыкове́дение; от лат. lingua — язык) — наука, изучающая языки. Это наука о естественном человеческом языке вообще и обо всех языках мира как индивидуальных его представителях. В широком смысле слова лингвистика подразделяется на научную и практическую. Чаще всего под лингвистикой подразумевается именно научная лингвистика. Является частью семиотики как науки о знаках.

Лингвистика изучает не только существующие (существовавшие или возможные в будущем) языки, но и человеческий язык вообще. Язык не дан лингвисту в прямом наблюдении; непосредственно наблюдаемы лишь факты речи, или языковые явления, то есть речевые акты носителей живого языка вместе с их результатами (текстами) или языковой материал (ограниченное число письменных текстов на мёртвом языке, которым уже никто не пользуется в качестве основного средства общения).

Язык как система

О языке как о системе одним из первых заговорил Соссюр. Для него был важен термин «система». Термин «структура» ввели его ученики.

В наст.вр. под системой понимают совокупность взаимосвязанных и взаимообусловленных элементов.

Структура – строение и внутренняя форма организации системы.

В лингвистике выделяют два типа систем: гомогенные и гетерогенные.

  • Гомогенные – состоят из однородных элементов.

  • Гетерогенные – более сложная система, состоящая из разнообразных элементов. 

В них наблюдается деление на подсистемы.

Язык относится к гетерогенной системе. Он состоит из подсистем, которые не могут функционировать отдельно, следовательно, и являются частями единого целого. Подсистемами языка – называют уровнями или ярусами.

Система языка это прежде всего система систем, где каждая единица представляет отдельную систему с одной стороны, а с другой единицу в системе более высокого уровня.  Отношения и связи между единицами и подсистемами( то есть элементами языка)   -Материальные и семантические   -Функциональные и генетические   -Двусторонние и односторонние   -Одноуровневые и межуровневыми

В системе языка существуют уровни и ярусы, внутри которых -единицы. Между единицами, уровнями и ярусами существуют связи и отношения. Я зык и речь рассматриваются вместе, но это не одно и то же. Потому есть единицы и уровни языковые, есть речевые. например, \одна из речевых единиц звук в языке называется фонемой. Фраза- речевой уровень, предложение- языковой. Универсальная единица- слово.  Уровни- фонетико-фонологический, морфемный., словообразовательный, лексический. морфологический, синтаксический. Далее- текстовый, но он разработан слабо и не всеми принимается за языковой уровень. Есть единицы строевые, это единицы структуры в системе. Например, звук- строевая единица слога, слог-строевая единица слова и т. д. Минимальная произносительная единица в русском языке- слог.   Единицы фонологического уровня--- фонема (звук), морфема( со слогом не совпадает), лексема, семема, синтаксема ( суффикс -ема значит единица). Единицы фонетического уровня- звук, слог, слово, фонетическое слово, синтагма. фраза. Некоторые ученые к единицам другого качества относят ударение. Единицы лексического уровня- слова и устойчивые словосочетания( фразеологизмы). слово состоит из морфем - корень как лексическая единица, префикс. суффиксы. аффиксы, флексии как служебные морфемы. Служебные морфемы имеют два значения - грамматическое и лексическое( кроме флексий) Служебные морфемы кроме окончаний называются аффиксами. Корни имеют лексическое значение, в русском языке различают ещё основу слова. На синтаксическом уровне рассматриваются словосочетания с их отношениями и связями и предложения. Отношения в словосочетаниях и предложениях - атрибутивные, изъяснительные, обстоятельственные( много их) предикативные, полупредикативные и др. Связи- подчинение и сочинение. Предложение обязательно должно обладать свойством предикативности.

22 Использование лингвистической информации в системах распознавания речи.

Распознавание речи (иногда называемое распознаванием голоса) – это процесс преобразования акустического сигнала в некую абстрактную форму разговорного языка.

Он состоит из этапа преобразования голоса в текст и из этапа автоматической интерпретации семантики (смысла) речи. Распознаванием голоса часто называется также идентификация говорящего по голосу. Такие системы используются, например, в системах безопасности.

Основанием дальнейшей классификации систем речевой обработки сигналов могут являться, например, вид и сложность решаемых задач. Так если при синтезе речи необходимо воспроизводить ограниченное число фраз, их достаточно просто записать и реализовать механизм включения их воспроизведения в нужный момент. Если же число фраз велико или вообще не ограничено, такие методы не приносят результат;

Системы распознавания по сложности обычно делят на следующие группы:

- системы автоматического распознавания изолированных слов. То есть система должна распознавать пословно произносимые человеком команды;

- системы автоматического распознавания слитной речи. То есть система должна уметь выделять слова в естественном частично слитном потоке человеческой речи;

- системы понимания речи. То есть системы, которые наделены элементами интеллекта, что позволяет, во-первых, на основе смыслового анализа более правильно выделять слова в потоке речи, а, во-вторых, сохранять информацию в некой базе знаний, откуда она может быть легко извлечена для решения определенных интеллектуальных задач.

Также системы распознавания речи могут быть классифицированы по:

- размеру словаря. Под словарем понимается набор хранимых в системе единиц речи (например, слов, слогов, фонем-звуков);

- качеству распознавания (приемлемым считается процент ошибки распознавания неболее 5 процентов);

- по способу обработки входного сообщения;

- по степени зависимости от диктора.

Размер словаря системы распознавания голоса влияет на степень сложности, требования к процедурам обработки и точность системы. Одним системам для работы необходимо всего несколько слов (например, голосовые команды), а другим требуется большой словарь (например, диктофонные системы). Если единицей словаря является слово, то по объему словаря системы делятся обычно делятся на :

- системы с очень большим словарем – десятки тысяч слов;

- системы с большим словарем – тысячи слов;

- системы со средним словарем – сотни слов;

- системы с маленьким словарем – до сотни слов.

Качество распознавания на современном уровне, кроме низкого процента ошибки распознавания и надлежащего размера словаря предполагает независимость распознавания от диктора и способность обрабатывать непрерывную речь, то есть возможность пользователям говорить естественно (непрерывно), не делая пауз между словами.

Распознавание речи, зависимое от диктора подразумевает, что пользователь должен сначала научить систему распознавания своему голосу и только после этого система сможет функционировать. Независимое от диктора распознавание речи означает, что система способна распознать любую речь, независимо от того, кто говорит. Голосозависимые системы предназначены для одного конкретного пользователя. Такие системы обычно проще разрабатывать, они дешевле и работают более точно, хотя и менее гибки, чем независимые от диктора программы. Соответственно голосонезависимые программы способны работать с широким кругом пользователей и обладают болев высокой гибкостью, хотя и значительно более высокой ценой и несколько худшим качеством распознавания.

Распознавание речи происходит так: при помощи микрофона и оцифровывающего устройства (например, звуковой карты компьютера) и машинной обработки речевой сигнал фиксируется. Затем цифровой сигнал разбивается на неделимые интервалы, каковыми могут быть фонемы (элементарные звуки речи), слоги, слова. На основе контекста, шаблонов речи, некоторых акустических признаков слова объединяются в логические единицы - фразы и предложения. Затем эти логические единицы анализируются и переводятся в действительные команды или сообщения, которые понятны конкретной программе.

Распознавание речи — процесс преобразования речевого сигнала в текстовый поток.

В наше время диалог является обычным делом. Существуют целые системы, в которых все построено на беседе человека с машиной. Ты ей задаешь вопросы, а она тебе отвечает, и все это в порядке вещей. Успешное построение систем речевого ввода-вывода зависит от многих условий, к числу которых могут быть отнесены следующие:

-Вид речи (пословные реализации с паузами, слитная речь);

-Тип произнесения и стиль произношения;

-Число пользователей;

-Спектр входного сигнала;

-Настройка системы (на весь словарь или часть словаря);

-Объем словаря;

-Синтаксические ограничения (типовые фразы, искусственный язык);

-Характер построения речи (диалогическая речь, монологическая речь);

-Надежность распознавания;

-Время распознавания (в реальном или не в реальном масштабе времени);

-Размер памяти, к которой нужно обращаться в единицу времени;

-Организация системы (наличие обратной связи, параллельной обработки);

-Характер шума помещения;

-Степень тренировки пользователей (дикторов) и т.д.

Известно, что информация, необходимая для правильной интерпретации высказывания, не содержится полностью и однозначно во входном акустическом сигнале, а синтаксические (грамматические), семантические (смысловые) и прагматические (ситуативно обусловленные) ограничения в языке используются для того, чтобы компенсировать ошибки и устранить двусмысленность, возникающую при акустической реализации высказывания. Этот факт подтверждается данными восприятия речи человеком, поэтому в некоторых системах предпринимается попытка смоделировать основные особенности деятельности человека в процессе слушания-говорения.

Можно сказать, что имеющиеся или находящиеся пока еще в стадии разработки системы «человек-машина» основаны на методах распознавания со значительными ограничениями: это ограниченный и специализированный словарь, раздельное произнесение слов, один диктор и т.д. Подобная ситуация объясняется сложностью проблемы автоматического распознавания, а тем более понимания смысла речевого сообщения в виде слитно произнесенного текста. Набор разнообразных характеристик естественной речи в значительной степени усложняет ее обработку. Изменения в речи, получающиеся из-за использования микрофона (в зависимости от типа, дистанции, направленности), а также окружения (шум, колебания) делают задачу еще более сложной.

Для реализации систем «человек-машина» в наши дни используют два подхода: ГЛОБАЛЬНЫЙ (осуществляется общее распознавание изолированного слова или связного текста, но с сокращенным словарем и произнесенного одним диктором. АНАЛИТИЧЕСКИЙ (позволяет приступить к проблеме распознавания слитной речи, произнесенной большим числом дикторов). Он осуществляется в два этапа: в первую очередь распознаются звуки (фонемы, речь идет о «фонетическом» или «аналитическом» распознавании), затем обрабатывается информация «высшего» уровня (лексики используемых слов, структур произносимых фраз).

Процесс распознавания речи (глобальный или аналитический) начинается с анализа речевого сигнала, предварительно преобразованного в электрический сигнал с помощью микрофона. Который, в свою очередь преобразовывается в дискретный, т.е. в последовательность чисел с изменением амплитуды сигнала с соответствующими интервалами с помощью вычислительных машин. Чаще, однако, предпочитают работать со спектральным представлением сигнала с более продолжительными временными интервалами.

В системах общего распознавания необходима фаза обучения, во время которой пользователь произносит список слов с нужной лексикой. Для каждого произнесенного слова осуществляется акустический анализ и его результат вводится в запоминающее устройство ЭВМ.

Во время фазы распознавания при произнесении слова пользователем акустический образ распознаваемого слова сравнивается со словами-эталонами. Слово, наиболее схожее с произнесенным, распознается и воспроизводится. В наиболее простых и наиболее часто используемых системах один и тот же человек участвует в обучении и распознавании, т.е. речь идет о монодикторских системах.

Но ситуация не так проста, как может показаться на первый взгляд. Даже когда один и тот же человек произносит слово два раза подряд, наблюдаются существенные отличия в произнесенном. Для решения этой проблемы используется последовательность вычислений (алгоритм), определяющая оптимальный способ приведения в соответствие двух сравниваемых слов и устранения расхождения между их акуст. образами. Этот тип алгоритма относится к динамическому программированию.

Важное место в исследованиях занимает разработка общих методов распознавания слов, произнесенных без пауз. Трудности при решении проблемы возникают, с одной стороны, в результате коартикуляции звуков в потоке речи и, с другой – из-за сегментации звукового потока на отдельные слова. Преодолеть эти сложности помогает алгоритм динамического программирования. С помощью систем подобного рода распознают ключевые слова внутри фразы, не ограничиваясь словарем эталонов.

23 Существующие взгляды на объект и предмет лингвистики в целом и отдельных лингвистических дисциплин.

Про лингвистику см выше, лингвистические дисциплины вот:

Грамматика (от греч. γράμμα — «запись»), как наука, есть раздел языкознания, изучающий грамматический строй языка, закономерности построения правильных осмысленных речевых отрезков на этом языке (словоформсинтагмпредложенийтекстов). Эти закономерности грамматика формулирует в виде общих грамматических правил.

Морфоло́гия (от др.-греч. μορφή — «форма» и λόγος — «учение») — раздел лингвистики, основным объектом которого являются слова естественных языков и их значимые части (морфемы). В задачи морфологии, таким образом, входит определение слова как особого языкового объекта и описание его внутренней структуры

Си́нтаксис (от др.-греч. σύνταξις — «построение, порядок, составление») — раздел лингвистики, изучающий строение предложений исловосочетаний.

Лексиколо́гия (от др.-греч. λέξις — «слово, выражение», λόγος — «учение») — наука о слове; это раздел языкознания, изучающий словарный состав языка, или лексику. Лексикология делится на общую и частную. Частная лексикология изучает лексический состав какого-либо конкретного языка. В лексикологии рассматриваются:

  • слово и его значение

  • система взаимоотношений слов

  • история формирования современной лексики

  • функционально-стилевое различие слов в разных сферах речи

Сема́нтика (от др.-греч. σημαντικός — обозначающий) — раздел языкознания, изучающий значение единиц языка. В качестве инструмента изучения применяют семантический анализ.

Правописаниеорфогра́фия (др.-греч. ὀρθογραφία, от ὀρθός — «правильный» и γράφω — «пишу») — единообразие передачи слов и грамматических форм речи на письме. Также свод правил, обеспечивающий это единообразие, и занимающийся им раздел прикладного языкознания.

Фоне́тика (от греч. φωνή — «звук», φωνηεντικός — «звуковой») — раздел лингвистики, изучающий звуки речии звуковое строение языка (слоги, звукосочетания, закономерности соединения звуков в речевую цепочку).

Пунктуа́ция (ср.-век. лат. punctuatio — от лат. punctum — точка) — система знаков препинанияв письменности какого-либо языка, а также правила их постановки в письменной речи.

ОБЪЕКТ (от лат. objectum – букв. 'брошенное перед чем-л.'), то, что воспринимается, мыслится, обсуждается и обрабатывается, в отличие от субъекта (того, кто это воспринимает, мыслит, обсуждает и обрабатывает).

Логико-философский термин «объект» имеет в лингвистике несколько классов употреблений. Он по-разному преломляется (а) в металингвистике (а именно, в философии и методологии языкознания) и (б) в естественно-языковой онтологии (в философии языка).

В металингвистике под объектом понимается то, что изучает лингвистика (речь идет об объекте лингвистики в целом или об объектах отдельных лингвистических дисциплин). В соответствии с принципами современной методологии науки (вслед за Г.П.Щедровицким) объект науки принято отличать от ее предмета. В частности, основной объект лингвистики (язык как система, как общественное явление и т.д.) не является наблюдаемым феноменом, доступным прямому изучению; основным предметом лингвистики является речь. Так, объектом славистики как лингвистической дисциплины является реально существовавший в древности праславянский язык и его потомки (живые и мертвые славянские языки), а ее основным предметом – славянская речь, т.е. доступное наблюдению множество письменных памятников на славянских языках (как живых, так и мертвых) плюс множество наблюдаемых речевых актов на живых славянских языках. Объект науки существует до самой науки и независимо от того, подвергся ли он изучению; предметом науки он становится только в результате сознательной деятельности ученых, причем не в полном объеме, а лишь в своей доступной наблюдению части (например, древний язык – в той мере, в какой он воплощен во множестве археологических находок).

В логике науки принято, вслед за А.Тарским, Р.Карнапом, У.О.Куайном, отличать язык-объект (т.е. язык, подлежащий изучению) от метаязыка (т.е. языка, на котором описывается язык-объект).

В лингвистической терминологии имеются специальные термины для объектов лингвистических дисциплин (в отличие от самих дисциплин).

В структурной лингвистике языковыми (лингвистическими) объектами часто называют языковые единицы – как двусторонние (знаки), так и односторонние (компоненты простых знаков, фигуры).

В некоторых концепциях языковыми (лингвистическими) объектами считаются не только т.н. «языковые единицы», но также и их дифференциальные признаки, их отношения, их классы и комплексы.

В философии языка (естественно-языковой онтологии) объектом («внеязыковым объектом» //«предметом» //«субстанцией») считается то, что воспринимает, мыслит, упоминает и обрабатывает носитель языка, в отличие от субъекта – т.е. самого носителя языка. Объекты – это потенциальные референты (обозначаемые) речевых единиц или потенциальные денотаты (означаемые) языковых знаков. Возможен широкий и узкий подходы к объекту. При более широком подходе объектами считаются, в частности, означаемые отпредикатных существительных и номинализованных (подчиненных) пропозиций – т.е. признаки, свойства, состояния, отношения предметов, процессы и т.п.; при более узком понимании понятие объекта охватывает только собственно объекты – непредицируемые сущности. В последний класс при более широком подходе включаются как непредметные объекты (положения дел, ситуации, факты), так и предметные. Первые могут вступать в отношения временной координации (таковы, напр., события), вторые – нет. При более узком подходе объектами считаются только предметы. Предметы, в свою очередь, классифицируются на разных основаниях. Так, выделяются:

(а) объекты физические (материальные, конкретные), вступающие в отношения пространственной координации и обладающие такими параметрами, как 'внешний вид', 'вес', 'протяженность', 'цвет', 'температура', 'запах', 'вкус', 'ощупь', 'консистенция' (именно они считаются собственно предметами), в отличие от идеальных, бесплотных, абстрактных объектов // абстрактных сущностей (ср. 'наука', 'искусство', 'власть', 'экономика'), параметров ('вес', 'цена', 'рост', 'цвет' и т.п.), мер ('литр', 'метр', 'сажень' и т.п.);

(б) объекты исчисляемые//вещественные ('огурец', 'репа', 'зерно//зернышко', 'лист', 'студент', 'буржуа', как штучные объекты) и неисчисляемые//невещественные ('молоко', 'зерно', 'листва', 'огурцы' 'репа' как материальная масса и 'студенчество', 'буржуазия', как социальная масса); при более узком подходе лишь вторые (обладающие параметром 'граница') считаются собственно объектами, а первые заносятся в категорию масс (физические массы называются также веществами или субстанциями в узком смысле);

(в) объекты отдельные ('министр', 'сенатор', 'корабль') в отличие от коллективных или групповых ('министерство', 'сенат', 'флотилия'); последние попадают в категорию 'собирательных сущностей' (собирательности);

(г) объекты одушевленные (в том числе 'покойник', 'мертвец', 'натурщица', 'фотомодель', '[профессиональный] редактор' и т.п.) в отличие от неодушевленных объектов – т.н. 'вещей' (напр., 'труп', 'тело', 'изваяние', 'статуя', 'портрет', 'изображение' и т.п.); первые иногда зачисляются в категорию – 'существа'; однако термин 'вещь' порой охватывает и 'существа'; ядро существ составляют 'лица'; 'лица' подразделяются на 'мужчин'и 'женщин' и т.п.); среди вещей выделяются 'статичные' (собственно вещи) vs. 'динамичные' (способные двигаться или воздействовать на другие предметы): 'ветер', 'молния', 'корабль', 'машина', 'компьютер', '[текстовый] редактор' и т. п.; среди вещей выделяются, кроме того, обычные vs. персонифицированные объекты ('оловянный солдатик', 'ферзь', 'дамка', 'валет', 'кукла', 'плюшевый медвежонок' и т.п.);

(д) объекты универсальные (генерические //родовые) vs. конкретно-референтные (индивидные); разновидностью последних являются инстанции – временные срезы объектов в тот или иной момент их существования (ср. 'прохожий', 'дама у окна', 'пассажир с чемоданом' и т.п.); разновидностью родовых объектов являются 'типы', 'сорта', 'марки' и т.п.;

(е) объекты определенные и неопределенные; объект может быть выбираемым//неединственным vs. единственным//уникальным (в данной ситуации), известным (в т.ч. введенным) vs. неизвестным (//новым, в т.ч. вводимым), фиксированным vs. нефиксированным;

(ж) объекты единичные ('грудьсинг.', 'уссинг.', 'валеноксинг.', 'граблисинг.', 'санисинг.', 'ножницысинг.', 'часысинг.', 'Химки'), единично-парные (усыдвойств., 'валенкидвойств.', 'грудидвойств.', 'Петя с Ваней'), множественные (напр., 'двадцать один чемодан', 'три часа', 'каждую неделю'), множественно-парные (ср. 'усымнож.', 'валенки множ.');

(з) объекты существующие ('приз' во фразе 'я выиграл приз') vs. несуществующие ('приз' во фразе 'если я выиграю приз');

(и) объекты реальные ('квадрат с закругленными углами', 'стеклянная сковородка', 'вафельный стаканчик'; в том числе более привычные, как 'несъедобная тарелка', vs. менее привычные, как 'съедобная тарелка': ср. непривычность буквального смысла 'Я три тарелки съел') и нереальные ('жена Лермонтова', 'царь СССР', 'летучие крокодилы'); при этом в воображаемых мирах объекты тоже бывают реальные ('Онегин', 'невеста Ленского') и нереальные ('жена Ленского'), а также стоящие вне противопоставления по реальности ('тетка Онегина', 'племянница Онегина');

(к) нереальные объекты бывают вообразимые ('жена Лермонтова', 'кентавр', 'говорящие рыбы') vs. невообразимые ('круглый квадрат', 'положительное отрицательное число', 'несъедобная еда').

В грамматике термин «объект» употребляется в собственно лингвистическом смысле: (1) то же, что «семантический объект»; приблизительное обобщение для таких понятий, как «пациенс», «адресат», «инструмент», «объект»; (2) то же, что «синтаксический объект», и примерно то же, что «дополнение».

В грамматике Пор-Рояля термин «объект» употребляется в том же смысле, что и в онтологии, т.е. как «предмет». Но если в предложении речь идет о нескольких предметах, то среди них выделяются первый, второй и т.п. Когда речь идет о втором предметном участнике ситуации (в отличие от первого предмета – субъекта), то он обозначается термином «другой предмет //другой объект» (l'autre objet); создается впечатление, что здесь и было положено начало употреблению термина «объект» в грамматико-семантическом смысле (т.е. как участника, играющего несубъектную роль в ситуации): постепенно определитель «другой» стал все чаще и чаще опускаться, и в результате примерно во второй половине 19 в. возник термин «объект» в грамматико-семантическом смысле.

В русской грамматической терминологии термин «(грамматический) объект» (как синоним к термину «дополнение») появляется в работах А.А.Потебни (1874). Однако в работе А.А.Шахматова (1915–1920) термин «объект» уже употребляется иначе (иногда с факультативным определителем «психологический») – как пациенс (предмет, подвергающийся воздействию); так, в пассивной конструкции объект выражен подлежащим; таким образом, фактически здесь налицо семантическое понимание объекта. У А.М.Пешковского (1928) термин «объект» также приобретает семантический смысл, когда он говорит о том, что в генитивных конструкциях типа завоевание Мексики, рубка леса, сушка плодов, заготовка хлеба родительный падеж обозначает объект действия.

Предмет лингвистики

Лингвистика изучает не только существующие (существовавшие или возможные в будущем) языки, но и человеческий язык вообще. Язык не дан лингвисту в прямом наблюдении; непосредственно наблюдаемы лишь факты речи, или языковые явления, то есть речевые акты носителей живого языка вместе с их результатами (текстами) или языковой материал (ограниченное число письменных текстов на мёртвом языке, которым уже никто не пользуется в качестве основного средства общения).

Основной предмет структурной и математической лингвистики — разработка и совершенствование структурных и формальных методов анализа и описания языка. В наши дни многие, хотя и не все, приемы и достижения структурной лингвистики стали уже достоянием общего языкознания.

В целом, во всей своей совокупности целей, направлений, методов и подходов, прикладная лингвистика — это прежде всего комплексная дисциплина, постоянно соприкасающаяся с философией, психологией, физиологией, математикой, логикой, социологией, информатикой.

Прилагаемый ниже список основных терминов (понятий) математической и прикладной лингвистики дает определенное представление о предмете, направлениях, методах этой наук» сегодня.

Алгоритм — последовательность действий, выполнение которых необходимо для достижения конкретной цели.

База данных — совокупность данных, представленных в формализованном виде, удобном для автоматической передачи, интерпретации или обработки.

База знаний — база данных, элементами которых являются формализованные представления знаний об элементах внеязыковой действительности.

Байт — в вычислительной технике- обрабатываемый как единое целое элемент данных, представляющий собой последовательность двоичных разрядов (обычно-8). Используется и как единица измерения памяти. 1 килобайт= 1024 байта. 1 мегабайт=1024 килобайта. При обработке и хранении текстов обычно одному байту соответствует один символ текста.

Грамматика зависимостей — формальное представление строя предложения в виде иерархии компонентов, между которыми установлено отношение зависимости.

Грамматика непосредственно составляющих — формальное представление строя предложения в виде иерархии вложенных друг в друга линейно непересекающихся элементов, максимально независимых друг от друга.

Грамматика представлений — система правил, основанная на учете возможных окружений каждого слова.

Граф — математический объект, состоящий из множества вершин (точек) и множества ребер (связей), соединяющих пары вершин.

Дерево предложения, дерево зависимостей — представление структуры предложения в виде ориентированного графа, узлы которого соответствуют компонентам структуры зависимостей.

Интерфейс — средства и способы обмена информации. Обычно имеют в виду человеко-машинный интерфейс, т. е. средства и способы организации диалога человека и ЭВМ, хотя можно говорить и об интерфейсе между отдельными блоками вычислительной машины, программами, частями программ и т.д. Одной из лингвистических задач искусственного интеллекта является создание естественно-языковогоинтерфейса, т. е. организация диалога человека с ЭВМ на естественном языке.

Квазиреферат — реферат, составленный компьютером.

Конфигурационный анализ — анализ входного текста путем сравнения с набором предварительно выделенных синтаксических конструкций (конфигураций, формул) переводимого языка. При совпадении установленной конфигурации входного текста с одной из конфигураций набора текстовая конфигурация считается распознанной, «свертывается» и в дальнейшем анализе фигурирует в свернутом виде. При синтезе полученная из анализа конфигурация сравнивается с соответствующей ей конфигурацией переводящего языка. Соответствие конфигураций устанавливается предварительно.

Лингвистический процессор — набор процедур для обработки текстов на естественном языке, которые являются входной информацией автоматизированных систем.

Накопитель — устройство в ЭВМ, предназначенное для считывания и записи информации на внешних носителях. Например, накопитель на магнитных дисках (дисковод), накопитель на магнитных лентах (лентопротяжное устройство) и т.п.

Оконный интерфейс — один из современных способов организации интерфейса (см.). При этом способе на экране дисплея выделяется прямоугольная область (окно), в которую человек вводит и/или ЭВМ выводит информацию. При необходимости организации диалога на различные темы может быть организовано несколько окон (многооконный интерфейс).

Предсказуемостный анализ — процедура, основанная на просмотре текста слева направо, при этом для каждого очередного слова проверяется, является ли оно по тем или иным параметрам предсказанным предыдущими.

Псевдограф — ориентированный граф, имеющий и петли, и дуги.

Семантическое представление данных — формальная запись смысловой интерпретации информации, которая использует какую-либомодель семантического описания.

Словарь-конкорданс — специальный словарь текстовых словоформ с указанием всех контекстов для каждой словоформы.

Тезаурус — идеографический словарь, в котором показаны семантические отношения между его единицами. Структурной основой тезауруса является иерархическая система понятий конкретной предметной области.

Файл — совокупность связанных записей в памяти ЭВМ, рассматриваемая как единое целое.

Фрейм — способ описания структуры текста или ситуации, состоящий в перечислении возможных компонентов и типов связей между ними.

Язык представления данных — формальный способ структурирования записи информации, в основе которого лежит какая-либо формализованная (математическая) модель описания.

24 Использование информации об уровнях языка в кибернетических системах.

25

Первый аспект языковых явлений — процессы говорения и понимания языковой деятельности. Говорящий вовсе не различает формы слов, словосочетаний, которых он никогда не слышал и употребляет впервые, от форм слов и словосочетаний, которые многократно использовал. Поэтому можно говорить о том, что все формы слов и словосочетаний нормально создаются нами в процессе вещания в результате сложной игры сложного языкового механизма человека в условиях конкретных обстоятельств данного момента. Этот механизм, эта языковая организация, не может равняться сумме языкового опыта (говорение и понимание) данного индивида, а должен быть своеобразной переработкой этого опыта. Языковая организация может быть лишь психо-физичной, но она вместе с обусловленной ею языковой деятельностью является социальным продуктом.

Человечество в сфере общения делало выводы не на основе актов говорения и понимания какого-то одного индивида, а на основе всех актов говорения и понимания, которые существовали в определенной эпохе жизни той или другой общественной группы. В результате выводов создавались словари и грамматики языков, которые можно назвать просто языками, но которые нужно называть языковыми системами, оставляя слову “язык” его общее значение. Это второй аспект языковых явлений.

Правильно заключенные словари и грамматики должны вычерпывать знание данного языка. Языковые величины, которыми оперируют в словаре или грамматике в непосредственном опыте (не в психологическом, не в физиологичном) нам не данные, а могущие выводиться из процессов говора и понимания, которые являются в такой их функции языковым материалом (тексты). Это третий аспект языковых явлений.

Такое разделение несколько искусственно, потому что языковая система и языковой материал — это разные аспекты единственно данной в опыте языковой деятельности, и языковой материал, как и именно понимание вне какого-то организованного языкового материала (языковой системы) невозможно.

"Язык — знаковая система, соотносящая понятийное содержание и типовое звучание (написание). Различают: - человеческие языки (предмет изучения лингвистики): - естественные человеческие языки, - искусственные языки для общения людей (например, эсперанто), - жестовые языки глухих, - формальные языки - компьютерные языки (например, Алгол, SQL), - языки животных eng Языки изучает лингвистика (языкознание). Знаковые системы вообще — предмет изучения семиотики. Влияние структуры языка на человеческое мышление и поведение изучается психолингвистикой."

"Речь — исторически сложившаяся форма общения людей посредством языковых конструкций, создаваемых на основе определённых правил.

Процесс речи предполагает, с одной стороны, формирование и формулирование мыслей языковыми (речевыми) средствами, а с другой стороны, восприятие языковых конструкций и их понимание.

Таким образом, речь представляет собой психолингвистический процесс, форму существования человеческого языка."

"Речевая деятельность - взаимосвязанные речевые действия, направленные на достижение одной цели. Речевая деятельность подразделяется на письмо, чтение, говорение, перевод и т.д. 

Язык как система    Язык является материальным средством общения людей, или, конкретнее, вторичной материальной, или знаковой системой, которую используют как орудие или средство общения. Без языка не может быть общения, а без общения не может быть общества, а тем самым человека.    Язык является продуктом целого ряда эпох, на протяжении которых он оформляется, обогащается, шлифуется. Язык связан с производственной деятельностью человека, а также со всякой иной деятельности человека во всех сферах его работы.    Следует отметить, что существуют множество мнений по поводу определения понятия язык, но все эти определения можно свести к некоторой общей идее. Такой общей идеей является идея о том, что язык представляет собой функциональную материальную систему семиотического, или знакового, характера, функционирование которой в форме речи и есть ее использование как средства общения.    Язык как исключительно сложное образование может быть определен с разных точек зрения в зависимости от того, какая сторона или стороны языка выделяются. Определения возможны: а) с точки зрения функции языка (или функций языка): язык есть средство общения людей и, как таковое, есть средство формирования, выражения и сообщения мысли; б) с точки зрения устройства (механизма) языка: язык есть набор некоторых единиц и правил использования этих единиц, то есть комбинирование единиц, эти единицы воспроизводятся говорящими в данный момент; в) с точки зрения существования языка: язык есть результат социального, коллективного навыка делание единиц из звуковой материи путем сопряжения некоторых звуков с некоторым смыслом; г) с семиотической точки зрения: язык есть система знаков, то есть материальных предметов (звуков), наделенных свойством обозначать что-то, существующее вне их самих; д) с точки зрения теории информации: язык есть ход, с помощью которого кодируется семантическая информация. Приведенные выше определения взаимно дополняют друг друга и частично.

26 Знания о мире и понятие инфосферы.

Структурированная соответствующим образом информационная сфера раскрывается через совокупность информационных процессов, как результат определенной деятельности человека, как своеобразный продукт его субъект- объектных отношений. Материальным носителем инфосферы являются электронные средства массовой коммуникации, электронно-вычислительные комплексы и математическое обеспечение. Проникновение человека в наиболее интимные эниологические связи жизни Природы (такие, например, как полевые информационно- энергетические воздействия людей друг на друга и на Природу) усиливают необходимость осознания целостности мира. Но одно лишь абстрактное понимание его взаимосвязанности недостаточно для установления разумных отношений. Для этого необходима соответствующая среда по оценке деятельность людей и последствий от их действий. Эта среда есть пространство существования информации, отчужденной от носителя и обобществленного знания (объективного знания о целостности мира.

С точки зрения выдвинутых подходов и рассмотрения инфосферы Ю.А. Ахапкиным предлагается структуризация информационной среды в виде концепции общечеловеческой автоматизированной системы коллективного знания.

Структурно-функционально эта концепция состоит из двух знаний: объективного и субъективного знания. Объективное знание состоит из глобального общезначимого пространства знаний.

27 Существующие дефиниции прикладной лингвистики и их смысловые различия.

28 Антропоцентричный и системоцентричный подход к изучению языка. (31 билет)

Антропоцентричным был назван традиционный и исторически первичный для науки о языке подход, при котором исходным пунктом является лингвистическая интуиция носителя языка, а основной задачей – описание свойств тех сущностей и явлений, которая эта интуиция в языке усматривает. Тексты при этом играют подчиненную роль и используются в основном как источник подтверждающих  интуицию примеров. При системоцентричном же подходе исходным пунктом исследования являются именно тексты – продукты языковой деятельности, рассматриваемые как некоторые заведомо внеположенные исследователю объекты, допускающие, елико возможно, объективное исследование и взывающие к нему. Основной задачей становится описание закономерностей устройства текстов, а через них – языковой системы как порождающего эти тексты устройства. Методологическим идеалом системоцентрического подхода к языку являются естественные науки, временем расцвета – XX век, начиная с И.А. Бодуэна де Куртенэ и Ф. де Соссюра, наиболее адекватной формой существования – дескриптивизм, а высшим развитием – программа анализа языка как дешифровки.  При этом “каждый подход имеет свои плюсы и минусы. Антропоцентричный подход позволяет построить психологически адекватные описания, однако он дает принципиально не допускающие проверки результаты, а его применение к языкам, далеким по строю от родного языка лингвиста, приводит к неадекватным результатам; антропоцентричные описания, выполненные в рамках разных лингвистических традиций, весьма трудно сопоставлять. Системоцентричный подход, наоборот, позволяет получить «работающие», сопоставимые и  формализуемые описания, но они могут оказаться психологически неадекватными,  т. е. тскаженно представляющими реальный психолингвистческий механизм. Исследователю в этом случае приходится проходить между Сциллой логически безупречного, но интуитивно неприемлемого решения и Харибдой более соответствуюшей интуиции, на значительно усложняющей описание, а то и противоречивой трактовки” [Алпатов 1993: 25]. На практике такой маневр проявляется в том, что ни один подход практически никогда не бывает представлен в абсолютно чистом виде.

29 Различное понимание предмета прикладной лингвистики и взгляды на ее соотношение с теоретической лингвистикой.

Как известно, в отечественной прикладной лингвистике вследствие ряда исторических причин сложилось несколько различных подходов к пониманию предмета, задач и границ данной научной дисциплины. Наиболее распространенными являются две основные точки зрения. Первая из них предлагает такую трактовку прикладной лингвистики, согласно которой основным назначением этой дисциплины является разработка различных методов автоматической обработки информации, представленной на естественном языке. Это то, что сформировалось как компьютерная лингвистика, которая иногда явно или неявно отождествляется с прикладной лингвистикой в целом. Второе более широкое представление связывает прикладную лингвистику с кругом самых разнообразных практических задач, решение которых предполагает использование знаний о языке. При этом такие задачи, как правило, являются экстралингвистическими.

Термин «прикладная лингвистика» многозначен. В российской и за­падной лингвистике он имеет совершенно разные интерпретации. В за­падной лингвистике он связыва­ется, прежде всего, с преподаванием иностранных языков. В СССР термин прикладная лингвистика стал широко употребляться в 50-е гг. в связи с разработкой компьютерных технологий и появлением систем автомати­ческой обработки информации (автоматизированных систем управления, систем информационного поиска, автоматизированных систем обработ­ки текста и пр.). Именно поэтому в русскоязычной литературе вместо термина прикладная лингвистика в том же значении часто используются термины «компьютерная лингвистика», «вычислительная лингвистика», «автоматическая лингвистика», «инженерная лингвистика»; между тем отождествление этих дисциплин не вполне удачно, поскольку каждая из них имеет свой предмет и методы работы в рамках прикладной лин­гвистики как более широкого направления. Под прикладной лингвистикой чаще всего понимают все виды авто­матической обработки речевой информации— машинное распознавание устной речи, машинный перевод, автоматиче­скую классификацию технических и иных документов, автоматическое аннотирование текстов, автоматическое кодирование и пр.

Междисциплинарные исследования функционирования языка оказывают решающее влияние на лингвистическую теорию, способствуя обновлению концептуального аппарата современного языкознания. В настоящее время прикладная лингвистика понимается широко — как деятельность по приложению научных знаний об устройстве и функци­онировании языка в нелингвистических научных дисциплинах и в различных сферах практической деятельности человека, а также теоретическое осмы­сление такой деятельности.

Круг проблем, стоящий перед прикладной лингвистикой, нельзя считать совершенно новым для языкознания. Пе­ред языкознанием практически с самого начала его существования встала задача оптимизации функций языка. В философии и лингвистической теории принято различать коммуни­кативную, эпистемическую и когнитивную функции языка. С точки зрения эпистемической функции языковая система предстает как способ хранения и переда­чи знаний а также как отражение специфически национального взгляда на мир — отражение национального самосозна­ния. С функциональной точки зрения прикладная лингвистика может быть определена как научная дисциплина, в которой изучаются и разраба­тываются способы оптимизации функционирования языка. Функции языка задают точки отсчета для классификации огромной области приложения лингвистических знаний. Оптимизацией коммуникативной функции за­нимаются такие дисциплины, как теория перевода, машинный перевод, теория и практика преподавания языка, теория и практика информационно-поисковых систем, создание информацион­ных и искусственных языков, теория кодирования. Социальная функция языка — как часть коммуникативной — находит отражение в со­циолингвистике, в языковом планировании и языковой политике, в орфо­графии и орфоэпии, в политической лингвистике (анализ политического дискурса). Эпистемическая функция так или иначе проявляется в лексикографии, в терминологии и терминографии, в корпус­ной и полевой лингвистике. Оптимизация когнитивной функции сосре­доточена в компьютерной лингвистике, в «лингвистической криминоло­гии», в психолингвистике.

Наиболее распространенными являются две основные точки зрения. Первая из них предлагает такую трактовку прикладной лингвистики, согласно которой основным назначением этой дисциплины является разработка различных методов автоматической обработки информации, представленной на естественном языке. Это то, что сформировалось как компьютерная лингвистика, которая иногда явно или неявно отождествляется с прикладной лингвистикой в целом.

Второе более широкое представление связывает прикладную лингвистику с кругом самых разнообразных практических задач, решение которых предполагает использование знаний о языке. При этом такие задачи, как правило, являются экстралингвистическими.

Такое более широкое понимание прикладной лингвистики во многом совпадает с тем, как ее представлял А.А. Реформатский — первый заведующий Сектором структурной и прикладной лингвистики в Институте языкознания РАН, преобразованным в 1988 году в Отдел прикладного языкознания.

В. А. Звегинцев, обсуждая соотношение между теоретической и прикладной лингвистикой, писал, что «под прикладной лингвистикой чаще всего понимают все виды авто­матической обработки речевой информации (Language-data Processing) — машинное распознавание устной речи, машинный перевод, автоматиче­скую классификацию технических и иных документов, автоматическое аннотирование текстов, автоматическое кодирование и пр. И действи­тельно, автоматическая обработка речевой информации составляет в на­стоящее время основную исследовательскую проблематику прикладной лингвистики (...). Но все же было бы неправильно замыкать прикладную лингвистику в пределах данной проблематики».

30 Язык и речевая коммуникация. Традиционные и нетрадиционные модели.

Слово «коммуникация» – одно из многих иностранных слов, которые в настоящее время широко употребляются в русском языке. Оно происходит от латинского слова communico, что означает «делаю общим, связываю, общаюсь», поэтому наиболее близким к нему по значению является русское слово «общение». От слова «коммуникация» происходят такие слова, как «коммуникабельность» (способность к общению, общительность), «коммуникабельный» (общительный) человек, а также «коммуникативный» (относящийся к коммуникации; например коммуникативный тип высказывания).

Другое значение слова «коммуникация» – пути сообщения, транспорта, связи, сети подземного коммунального хозяйства. В этом смысле говорят, например, о подземных, воздушных и других коммуникациях, о системах коммуникаций. В нашем курсе термин «коммуникация» употребляется, естественно, в первом значении, так как объектом изучения является именно общение между людьми. С этим значением связано и научное определение понятия: «Коммуникация – специфическая форма взаимодействия людей в процессе их познавательно-трудовой деятельности».

Общеизвестно, что насекомые, птицы, животные располагают богатейшими звуковыми и кинетическими (двигательными) средствами обмена информацией. Однако взаимодействие между ними ученые называют «биологически целесообразным совместным поведением, направленным на адаптацию к среде и регулируемым, в частности, сигнализацией».

Специфичность взаимодействия людей в процессе их жизнедеятельности состоит в использовании языка, который, будучи важнейшим средством человеческого общения, выступает также как орудие познания, как инструмент мышления. Благодаря этому коммуникация между людьми является важнейшим механизмом становления человека как социальной личности, средством влияния общества на личность.

Главная цель речевой коммуникации – обмен информацией различного рода. Очевидно, что общение и обмен информацией между людьми осуществляются не только с помощью языка. С древнейших времен в человеческом обществе использовались дополнительные средства общения и передачи информации, многие из которых существуют до сих пор.

Язык и речь

Почему в выражении «речевая коммуникация» используется слово «речевая», ведь до сих пор мы говорили, что язык – важнейшее средство общения? Ответ на этот вопрос мы найдем, выяснив различия между понятиями «язык» и «речь». Напомним, что эти слова различаются во многих языках (англ. language/speech; нем. Sprache/Rede; франц. langage/parole).

Упрощенно можно сказать, что язык – это система знаков, единицы которой и отношения между ними образуют иерархически упорядоченную структуру. В этом смысле говорят о системе русского, английского и любого другого языка. Универсальными языковыми единицами (т. е. единицами, существующими в любом языке) являются звуки, морфемы (корни, суффиксы и т. п.), слова, словосочетания, предложения. Каждая единица принадлежит определенному уровню языка. Эти уровни взаимосвязаны и строго упорядочены: звуковой – морфологический – синтаксический – семантический (или смысловой). В каждом языке существуют правила, нормы употребления тех или иных единиц.

Термин «речь» используется в двух значениях. Во-первых, речью называется один из видов коммуникативной деятельности человека: использование языка для общения с другими людьми. В этом смысле речь – это конкретная деятельность, выражающаяся либо в звуковой, либо в письменной форме. Во-вторых, речью называется результат деятельности – текст (статья, сообщение и т. д.).

Таким образом, в слове «язык» преобладающим значением является «система, структура», а в слове «речь» – «деятельность». Поэтому понятно, что для определения слова «коммуникация» уместно использовать термин «речевая». Однако надо заметить, что выражение «языковая коммуникация» также существует и используется в качестве синонима. Вообще, следует помнить, что очень часто, даже в научной литературе, слова «язык» и «речь» используются как синонимы, т. е. взаимозаменяемы, если это не оговаривается особо.

32 Методы других наук, применяемые в лингвистическом исследовании.

33 Существующие подходы к выделению функций языка.

Язык — многофункциональное явление. Все функции языка проявляются в коммуникации. Выделяют следующие функции языка:

  • коммуникативная (или функция общения) — основная функция языка, использование языка для передачи информации;

  • конструктивная (или мыслительная) — формирование мышления индивида и общества;

  • познавательная (или аккумулятивная функция) — передача информации и её хранение;

  • эмоционально-экспрессивная — выражение чувств, эмоций;

  • волюнтативная (или призывно-побудительная функция) — функция воздействия;

  • метаязыковая — разъяснения средствами языка самого языка;

  • фатическая (или контактноустанавливающая);

  • идеологическая функция — использование того или иного языка или типа письменности для выражения идеологических предпочтений. Например, ирландский язык используется главным образом не для общения, а в качестве символа ирландской государственности. Использование традиционных систем письма часто воспринимается как культурная преемственность, а переход на латиницу — как модернизаторство.

  • омадативная (или формирующая реальности) — создание реальностей и их контроль;

  • металингвистическая. По отношению ко всем знаковым системам язык является орудием объяснения и организации. Речь идет о том, что метаязык любого кода формируется в словах.

  • номинативная — вера человека в название

  • денотативная, репрезентативная — передача информации, представление

  • конативная — ориентация на адресата;

  • эстетическая — сфера творчества;

  • аксиологическая — оценочное суждение (хорошо/плохо).

  • референтная (или отражательная) - функция языка, в которой язык является средством накопления человеческого опыта.

+++

Существуют различные попытки выделения функций языка, однако все исследователи, расходясь в частностях, едины в том, что существуют две безусловно важнейшие функции, которые язык выполняет в человеческом бытии, — коммуникативная и познавательная.

В утилитарно-коммуникативном функционировании языка, основная задача которого обеспечить взаимопонимание сторон, объединенных конкретными целями и общими интересами, нет необходимости использовать творческие потенции языка. Наоборот, их использование может существенно затруднить общение как бытовое, так и профессиональное. Стремление избегать неясных (непривычных) терминов и выражений является поэтому нормой в тех областях человеческого взаимодействия, где главной целью общения служит обмен необходимой информацией. Языковые штампы обыденного словоупотребления, а также формализованные языки и терминологические системы в научных и профессиональных сообществах являются своеобразным олицетворением этой сознательной установки на унификацию выразительных средств.

Познавательная, или, как ее называют некоторые ученые, интеллектуальная, функция языка необходимо связана с установкой на духовный и культурный рост общающихся сторон (мыслящих субъектов) в процессе их со-творческого диалога друг с другом, с миром и с языком. Сказать здесь — значит показать ранее невидимое, непривычное. Такой творческий диалог с языком обогащает всех его участников, включая, конечно, и сам язык как несущее основание смыслового взаимодействия. Олицетворением со-творческого диалога с языком является национальная литература (включая философию). Здесь, с одной стороны, обогащается новыми смыслами сам язык под творческим воздействием человеческого духа, с другой — такой обновленный и обогащенный новыми творческими гранями язык способен расширять и обогащать духовную жизнь нации в целом.

В научной и философской литературе помимо двух указанных функций обычно выделяют еще как минимум одну, причем у разных мыслителей — единых во мнении относительно первых двух функций — она всегда разная, что, на наш взгляд, уже говорит об ее избыточности. Например, Р.И. Павиленис помимо «кодирующей» (в нашем определении — утилитарно-коммуникативной) и «генеративной» (познавательной) выделяет «манипулятивную» функцию, которая, по нашему мнению, является одним из функциональных проявлений (модальностей) утилитарно-коммуникативной функции, на чем мы остановимся ниже. А.А. Ветров в книге «Семиотика и ее основные проблемы» выделяет «экспрессивную» функцию языка, смысл которой — в выражении чувств говорящего. Однако, отмечая ее «вторичный характер», поскольку большинство лингвистов не относят выражение эмоций к существенному аспекту языка, он этим сам же признает ее избыточность. Идейный вдохновитель тартуско-московской семиотической школы Ю.М. Лотман помимо «информационной» и «творческой» функций выделяет «функцию памяти», подразумевая под ней способность текста сохранять память о своих предшествующих контекстах. Текст создает вокруг себя некое «смысловое пространство», лишь в нем обретая осмысленность. На наш взгляд, знание культурного контекста, необходимое для адекватного понимания исторического памятника, равно как и знание социальных контекстов обыденного общения, относится к коммуникативной функции языка, но лишь в разных аспектах (модусах) ее проявления — в духовном и утилитарном. Также обстоит дело и с популярной у современных отечественных лингвистов и семиотиковякобсоновской классификацией функций языка. Каждая из шести выделенных Р. Якобсоном функций соответствует какому-то одному — акцентируемому в зависимости от контекста выражения — конкретному элементу речевого взаимодействия, но все вместе они выражают различные аспекты коммуникативной функции языка.

34 Основные собственно лингвистические методы.

Перед описательной лингвистикой стоит задача описания фактов языка. На первом плане при этом находится метод классификации, т.е. выявления той сетки параметров, которая позволяет охватить все существенные свойства языковых структур. Теоретическая лингвистика формирует само представление о том, какие свойства языка являются существенными, а какие – нет. Создаваемые в теоретической лингвистике концептуальные модели языка не просто описывают наблюдаемые факты, но и претендуют на их объяснение. При этом как описательная, так и теоретическая лингвистика исходят из познавательной установки, известной как «God"s Truth» («Божественная Истина»). Иными словами, классификации языковых фактов и концептуальные модели теоретической лингвистики претендуют на описание того, как действительно устроен язык.

Прикладная лингвистика также использует и метод классификации, и метод моделирования. Однако поскольку задачи прикладной лингвистики сосредоточены в области оптимизации функций языка, а оптимизация определяется конкретной задачей, то в прикладной лингвистике широкое распространение имеет познавательная установка, известная под несколько ироническим названием «Фокус-покус» (более уважительное название – «инженерный подход»). Эта установка в качестве основной ценности выдвигает не познание того, «как все обстоит на самом деле», а решение конкретной задачи, в частном случае – удовлетворение требований «заказчика», преследующего свои собственные цели. Это, впрочем, не означает, что результаты прикладных исследований не представляют никакой ценности для теории языка: напротив, прикладные модели оказывают значительное влияние на лингвистическую теорию, способствуя обновлению концептуального аппарата современного языкознания.

№1 – Описательный метод - это система исследовательских приемов, применяемых для характеристики явлений языка на данном этапе его развития. Это методика синхронного анализа.

Основа методики – м. наблюдения с интуитивным выделением язык. единиц и сведением их в совокупности.

Цель – установление тех или иных фактов или явлений и включение их в обиход научного исследования.

№ 2 – Метод первичной сегментации 1) первичная сегментация 2) вторичная сегментация – здесь выделяются структурные элементы. 3) Интерпретация выделенных номинативно коммуникативных и структурных единиц.

№ 3 – Структурные методы Основная цель – представление структуры языка и описание его системы.  Он помогает описывать семантическую структуру слова. Он основывается на том, что лексическое значение слова делится на минимальные единицы смысла, находящиеся в системных отношениях.

В философском смысле:

Метод – путь познания и истолкования любого явления действительности.

В узком:

Метод – это система исследовательских приемов и процедур, способствующих целенаправленному изучению объекта с той или иной точки зрения.

Базы лингвистического метода может быть либо один язык, либо совокупность языков.

Специализация – это сосредоточение на каком-либо ярусе языка.

Аспекты методики – это исследуемые стороны языка, т.к. его структурные особенности или функциональные свойства.

Методика – это включение того или иного исследовательского приема в процедуру исследования.

Различают:

  • · Методику наблюдения

  • · Методику вычленения лингвистической единицы

  • · Методику обобщения единиц в классы

  • · Моделирования

  • · Экспериментальную и др.

Описательный метод - это система исследовательских приемов, применяемых для характеристики явлений языка на данном этапе его развития. Это методика синхронного анализа.

Основа методики – метод наблюдения с интуитивным выделением язык. единиц и сведением их в совокупности.

Цель – установление тех или иных фактов или явлений и включение их в обиход научного исследования.

Метод первичной сегментации 1) первичная сегментация 2) вторичная сегментация – здесь выделяются структурные элементы. 3) Интерпретация выделенных номинативно коммуникативных и структурных единиц.

Структурные методы Основная цель – представление структуры языка и описание его системы.  Он помогает описывать семантическую структуру слова. Он основывается на том, что лексическое значение слова делится на минимальные единицы смысла, находящиеся в системных отношениях.

Компонентный анализ – метод разложения лексического значения на семы.  Выявляются они логическим путем. Каждая сема в значении представлена одним или несколькими словами. Примеры:

Йогурт = значение: заквашенное + молоко + с фрукт.добавками. Сема – отражение в сознании отдельного признака. Выделяют:

Родовые семы Отражают такой признак, как одушевленность/неодушевленность, материальность/нематериальность, муж/жен пол

Видовые семы Принадлежность виду.

Также семы подразделяют:

Ядерные Отражают главные, существенные признаки

Периферийные Отражают второстепенные, неглавные признаки объекта Пример

баскетболист

ядерная семы: «спортивный, играющий в баскетбол»

периферийная: «высокий»

Потенциальная (ассоциативная) Отражает признак, который приписывается общественным сознанием.

Компонентный анализ позволяет не только дать полную формулировку лексического значения, но и более точно описать механизм семантического согласования слов.

Компонентный анализ используется чаще при определении границ семантических полей, синонимических рядов и антонимических пар, а также в лексикографии.

35 Внешнедисциплинарные связи лингвистической науки.

  • На стыке лингвистики и права, см.: юрислингвистика.

  • Лингвистика и предмет гуманитарных наук.

    • На стыке лингвистики и психологии, см.: психолингвистикакогнитивная лингвистика.

    • Лингвистика и предмет общественных наук.

      • На стыке лингвистики и социологии, см.: социолингвистика.

      • На стыке лингвистики и истории, см.: лингвистическая палеонтология.

      • На стыке лингвистики и генеалогии, см.: антропонимика.

      • На стыке лингвистики и географии, см.: топонимика.

  • Лингвистика и методология науки.

      • На стыке лингвистики и методологии науки, см.: методология лингвистики.

  • Лингвистика и методы «точных» наук.

    • Лингвистика и методы «дедуктивных» наук.

      • На стыке лингвистики и математики, см.: математическая лингвистика.

      • На стыке лингвистики и логики, см.: лингвистика и логикалогическое направление в лингвистике.

    • Лингвистика и методы «эмпирических» наук.

      • На стыке лингвистики и статистики, см.: квантитативная лингвистикалингвистическая статистика.

      • На стыке лингвистики и методов истории, см.: историческая лингвистика.

      • На стыке лингвистики и методов географии, см.: ареальная лингвистикалингвистическая география = лингвогеографиялингвистическое картографирование.

      • На стыке лингвистики и методов психологии, см.: экспериментальная лингвистикаэксперимент в лингвистике.

      • На стыке лингвистики и методов социологии, см.: анкетирование в лингвистике.

    • Лингвистика и методы «технических» наук (техники),

      • На стыке лингвистики и инженерии, см.: инженерная лингвистикалингвоконструирование.

      • На стыке лингвистики и вычислительной техники, см.: вычислительная лингвистикакомпьютерная лингвистикамашинный перевод.

Членение лингвистики на внутреннюю и внеш­нюю было осуществлено впервые крупнейшим швейцарским языковедом Фердинандом де Соссюром (1857— 1913) в его знаменитом «Курсе общей лингвистики» (1916). Это членение предполагает различные точки зрения на изучение языковых явлений.

Внешняя лингвистика занимает промежуточное по­ложение между лингвистикой как таковой и другими, нелингвистическими, науками. Свою отраслевую струк­туру она заимствует у нелингвистических наук.

В выявлении отраслевой структуры науки в целом мы должны следовать за структурой объективного мира. Он включает четыре компонента – мертвую природу, живую природу, психику и культуру. Мертвая природа изучается физикой, живая природа – биологией, психика – психологией и культура – культуроведением (или культурологией).

Первоначальную модель современной науки мы можем представить следующим образом:

Философия

Физика

Биология

Психология

Культуроведение

Опираясь на дисциплинарное строение науки в целом, мы сможем ответить на вопрос о том, какова научно-отраслевая структура внешней лингвистики.

Последняя вытекает из связи языкознания с философией, физикой, биологией, психологией и другими нелингвистическими науками. Вот почему в состав основных внешнелингвистических дисциплин входит пять наук – философия языка (лингвофилософия), лингвофизика, биолингвистика, психолингвистика и лингвистическое культуроведение. Философия языка исследует язык в одном ряду со всеми видами объектов. Лингвофизика изучает физические свойства языка, биолингвистика – биологические свойства языка, психолингвистика – психические свойства языка и лингвистическое культуроведение – культурологические свойства языка.

36 Экспериментальные методы в языкознании.

Методы, позволяющие изучать факты языка в условиях, управляемых и контролируемых исследователем. Филос. основой применения Экспериментальных методов в языко-знании является тезис о единстве теоретического и эмпирического уровней познания. В современном языко-знании термин «Экспериментальный метод» не является четким; лингвисты часто говорят об эксперименте там, где имеет место наблюдение, прежде всего наблюдение над текстами (письменными и устными). Существенно, что текст как таковой, будучи данностью, не может быть объектом Экспериментального метода; именно поэтому Экспериментальные методы неприменимы к изучению истории языка, особенностей стиля определения автора и т. п.: в этих случаях следует говорить о наблюдении. Объектом Экспериментальных методов является человек — носитель языка, порождающий тексты, воспринимающий тексты и выступающий как информант для исследователя. В лингвистическом эксперименте исследователь может иметь подобным объектом самого себя или др. носителей языка; в первом случае следует говорить об интроспекции, во втором — об объективном эксперименте.

Методы, позволяющие изучать факты языка в условиях, управляемых и контролируемых исследователем. Философской основой применения Экспериментальных методов в языкознании является тезис о единстве теоретического и эмпирического уровней познания. В современном языкознании термин «Экспериментальный метод» не является четким; лингвисты часто говорят об эксперименте там, где имеет место наблюдение, прежде всего наблюдение над текстами (письменными и устными). Существенно, что текст как таковой, будучи данностью, не может быть объектом Экспериментального метода; именно поэтому Экспериментальные методы неприменимы к изучению истории языка, особенностей стиля определения автора и т. п.: в этих случаях следует говорить о наблюдении. Объектом Экспериментальных методов является человек — носитель языка, порождающий тексты, воспринимающий тексты и выступающий как информант для исследователя. В лингвистическом эксперименте исследователь может иметь подобным объектом самого себя или др. носителей языка; в первом случае следует говорить об интроспекции, во втором — об объективном эксперименте.

+ еще отсюда добавить можно

В языкознании — методы, позволяющие изучать факты языка в условиях, управляемых и контролируемых исследователем. Философской основой применения Э. м. в языкознании является тезис о единстве теоретического и эмпирического уровней познания. В современном языкознании термин «Э. м.» не является чётким; лингвисты часто говорят об эксперименте там, где имеет место наблюдение, прежде всего наблюдение над текстами (письменными и устными). Существенно, что текст как таковой, будучи данностью, не может быть объектом Э. м.; именно поэтому Э. м. неприменимы к изучению истории языка, особенностей стиля определённого автора и т. п.: в этих случаях следует говорить о наблюдении. Объектом Э. м. является человек — носитель языка, порождающий тексты, воспринимающий тексты и выступающий как информант для исследователя. В лингвистическом эксперименте исследователь может иметь подобным объектом самого себя или других носителей языка; в первом случае следует говорить об интроспекции, во втором — об объективном эксперименте. Термин «Э. м.» в языкознании появился во 2‑й половине 19 в. в связи с изучением экспериментальной фонетикой механизмов произнесения звуков и вначале связывался не столько с активным оперированием изучаемыми объектами, сколько с применением приборов (инструментальная фонетика). Фактически Э. м. в языкознании используются постоянно при изучении живых языков и диалектов — как бесписьменных, так и тех, где тексты исследователю почему-либо недоступны. Экспериментальная работа с информантами (нередко в сочетании с наблюдением) непосредственно в среде носителей языка называется обычно полевой лингвистикой.

37 Понятие функции в науке о языке. Функционализм и его различные понимания.

38 Исследовательские методы науки о языке.

Понятие об исследовательском методе. Термин метод (гр. methodos — способ познания, исследования) неоднозначен: ОН при­меняется в общенаучном, философском смысле, затем в специльно-научном, т. е. относящемся к определенной области науки (физика, языкознание и т. д.), и в смысле, совпадающем со смыслом термина «методика».

В философском смысле термин «метод» обозначает путь познания и истолкования любого явления жизни. Попятно, что в этом случае метод окажется единым, в какой бы специальной области науки он «и использовался. Так, для всех ученых марксистов при­емлем лишь один философский метод — метод диалектического и исторического материализма. Этот метод требует от ученого любое явление действительности видеть и объяснять па основе единства материи и сознания, первичности материи и вторичности сознания, признания объективности законов природы, па основе связи и взаимо­действия предметов и явлений, их включенности в непрерывный про­цесс развития, противоречивости этого развития, взаимодействия качественных и количественных изменений и т. д. Метод диалектического и исторического материализма противостоит в современной мировой науке другим методам, воплощающим идеалистические псевдоматериалистические философские воззрения.

В специально-научном смысле термин «метод» означает путь познания и истолкования явлений, используемый в той или иной отдельной науке (биологии, языкознании и т. д.), В этом именно смысле говорят о методах биологического исследования, лингвистического исследования, математических методах и др. Каждому из методов соответствует своя главная исследовательская задача (которую должен видеть исследователь), свой «участок» изучаемой наукой объекта (например, языка), свой круг основных требований предъявляемых методом исследователю. Метод требует от ученых весь сложный процесс собирания, классификации, объяснения фактов подчинять главной научной задаче.

Так, в языкознании долгое время основным методом признавался сравнительно-исторический. Его главная задача — изучение законов, развития родственных языков, изучаемый «участок» языковой структуры — родственные явления родственных языков. Широко известный ныне структурный, метод имеет иную главную задачу — изучение отношений и связей между элементами языковой структуры; у него свой «участок» языка как общего объекта науки о языке — система структурных отношений.

Специальные исследовательские методы находятся в известной зависимости от философского метода, видоизменяются под его влия­нием. Например, структурный метод неодинаково применяется аме­риканскими, датскими и чешскими языковедами, потому что обще­философское понимание языка и его отношения к действительности у этих ученых различно. Можно говорить и об особенностях исполь­зования структурного метода в нашей стране, что, объясняется преж­де всего тем, что советские ученые стремятся решать свои исследова­тельские задачи на основе марксистского философского метода.

Каждый специальный исследовательский метод воплощается в практике научной работы в ту или иную систему логических дейст­вий ученого и в ту или иную систему повторяющихся, более или ме­нее стандартизованных приемов собирания, обработки и обобщения фактов. Такую систему приемов тоже нередко называют методом, однако удобнее называть ее термином методика. Исследова­тельский метод определяет путь познания и истолкования фактов, а методика группирует сами факты, классифицирует, показывает их с нужной стороны, ставит их в различные положения, позволяет получать их различные научные, логические отображения и т. д., Если метод — это путь, прокладываемый к истине, то методика — инструмент, нужный для прокладывания этого пути. Есть, разуме­ется, определенная связь между исследовательским методом и мето­дикой. Но эта связь не постоянная, разные методики могут обслужи­вать один и тот же метод.

Таким образом, философский, метод, специально-научный метод и методика исследования — вот «три кита», на которых держится весь «механизм» науки. Попытаемся рассмотреть некоторые специальные лингвистические методы и некоторые методики изучения языка.

Описательный метод. Название метода неточно. Оно заставляет думать, будто этот метод позволяет науке лишь описывать те или иные явления языка. На самом деле он требует и понимания, и ана­лиза, и теоретического истолкования явлений языка, рассматрива­емых в их «работе».

Описательный метод применяется для изучения социального функ­ционирования языка, для описания и анализа элементов и частей «механизма» языка. Он требует точной характеристики фонем, мор­фем, слов, грамматических категорий и форм и т. д. Каждый из этих элементов может и должен рассматриваться и формально, и семан­тически. Именно этот метод наиболее прочно и полно связывает линг­вистику с нуждами общества. На основе этого метода создаются мно­гочисленные так называемые описательные грамматики различных языков; на основе этого же метода составлены толковые словари раз­личных языков — база лексикологических исследований и одно из условий успеха науки в, борьбе за речевую культуру общества.

«Описание» фактов языка является в действительности их каче­ственным анализом, их систематизацией, создающей теорию элемен­тов и частей языковой структуры. Достижения описательного метода велики и бесспорны, хотя и не вполне ясно осознаны.. Они часто свя­зываются с другими методами, обычно со сравнительно-историческим, по-видимому, потому, что «описательные» работы по языку создава­лись теми же учеными, кто создавал и развивал теорию и практику сравнительно-исторических исследований.

Разумеется, описательный метод развивается вместе с развитием языкознания, дифференцируется в зависимости от принадлежности ученого к той или иной школе или направлению. Так, по-разному осуществляли описательное изучение языка сторонники логико-грам­матической школы Ф. И. Буслаева, грамматико-психологической шко­лы А. А. Потебни, формально-грамматической школы Ф. Ф. Форту­натова, В настоящее время описательный метод отчетливо взаимо­действует со структурным методом.

Сравнительно-исторический метод. Возник в начале XIX в. и определил развитие языкознания этого столетия. Главная задача сравнительно-исторического метода – открытие законов, управлявших развитием родственных языков в прошлом. Соответствует этой задаче и предмет исследования совокупности родственных фактов в родственных языках и сохраненные от далекого Прошлого законы, воплощенные в этих фактах. Если описательный метод обращен к настоящему языка, то сравнительно-исторический к прошлому, притом очень далекому, не засвидетельствованному памятниками письменности.

Ученые, пользующиеся сравнительно-историческим методом, не­редко стремились к тому, чтобы реконструировать общие для ряда языков слова и их формы — восстановить в том виде, который они могли иметь до разделения далекого языка-основы на несколько род­ственных языков. Например, предполагается существование в далеком прошлом языка-основы, в результате сложного деления которого возникли известные индоевропейские языки: древнегреческий, ла­тинский, санскрит, балтийские, славянские и др. Предположение о языке-основе выдвигается в результате изучения сходных по зву­чанию и значению слов и их форм, обнаруживаемых путем сравни­тельно-исторических наблюдений над фактами, зарегистрированными в памятниках письменности. Такие языки признаются родственными, т. е. имеющими в прошлом общий язык-основу, из которого они раз­вивались. Ср.: др.-русск. берегъ, ст.-сл. 6р/hгъ, польск. brzeg, др.-нем. berg, санскр. brhan, др.-ирл bright; др.-русск. Звhзда, ст.-сл. звhзда, польск. gwiazda, др.-пр. swaigstan, лат. swaigsne и т. д. Звучание и значение этих слов сходны. Внимательное изучение подобных рядов позволяет установить регулярные соответствия одних звуков другим в родственных языках: о—а—е, г—ж—з, ой—ей—h и др. Анализ звуковых соответствий и позволил выдвинуть гипотезу о родстве языков и о действии в прошлом ряда звуковых законов, вызвавших регулярные чередования отдельных звуков и их сочетаний.

Сравнительно-исторический метод дал немало в изучении родства языков, закономерностей исторического развития их звуковой и мор­фологической структуры. Но он дал мало в исследовании семантики, лексики и синтаксиса. Этимологические сравнительно-исторические разыскания бывали спорными и часто опровергались, звуковые за­коны нередко оспаривались, восстановленные «архетипы» (древнейшие формы слов, признаваемые формами-основами) оказывались отне­сенными неизвестно к какому времени, реконструированные системы склонения и спряжения не могли быть приписаны ни одному конк­ретному языку в прошлом, неродственные языки и неродственные факты родственных языков вообще не изучались. Ученые, разуме­ется, не могли не видеть этих и иных недостатков метода и пытались улучшить его. Для этого они обращались к другим методам; в настоя­щее время растет интерес индоевропеистов (так нередко называют тех, кто применяет сравнительно-исторический метод) к структурному анализу языков.

Исторический метод. Развивался одновременно со сравнительно-историческим. Его главная задача — исследование развития фонети­ки, морфологии, синтаксиса и других сторон структуры конкретного языка. Предметом исследования оказываются закономерности исто­рического развития языковой структуры.

Исторический метод требует от исследователя сопоставления сме­няющих в процессе развития одно другое состояний структурных элементов языка, установления внутриязыковых и внеязыковых причин наблюдаемых изменений; он требует учета многообразных и сложных связей изменяющихся явлений языка между собой и с разнообразными явлениями истории народа, его общественных отношений, сознания, государства, культуры и т. д.

Правда, столь сложное понимание задач и требований истори­ческого метода складывалось постепенно, на протяжении многих десятилетий. Да и в настоящее время исторический метод не имеет вполне отчетливого «лица». Так, многие работы по истории, например» русского языка, выполненные в русле этого метода, представляют собой регистрацию фактов, сопровождаемую минимальными теоре­тическими пояснениями классификации этих фактов и причин их изменения. Как правило, не удается сколько-нибудь полно устано­вить взаимозависимость изменяющихся явлений и их зависимость от изменения внеязыковой действительности. Не удается установить строгое и непротиворечивое понимание многих закономерностей раз­вития фонетики, лексики, морфологии и синтаксиса.

И тем не менее успехи языкознания, связанные с применением исторического метода, заметны. Создано немало исторических иссле­дований различных языков, рисующих все более полную и точную картину их истории. Недостатки исторического метода анализиру­ются; метод совершенствуется путем сочетания его с другими, в ча­стности с описательным, сравнительно-историческим и структурным. На стыке исторического и сравнительно-исторического методов возникает метод внутренней реконструкции. Этот метод имеет целью восстановление элементов и «участков» в языковых структурах, не зафиксированных или неполно зафиксированных памятниками письменности. Сравниваются семантически и формаль­но близкие явления одного и того же языка и на основании такого сравнения выдвигаются гипотезы относительно далекого прошлого этих явлений. Например, сравнивая различные значения, выражае­мые приставкой за- в современных глаголах, можно составить доста­точно достоверное мнение о том, какие значения были наиболее ран­ними и в какой последовательности шло их развитие.

Сопоставительный метод. Этот метод, подобно описательному, направлен на настоящее, на «работу» языка. Но в отличие от описа­тельного он имеет главной задачей познание сходства и различий структуры двух или даже нескольких языков. Таким образом, глав­ный предмет исследования для сопоставительного метода — струк­туры двух языков в их сходстве и различиях. Естественно, что этот метод требует продуманных сопоставлений звуков одного языка со звуками другого, лексики одного языка с лексикой другого, морфо­логии одного языка с морфологией другого и т. д. Эти сопоставления должны охватывать как отдельные элементы, так и целые «участки» структуры, например глагол в русском языке и глагол в англий­ском.

При сопоставительном подходе к языку удается глубже понять сущность языковой структуры, ее особенности в отдельных языках, типы языковых структур или их частей. Отчетливее становятся струк­турные варианты грамматических категорий, фонетических систем и др. Неоценимо значение исследований, выполненных на основе, сопоставительного метода, для практики обучения иностранным язы­кам, для теории и практики перевода. Многочисленные сопостави­тельные грамматики и двуязычные словари — свидетельства практического использования сопоставительного метода.

Структурный метод. Сложился в XX в. под воздействием работ И. А. Бодуэна де Куртенэ, Ф. де Соссюра, Н. С. Трубецкого и др. Главная задача этого метода — познание языка как целостной функционирующей структуры, элементы и части которой соотнесены и свя­заны строгой системой лингвистических отношений. Структурный метод в известной мере является продолжением описательного метода: в обоих случаях рассматривается функционирование языка. Однако описательный метод «исследует» прежде всего «наборы» действующих в языке частей и элементов, а структурный — отношения, связи, зависимости между этими частями и элементами. Эти методы допол­няют один другой, их сочетание может дать полную картину развития языков.

Естественно, что структурный метод, выдвинув новую главную задачу и определив новый предмет исследования, предъявляет и но­вые требования, в числе которых различение генетического и функционального взгляда на язык, различение языка и речи, последова­тельное определение сходства и различий между соотнесенными эле­ментами языка, создание специальных методик, заимствование идей и методик исследования у точных наук и т. д.

Структурный метод (как и любой иной) находится в известной зависимости от философского метода, применяемого исследователем. Эта зависимость сказывается, в частности, в том, что внутри струк­турного метода существуют его разновидности, различающиеся преж­де всего философским пониманием языка и задач науки. Например, копенгагенская школа структурализма (современное течение в науке о языке, применяющее структурный метод) настаивает на том, что язык — это система отношений и что для его понимания нужно иссле­довать именно эти отношения (или знаковые функции одних элементов по отношению «другим). Такое понимание языка и задач его изуче­ния диктуется идеалистическими взглядами главы копенгагенской школы Л. Ельмслева.

Американская разновидность структурного метода характеризу­ется стремлением описать язык чисто формальным образом, на основе перечисления всего окружения изучаемого элемента другими эле­ментами, т. е. без обращения к значению слов, словосочетаний и пред­ложений. Идеалистический характер понимания языка, лежащий в основе такого требования (отрицается единство языка и сознания), очевиден.

Пражская разновидность структурного метода сложилась под сильным влиянием материалистических, по существу, взглядов на язык русских ученых (труды И. А. Бодуэна де Куртенэ, Ф. Ф. Фор­тунатова, Л. В. Щербы, А. А. Шахматова, Н. С. Трубецкого) и под влиянием философских исканий чешских языковедов. Поэтому праж­ская школа структурализма видит необходимость исследования не только отношений между элементами языка, но и самих элементов. Пражцы видят и признают взаимосвязь генетического и функциональ­ного начал в жизни языка (синхрония и диахрония); они признают необходимость обращения к области языковых значений в изучении. языковой структуры; они видят зависимость этой структуры от внеш­них влияний на нее со стороны общества и т. д.

К настоящему времени структурный метод не может предложить исследования, равные по социальной весомости исследованиям, выполненным на основе других методов. Но он может дать науке и прак­тике обновленное и уточненное описание и понимание многих явлений языка; он поможет решить и новые задачи, поставленные перед при­кладными отраслями языкознания — машинным переводом, автоматическим извлечением информации из текстов и т. д.

Можно надеяться, что по мере развития науки о языке будет креп­нуть понимание простой, в сущности, вещи: структурный метод и другие методы — не конкуренты, а союзники. Каждый имеет объек­тивные условия возникновения и развития, заложенные в свойствах языка и науки о нем. Каждый решает свой круг задач, и все они вме­сте, взаимодействуя, делают науку о языке все более точной, строгой и действенной, создавая все более правдивое и многостороннее опи­сание структуры языков прошлого и современных.

Стилистический метод. Очень велик круг ученых и специалистов, занимающихся изучением вопросов стиля языка, стиля речи, поэти­ческой речи и т. д. У науки появилась новая задача — познать при­роду и признаки стилей языка и стилей речи. Это значит, что стили осознаются в качестве особого предмета изучения. Выявляются и особые требования, предъявляемые исследователям этой области языка и речи. Изучать стили языка — это изучать прежде всего то, что их образует, а именно дифференциацию языковых средств по раз­личным областям жизни и деятельности общества. Наши привычные представления о фонемах, словах, частях речи, членах предложения, предложениях складывались на основе убеждения в том, что они одинаковы во всех случаях их социального назначения. Однако это не так. Глагол в публицистике отличается от глагола в художествен­ной литературе. Простое предложение в науке не такое, каким мы его знаем по бытовой речи. Даже фонемы «ведут себя» в деловом док­ладе не так, как в поэтической лирике.

Проблема стилевой дифференциации структурных элементов и «участков» языка осложняется и дополняется не менее сложной проб­лемой применения этих структурных элементов в разновидностях художественной, публицистической, научной и иной речи, именуемых речевыми стилями. Каждый из речевых стилей соотнесен и с другими стилями, и с выражаемым содержанием, и с речевыми традициями, и с эстетическими идеалами своего времени, и с личностью автора про­изведения, и т. д. Как все это синтезировать для того, чтобы полу­чить объективные научные данные о стилях?

Вот почему сейчас идут широкие поиски в области полого метода. Определилась его главная задача. Известен предмет исследования. Но неотчетливы и противоречивы его требования. Метод не оформил­ся, да и едва ли скоро приобретет отчетливую форму. Он резко меня­ется – от формального до крайне семантизированного, от точных статистических характеристик до субъективно-импрессионистических размышлений.

Количественный метод. Этот метод можно бы называть матема­тическим. Известно, что элементы языковой структуры имеют «количественную характеристику»; иначе говоря, одних элементов много, других мало, одни применяются редко, другие часто, одни строго выстраиваются в большие ряды, другие все время нарушают логику таких рядов и т.д.

Элементам и «участкам» языковой структуры количественные признаки столь же необходимы, как и признаки качественные. При­чем это, может быть, самое главное, чего не хотят видеть против­ники количественного метода, — количественные признаки элементов языка на одном уровне (например, признаки морфем) оказываются одной из причин, формирующих качественные признаки элементов языка на другом, более высоком уровне (в нашем примере — качест­венные признаки слов). Если некий условный язык будет распола­гать «набором» из. 10 корней и 5 суффиксов, его возможности созда­вать разные по качеству слова будут резко отличаться от соответст­вующих возможностей языка, имеющего 10 корней и 50 Суффиксов. Или если некий условный язык имеет в своем распоряжении 20 са­мостоятельных слов, объединенных в две части речи, его возможности создавать разные речевые цепи (менять качество речи) окажутся рез­ко отличающимися от соответствующих возможностей языка, в кото­ром 100 самостоятельных слов объединены в 5 частей речи.

Различные разряды и категории слов, их форм и сочетаний можно рассматривать как математические множества (совокупности) и при­менять для их научного осмысления понятия и формулы математи­ческой науки, называемой теорией множеств. Функционирование элементов языка характеризуется» прежде всего их повторяемостью и потому может рассматриваться как процесс, для изучения которого приложимы понятия и формулы математической статистики и теории вероятностей. Испытываются возможности применения в изучении языка новой математической дисциплины – теории информации (раз­дел кибернетики), которая опирается на понятия и идеи теории ве­роятностей. Можно говорить об осторожном использовании в иссле­довании языка и некоторых иных математических наук.

Таким образом, возникла новая главная задача языкознания — познание количественной стороны языка и речи, количественных закономерностей, связанных с функционированием и развитием язы­ковой структуры. Наметился и новый предмет исследования — сово­купность количественных свойств, характеризующих элементы и «участки» языковой структуры. Все яснее становятся главные тре­бования количественного метода.

Конечно, нельзя не видеть противоречий и трудностей, связанных с развитием количественного метода. Они обусловлены несколькими обстоятельствами: 1) нежеланием части языковедов увидеть и понять новый самостоятельный предмет лингвистического изучения и новую главную задачу науки о языке; 2) отсутствием у языковедов специ­альных, математических знаний, в результате чего приложение ма­тематических идей к вопросам языкознания оказывается иногда делом математиков, неясно представляющих себе действительно важ­ные и принципиальные задачи количественного изучения языка и часто предлагающих языковедам решение математических задач (на материале языка); 3) наличием в традиционных описаниях языка и речи ряда нестрогих понятий и определений, не позволяющих уверенно применять математические идеи и формулы (для того чтобы количественно охарактеризовать те или иные элементы языка, нужно уметь их строго и однозначно выделять). Таким образом, очевидна зависимость количественного метода от методов, условно говоря, качественного описания языка и речи.

Есть основания надеяться на то, что в будущем методы качествен­ного и количественного анализа языка будут взаимодействовать и языковые исследования .будут связаны с широкий использованием всестороннего качественно-количественного описания и анализа язы­ковых структур. Но и в нынешнем своем виде количественный метод несет много новых данных науке о языке, обогащающих и углубляю­щих его понимание и необходимых для решения многих прикладных задач: машинного реферирования и библиографирования, построе­ния информационно-поисковых систем, изменения Методики препо­давания языков на основе принципов программированного обучения и т. д.

Метод автоматического анализа. В последние десятилетия в связи с развитием кибернетики и созданием электронно-вычислительных машин формируется метод исследования языка, который нередко отождествляется со структурным или математическим, но который нужно рассматривать отдельно и можно бы называть методом авто­матического анализа.

Главная цель этого метода — познание такого формально-струк­турного членения языка па элементы, которое достаточно строго со­отнесено с реальным его членением, используемым в процессе обще­ния, и которое вместе с тем доступно «видению» и анализу машины. У языковедов, таким образом, новый предмет изучения — структура языка в том виде, в котором ее «отображает» кибернетический «мозг» машины. Отсюда идут несколько необычные требования метода. Преж­де всего это требование формализации научных описаний языка, т. е. максимально возможной замены словесного описания описанием при помощи математических знаков, символов, формул. Метод авто­матического анализа требует « максимальной формализации «пони? мания» языка: машина не различает словесные значения, но она вос­принимает и различает звуковые различия в выражении этих значе­ний. Следовательно, нужно попытаться установить строгие соответ­ствия между значениями и выражающими эти значения формальными признаками слов и их объединений — для того, чтобы научить маши­ну «узнавать» по формальному признаку скрытое за ним значение. Еще одно требование нового метода — требование алгоритмизации описаний языка. Алгоритм — это строгая система правил, руковод­ствуясь которой машина может переводить с одного языка на другой предложения и их цепи, автоматически извлекать из текста библио­графическую или тематическую информацию и осуществлять другие виды автоматической обработки письменной (в будущем, возможно, и устной) речи.

Таким образом, новый метод прочно связывает языкознание с математикой и электронно-вычислительной техникой (тем самым усложняется подготовка специалистов в области науки о языке), решает ряд задач прикладного языкознания, обещает новые открытия и в области лингвистической теории, в частности обогащает традиции формально-грамматической школы Ф. Ф. Фортунатова, стремившей­ся получить формальные классификации языковых фактов.

Со структурным и количественным методами и методом автома­тического анализа связано формирование еще двух методов, исполь­зующих кибернетику и формально-математическую логику. Эти ме­тоды, если они разовьются, могут получить название кибернетичес­кого и формально-логического. Первый своим предметом исследования будет иметь язык как сложную управляемую и самоуправляе­мую, саморегулируемую систему, а второй — язык как систему эле­ментов, связанных отношениями, отражаемыми формально-матема­тической логикой.

Не очень трудно уловить даже из этого беглого и очень схематич­ного обзора наиболее определившихся в современной науке лингви­стических методов три весьма существенных для теории обстоятель­ства.

Первое — это объективный характер методов, их не зависящая от воли и желаний исследователей связь между собой. Методы фор­мируются не потому, что кому-то из ученых «захотелось», чтобы воз­ник еще один метод. Методы формируются потому, что процесс позна­ния, развитие науки, закономерно выдвигает новые задачи, показы­вает язык с новых сторон и в новых связях и отношениях. Сущность, своеобразие того или иного лингвистического метода, как правило, становятся отчетливо видимыми уже после того, как этот метод ок­репнет и будет воплощен в практике работы многих ученых. Ученый всегда решает те или иные конкретные исследовательские задачи, опирается на те или иные философские и общелингвистические прин­ципы, идет по тому или иному теоретическому пути. При этом ученый может и не знать, какой из сложившихся лингвистических методов ему служит, им поддерживается или отвергается. Только движение науки в целом обнаруживает систему действующих лингвистических методов, позволяет различать отдельные методы и осознавать их свое­образие.

Второе — это увеличение, в связи с развитием системы методов, предметов лингвистического исследования. Объектом изучения для разных лингвистических методов был и остается язык. Однако пред­меты изучения и главные задачи исследования у разных методов не­одинаковы. Язык многосторонен, он не только предполагает, но и допускает «видение» его наукой под разными углами зрения, что и приводит к несовпадению предметов лингвистического изучения представителями сравнительно-исторического метода (материальное ге­нетическое родство языков), описательного метода (построение и действие структуры языка в определенный период его развития), структурного метода (структурно-системная организация элементов и категорий языка), сопоставительного метода (сходство и различия единиц и категорий в исторически родственных и неродственных язы­ках), метода автоматического анализа (язык как воспринимающая, перерабатывающая и передающая информацию система) и т. д.

Третье — это взаимодействие и различие метода и лингвистичес­кого направления, или школы. Лингвистическое направление — это совокупность ученых и их трудов, опирающихся на один и тот же метод. Не все представители одного и того же направления отчетливо видят и осознают существо метода, которым пользуются. Лишь тео­ретически наиболее сильные исследователи формулируют ясно пред­мет исследования, связанные с ним главные исследовательские за­дачи и теоретически указывают пути к их решению.

39 Структурное описание естественного языка.

Что касается структурной сложности естественного языка, то язык называют самой сложной из знаковых систем.

По структурному основанию различают также детерминированные и вероятностные семиотические системы. Естественный язык принадлежит к вероятностным системам, в которых порядок следования элементов не является жёстким, а носит вероятностный характер.

Семиотические системы разделяют также на динамические, подвижные и статические, неподвижные. Элементы динамических систем меняют своё положение по отношению друг к другу, тогда как состояние элементов в статических системах неподвижно, устойчиво. Естественный язык относят к динамическим системам, хотя в нём присутствует и статические признаки.

Ещё одной структурной характеристикой знаковых систем является их полнота. Полную систему можно определить как систему со знаками, представляющими все теоретически возможные комбинации определённой длины из элементов заданного множества. Соответственно, неполную систему можно охарактеризовать как обладающую определённой степенью избыточности систему, в которой для выражения знаков используются не все из возможных комбинаций заданных элементов. Естественный язык является неполной системой, обладающей высокой степенью избыточности.

Различия между системами знаков в их способности меняться делают возможным их классификацию на открытые и закрытые системы. Открытые системы в процессе своего функционирования могут включать в себя новые знаки и характеризуются более высокой адаптивностью по сравнению с закрытыми системами, не способными к изменению. Способность изменяться присуща и человеческому языку.

40 Теоретическая адекватность и прикладная эффективность лингвистических моделей.

Прикладная лингвистика также использует и метод классификации, и метод моделирования. Однако поскольку задачи прикладной лингвистики сосредоточены в области оптимизации функций языка, а оптимизация определяется конкретной задачей, то в прикладной лингвистике широкое распространение имеет познавательная установка, известная под несколько ироническим названием «Фокус-покус» (более уважительное название – «инженерный подход»). Эта установка в качестве основной ценности выдвигает не познание того, «как все обстоит на самом деле», а решение конкретной задачи, в частном случае – удовлетворение требований «заказчика», преследующего свои собственные цели. Это, впрочем, не означает, что результаты прикладных исследований не представляют никакой ценности для теории языка: напротив, прикладные модели оказывают значительное влияние на лингвистическую теорию, способствуя обновлению концептуального аппарата современного языкознания.

В силу сказанного важнейшим общим свойством методов прикладной лингвистики является ориентация на создание такой модели данной проблемной области, которая отображает только те ее свойства, которые необходимы для решения конкретной практической задачи. Иными словами, если теоретическое исследование в идеале стремится к полному описанию проблемной области со всеми ее сложностями и т.п., то прикладное описание обязано удовлетворять только данной конкретной задаче. Оно, конечно, может обладать и большей, чем это необходимо для решения конкретной прикладной задачи, описательной адекватностью и объяснительной силой, но принципиально этого от него не требуется.

Суммируя основные частные отличия прикладных моделей от теоретических и описательных, можно сказать, что прикладные модели в целом ориентированы на конкретные подъязыки, а не весь язык в целом; они часто (но не всегда) требуют большей степени формализации; прикладные модели используют знания о языке выборочно; прикладные модели не делают различий между собственно лингвистическими и экстралингвистическими аспектами семантики языковых выражений; прикладные модели в существенно большей степени огрубляют моделируемый объект, чем теоретические модели и, наконец, прикладные модели не налагают никаких существенных ограничений на инструмент моделирования.

41 Основные направления современной прикладной лингвистики.

Прикладна́я лингви́стика (прикладное языкознание) — наряду с теоретической лингвистикой является частью науки, занимающейся языком. Специализируется на решении практических задач, связанных с изучением языка, а также на практическом использовании лингвистической теории в других областях.

Основные направления прикладной лингвистики, связанные с изучением языка:

  • лексикография — теория и практика составления словарей;

  • лингводидактика — наука о разработках методик обучения иностранному языку;

  • терминоведение — наука об упорядочении и стандартизации научно-технической терминологии;

  • переводоведение — теория перевода.

Основные направления прикладной лингвистики, связанные с практическими приложениями:

  • Компьютерная лингвистика - направление искусственного интеллекта, которое ставит своей целью использование математических моделей для описания естественных языков.

    • Машинный перевод - процесс перевода текстов (письменных, а в идеале и устных) с одного естественного языка на другой с помощью специальной компьютерной программы

    • Автоматическое распознавание символов (англ. OCR)

    • Автоматическое распознавание речи (англ. ASR)

    • Автоматическое извлечение данных (англ. Data Mining)

    • Автоматическое реферирование текстов

    • Построение систем управления знаниями

    • Создание электронных словарейтезаурусовонтологий

    • Корпусная лингвистика, создание и использование электронных корпусов текстов

  • Лингвистическая экспертиза (например, в судебной практике)

  • наука об упорядочении и стандартизации научно-технической терминологии

В рамках направления компьютерная лингвистика в широком смысле слова объединяются как компьютерное моделирование с целью проверки адекватности теоретических формально-математических моделей языка и его отдельных уровней, так и применение различных математических методов для решения конкретных прикладных задач в различных системах обработки информации. Среди современных направлений компьютерной лингвистики можно выделить следующие:

-Машинный перевод

-Речевые технологии (в частности, автоматическое распознавание речи, ASR – automatic speech recognition)

-Лингвистическое обеспечение информационного поиска

-Автоматическое извлечение данных (Data Mining)

-Автоматическое реферирование текстов

-Создание электронных лексикографических ресурсов (словарей, онтологий)

-Корпусная лингвистика (создание и использование электронных корпусов текстов)

-Разработка вопросно-ответных систем

Часть данных направлений, а также разработка систем автоматического анализа на разных языковых уровнях: морфологических анализаторов (парсеров), систем автоматического синтаксического анализа и т.п. часто выделяют в отдельную область - автоматическая обработка естественного языка (Natural Language Processing, NLP — общее направление искусственного интеллекта и компьютерной лингвистики.)

+++

Прикладна́я лингви́стика (прикладное языкознание) — наряду с теоретической лингвистикой является частью науки, занимающейся языком. Специализируется на решении практических задач, связанных с изучением языка, а также на практическом использовании лингвистической теории в других областях.

Основные направления прикладной лингвистики, связанные с изучением языка:

-лексикография — теория и практика составления словарей;

-лингводидактика — наука о разработках методик обучения иностранному языку;

-терминоведение — наука об упорядочении и стандартизации научно-технической терминологии;

-переводоведение — теория перевода.

Основные направления прикладной лингвистики (англ. applied linguistics), связанные с практическими приложениями:

-Компьютерная лингвистика (англ. computational linguistics):

-Машинный перевод

-Автоматическое распознавание символов (англ. OCR)

-Автоматическое распознавание речи (англ. ASR)

-Автоматическое извлечение данных (англ. Data Mining)

-Автоматическое реферирование текстов

-Построение систем управления знаниями

-Создание электронных словарейтезаурусовонтологий

-Корпусная лингвистика, создание и использование электронных корпусов текстов

-Лингвистическая экспертиза (например, в судебной практике)

-наука об упорядочении и стандартизации научно-технической терминологии

42 Модели исследования (модели деятельности лингвиста); их общая специфика и частные разновидности.

В зависимости от предмета моделирования и того, какая сторона речевой деятельности является предметом моделирования, модели речевой деятельности делятся на модели анализа, модели синтеза, порождающие и исследовательские.

• Исследовательские модели можно подразделить на три класса в зависимости от того, какая информация используется в них в качестве исходной. В моделях первого класса в качестве исходной информации используется только текст, и все сведения о системе, т.е. языке, порождающем этот текст, извлекаются исключительно из текстовых данных. Это классические дешифровочные модели. В моделях второго класса считается заданным не только текст, но и множество правильных фраз данного языка. Практически это значит, что при разработке модели лингвист прибегает к помощи информанта, который по поводу каждой предъявляемой ему фразы должен говорить, правильна она или нет. Информантом может быть и сам лингвист, если он в совершенстве владеет изучаемым языком. Наконец, в моделях третьего класса считаются заданными не только текст и множество правильных фраз, но и множество семантических инвариантов. Практически это значит, что информант должен определять не только правильность каждой предъявляемой ему фразы, но и о любых двух фразах говорить, значат ли они одно и то же или нет. Модели этого класса близки традиционным описаниям. Их смысл сводится к тому, чтобы исследовать какое-либо лингвистическое явление на базе текстов, в результате получается, например, словарь или какая-либо грамматика или ее правила, или же результатом будет описание какого-либо лингвистического явления. Например, в переводе - описание какой-либо трансформации на базе трансформационной модели перевода. Исследовательские модели сейчас активно разрабатываются в корпусной лингвистике, когда исследуется какое-либо множество текстов и, например, строится модель словарной статьи для включения ее в словарь.

Признаки

 

Тип модели

Что известно лингвисту

ВХОД - Характер исходной информации

ВЫХОД-Характер конечной информации

Цель

Исследовательские

Текст (и множество правильных фраз)

Текст

Грамматика и/или словарь

Смоделировать деятельность лингвиста

43 Классификация лингвистических моделей.

Модель в лингвистике - искусственно создаваемое лингвистом реальное или мысленное устройство, воспроизводящее, имитирующее своим поведением (обычно в упрощенном виде) поведение оригинала в лингвистических целях. Существует множество определений моделей в лингвистике. Чаще всего под термином понимают:

• модель -тип, образец (language pattern) каких-либо текстовых единиц (слов, предложений);  • модель – символы, схемы для описания языковых объектов (ПР: схема  модели составляющих в синтаксисе),  • модель – формализованная теория структуры с фиксированным метаязыком (ПР: формальные грамматики).

Главная цель моделирования в лингвистике - это моделирование целостной языковой способности человека.

Базовая классификация лингвистических моделей

1. по охвату структуры языка: * общие (глобальные) стремятся охватить весь язык: (vocabulary, grammar) * частные: фонетическая модель русского языка, модель системы гласных

Частная модель обычно входит в набор частных моделей, описывающий определенный уровень языка: • фонологический уровень • морфологический уровень  • синтаксический • лексико-семантический

2. по типологическому статусу: * универсальные стремятся охватить все языки мира:  * специфические характерны для определенного языка или группы языков: мягкость - твердость согласных рус. языка (не действует в англ., франц.)

3. по гносеологическому статусу: * модели языка * модели лингвистических знаний (различные линг.школы) * модели деятельности лингвиста

4. по конечной цели исследования  * теоретические * описательные * прикладные

5. по используемым методам * математические модели * психологические модели * социологические модели

6. по функциональному статусу * абстрактно обобщающие модели * действующие

7. по используемым материальным средствам * графические * символьные * компьютерные

8. В зависимости от предмета моделирования и того, какая сторона речевой деятельности является предметом моделирования, модели речевой деятельности делятся на модели анализа, модели синтеза, порождающие и исследовательские. Это базовая классификация в ФМЛ.

Рассмотрим эти модели на следующей схеме: 

Признаки

 

Тип модели

Что известно лингвисту

ВХОД - Характер исходной информации

ВЫХОД-Характер конечной информации

Цель

Исследовательские

Текст (и множество правильных фраз)

Текст

Грамматика и/или словарь

Смоделировать деятельность лингвиста

Аналитические

Грамматика и словарь

Текст

Изображение структуры текста

Смоделировать понимание текста

Синтетические

Грамматика и словарь

Изображение структуры текста

Текст

Смоделировать производство -генерацию текста

Порождающие

Грамматика и словарь

Алфавит символов и правила образования и преобразования фраз

Множество правильных фраз и изображение их структуры

Смоделировать умение отличать правильное от неправильного в языке

Моделью анализа называется конечное число правил, способных проанализировать бесконечное число предложений данного языка. Синтаксические аналитические модели получают на «входе» текст, а на «выходе» выдают для каждого предложения запись его синтаксической структуры. Семантические аналитические модели получают на «входе» тот же материал, а на «выходе» выдают смысловую запись (изображение смысла) каждого предложения на специальном семантическом языке.

• Моделью синтеза называется конечное число правил, способных построить бесконечно большое число правильных предложений. Синтаксические синтетические модели используют в качестве исходной информации запись синтаксической структуры предложений, а на выходе выдают правильные предложения данного языка. Семантические синтетические модели получают на входе смысловую запись некоторого предложения на специальном семантическом языке и выдают на выходе множество предложений естественного языка, синонимичных данному предложению.

• Помимо моделей анализа и синтеза, существуют еще так называемые порождающие модели, в некотором смысле промежуточные между моделями анализа и синтеза. Порождающей моделью называется устройство, содержащее алфавит символов и конечное число правил образования (и преобразования) выражений из элементов этого алфавита, способное построить бесконечное множество правильных предложений данного языка и приписать каждому из них некоторую структурную», характеристику.

• Исследовательские модели можно подразделить на три класса в зависимости от того, какая информация используется в них в качестве исходной. В моделях первого класса в качестве исходной информации используется только текст, и все сведения о системе, т.е. языке, порождающем этот текст, извлекаются исключительно из текстовых данных. Это классические дешифровочные модели. В моделях второго класса считается заданным не только текст, но и множество правильных фраз данного языка. Практически это значит, что при разработке модели лингвист прибегает к помощи информанта, который по поводу каждой предъявляемой ему фразы должен говорить, правильна она или нет. Информантом может быть и сам лингвист, если он в совершенстве владеет изучаемым языком. Наконец, в моделях третьего класса считаются заданными не только текст и множество правильных фраз, но и множество семантических инвариантов. Практически это значит, что информант должен определять не только правильность каждой предъявляемой ему фразы, но и о любых двух фразах говорить, значат ли они одно и то же или нет. Модели этого класса близки традиционным описаниям. Их смысл сводится к тому, чтобы исследовать какое-либо лингвистическое явление на базе текстов, в результате получается, например, словарь или какая-либо грамматика или ее правила, или же результатом будет описание какого-либо лингвистического явления. Например, в переводе - описание какой-либо трансформации на базе трансформационной модели перевода. Исследовательские модели сейчас активно разрабатываются в корпусной лингвистике, когда исследуется какое-либо множество текстов и, например, строится модель словарной статьи для включения ее в словарь.

44 Использование ЭВМ в языкознании.

Задачи современной науки поставили в порядок дня использование компьютерной техники для автоматической обработки текстов.

Здесь следует различать следующие основные направления: машинный перевод, автоматизация лексикографических работ, отдельные виды автоматизации собственно лингвистических исследований и автоматический поиск библиографической информации.

Автоматизация лексикографических работ фактически уже существует и у нас и за рубежом. Успешно развивается компьютерная лексикография.

Автоматизированные лексикографические системы позволяют хранить и обрабатывать большие массивы словарной и текстовой информации, создавать целые лексикографические системы для одно- и многоязычных словарей, конкордансов (словарей одного автора) и контекстологических словарей.

В связи с этим нельзя не упомянуть о том, что в настоящее время создается машинный фонд русского языка, в котором будет храниться информация о всех возможных зафиксированных единицах русского языка, начиная с древнерусских текстов и до современных, включая научные и вообще все возможные типы текстов. Фонд должен охватить десятки миллионов слов. Накопленную таким образом информацию можно будет использовать для самых разнообразных целей.

За последнее десятилетие работы с использованием компьютеров для усовершенствования лингвистической теории и оптимизации преподавания на этой основе иностранных языков интенсивно ведутся и в других странах, особенно в Англии (Дж. Лич).

Машинные лингвистические информационные базы накапливают инвентарь сведений, пригодных для решения разного рода задач автоматической переработки научной и научно-технической информации —для автоматического поиска информации и решения других библиографических задач, для автоматического реферирования и индексирования.

Автоматический поиск библиографической информации представляется наиболее перспективным направлением применения ЭВМ в связи с лингвистикой, без него современному ученому все труднее и труднее справляться с обрушивающимся на него потоком информации.

Искусственный язык, предназначенный для записи семантической информации и последующего использования ее в информационно-поисковых системах, называется информационно-поисковым языком. Словарь, специально организованный для сопоставления естественного и информационно-поискового языка, называется информационно-поисковым тезаурусом. Тезаурус содержит список дескрипторов, т.е. лексических единиц информационно-поискового языка. Дескриптор соответствует группе ключевых слов естественного языка. Группе синонимов соответствует один дескриптор, а многозначному слову — группа дескрипторов.

Процедура составления информационно-поискового тезауруса состоит из следующих операций: определение тематического охвата тезауруса, сбор исходного массива ключевых слов, их лексикографическая обработка, установление условной эквивалентности между ними, отбор на этой основе дескрипторов и установление парадигматических отношений между ними и, наконец, окончательное оформление тезауруса. Заметим, что вся эта работа проводится на лингвистической основе. Так, например, установление условной эквивалентности проверяется по текстам, в которых встречаются ключевые слова. Если замена одного слова другим во всех контекстах не приводит к искажению смысла с точки зрения специалиста, то между словами имеет место условная эквивалентность.

Темпы развития науки непрерывно убыстряются, и сейчас невозможно прогнозировать, какие науки выйдут на передний край в ближайшем будущем. Поэтому современному ученому нужна широкая подготовка. Ему недостаточно знакомства с достижениями в своей области. Иметь широкий кругозор — значит иметь представление и о том, что делается в других специальностях. Компьютерная неподготовленность филологов и неоснащенность школ и гуманитарных вузов компьютерами задерживали применение этой техники для перечисленных выше целей. В 1 9 8 6 —1987 годах в административном порядке проведена кампания по ликвидации компьютерной неграмотности среди преподавателей высшей школы с целью подготовки лингвистов к использованию вычислительной техники в лингвистических исследованиях и при обучении языкам.

За свойственным некоторым направлениям Языкознания первой половины 20 века сосредоточением только на изучение языка как «предмета в самом себе» с середины 20 века следует сближение Языкознания с физико-математическими науками, в частности с математикой; возникает особая область математики – математическая лингвистика, включающая математическую формальную (алгебраическую) теорию грамматик и статистическую теорию языка (использующую методы математической статистики, теории вероятностей и теории информации). Методы математической логики применяются для формального описания категорий естественных языков. Языкознание оказалось той гуманитарной наукой, которая, не порывая связей с другими науками о человеке и его культуре, первой решительно стала использовать не только инструментальные методы наблюдения (в фонетике) и экспериментальные приёмы (в психолингвистике), но и систематически применять математические способы (в том числе и ЭВМ) для получения и записи своих выводов. Быстро развивается вычислительная лингвистика, цель которой – создание сложных систем обслуживания ЭВМ посредством языка, делающих возможным прямой разговор человека с ЭВМ, автоматическую переработку, запоминание, поиск и вывод информации в речевой форме и тому подобное (иногда часть этих задач объединяют термином «инженерная лингвистика»). Существенная роль языка и Языкознания для компьютерной революции (в особенности в связи с появлением к середины 80-х годов персональных и других компьютеров, способных вести диалог с «потребителем» на естественном языке), что приводит к дальнейшему стимулированию роста именно тех областей Языкознания, которые особенно важны для этих новейших практических приложений. Многие традиционные области Языкознания существенно изменяют методику исследования благодаря возможности использовать в них ЭВМ: становится возможным построение программ, реконструирующих разные альтернативные варианты фонологических и грамматических уровней праязыков, машинное определение времени разделения родственных языков методом лексикостатистики, составление машинных словарей для обширных корпусов древних письменных текстов и проведение не ЭВМ вспомогательных работ для дешифровки древних письменностей, запись в памяти машины полного грамматического словаря конкретного языка и тому подобное. Характер применения этих вычислительных методов сближает вычислительное Языкознание с такими науками, как экспериментальная физика, где проверка определяющих математических моделей осуществляется путём обработки на ЭВМ соответственно экспериментального материала. Описание мира и его фрагментов в физики и других естественных науках использует естественный язык; им в какой-то мере продолжают пользоваться и после выработки на его основе специально математического языка; свойства естественного языка сохраняют своё значение для этих наук и до настоящего времени. Поэтому необходимость учета особенностей естественного языка и достижений Языкознания признаются крупнейшими представителями физики и других естественных наук.

45 Понятие модели. Специфика применения общенаучного метода моделирования в лингвистике.

Модель - упрощенное представление о реальном объекте, процессе или явлении. Модель - это, как правило, искусственно созданный объект в виде схемы, математических формул, физической конструкции, наборов данных и алгоритмов их обработки и т.п.  Модель воспроизводит в специально оговоренном виде строение и свойства исследуемого объекта. Исследуемый объект, по отношению к которому изготавливается модель, называется оригиналом, образцом, прототипом. Модель - это объект, используемый вместо другого объекта с какой-то целью.

Моделирование — это метод познания, состоящий в создании и исследовании моделей.

Каждый объект имеет большое количество различных свойств. В процессе построения модели выделяются главные, наиболее существенные, свойства. Так, модель самолета должна иметь геометрическое подобие оригиналу, модель атома — правильно отражать физические взаимодействия, архитектурный макет города – ландшафт и т.д.

Модель — это некий новый объект, который отражает  существенные особенности изучаемого объекта, явления или процесса.

Цели моделирования.

-понять сущность изучаемого объекта,

-научиться управлять объектом и определять наилучшие способы управления,

-прогнозировать прямые или косвенные последствия,

-решать прикладные задачи.

Разные науки исследуют объекты и процессы под разным углом зрения и строят различные типы моделей. В физике изучаются процессы взаимодействия и движения объектов, в химии — их внутреннее строение, в биологии — поведение живых организмов и т.д. Возьмем в качестве примера человека, в разных науках он исследуется в рамках различных моделей. В рамках механики его можно рассматривать как материальную точку, в химии — как объект, состоящий из различных химических веществ, в биологии — как систему, стремящуюся к самосохранению и т.д. С другой стороны, разные объекты могут описываться одной моделью. Так, в механике различные материальные тела (от планеты до песчинки) могут рассматриваться как материальные точки. Один и тот же объект может иметь множество моделей, а разные объекты могут описываться одной моделью.

Классификация моделей

Основные признаки классификации моделей:

Область использования;

Учет в модели временного фактора (динамики);

Отрасль знаний;

Способ представления моделей.

1. Классификация по области использования

Модели

Учебные

Опытные

Научно - технические

Игровые

Имитационные

Тренажеры, наглядные пособия, обучающие программы

Модели корабля, машины (для исследования будущих характеристик)

Синхрофазотрон, прибор, имитирующий разряд молнии

Деловые, военные, экономические, спортивные  игры,

Новое лекарство испытывают на мышах, чтобы выявить побочные явления, уточнить дозировки

{Опытные модели — это уменьшенные или увеличенные копии проектируемого объекта. Их называют также натурными и используют для исследования объекта и прогнозирования его будущих характеристик.

Научно-технические модели создают для исследования процессов и явлений.

Имитационные модели не просто отражают реальность с той или иной степенью точности, а имитируют ее. Эксперимент либо много­кратно повторяется, чтобы изучить и оценить последствия каких-либо действий на реальную обстановку, либо проводится одновременно со многими другими похожими объектами, но поставленными в разные условия. Подобный метод выбора правильного решения называется методом проб и ошибок.}

2. Классификация с учетом фактора времени: статическая и динамическая модели.

{Статическая модель — это как бы одномоментный срез информации по объекту. Например, обследование учащихся в стоматологической поликлинике дает картину состояния их ротовой полости на данный момент времени: число молочных и постоянных зубов, пломб, дефектов и т. п.

Динамическая модель позволяет увидеть изменения объекта во вре­мени. В примере с поликлиникой карточку школьника, отражающую изменения, происходящие с его зубами за многие годы, можно считать динамической моделью.

Как видно из примеров, один и тот же объект, возможно, изучать, применяя и статическую и динамическую модели.}

3. Классификация по способу представления

Материальные и информационные модели

Модели

Материальные

Информационные

Знаковые

Вербальные

Компьютерные

Некомпьютерные

{Материальные модели иначе можно назвать предметными, физическими. Они воспроизводят геометрические и физические свойства оригинала и всегда имеют реальное воплощение. Самые простые примеры материальных моделей — детские игрушки. По ним ребенок получает первое представление об окружающем мире. Двухлетний малыш играет с плюшевым медвежонком. Когда, спустя годы, ребенок увидит в зоопарке настоящего медведя, он без труда узнает его. Материальные модели — это, к примеру, чучела птиц в кабинете биологии, карты при изучении истории и географии, схемы солнечной системы и звездного неба на уроках астрономии, макет многоступенчатой ракеты и еще многое другое.

Информационные модели нельзя потрогать или увидеть воочию, они не имеют материального воплощения, потому что они строятся только на информации. В основе этого метода моделирования лежит информационный подход к изучению окружающей действительности.}

Информационная модель – совокупность информации, характеризующая свойства и состояние объекта, процесса, явления, а также взаимосвязь с внешним миром.

Знаковые и вербальные информационные модели

К информационным моделям можно отнести вербальные (от лат. «verbalize» — устный) модели, полученные в результате раздумий, умозаключений. {Они могут так и остаться мысленными или быть выражены словесно. Примером такой модели может стать наше поведение при переходе улицы. Человек анализирует ситуацию на дороге (что показывает светофор, как далеко находятся машины, с какой скоростью они движутся и т. п.) и вырабатывает свою модель поведения. Если ситуация смоделирована правильно, то переход будет безопасным, если нет, то может произойти авария. К таким моделям можно отнести и идею, возникшую у изобретателя, и музыкальную тему, промелькнувшую в голове композитора, и рифму, прозвучавшую пока еще в сознании поэта.}

Вербальная модель – информационная модель в мысленной или разговорной форме.

Знаковая модель – информационная модель, выраженная специальными знаками, т. е. средствами любого формального языка.

{Знаковые модели окружают нас повсюду. Это рисунки, тексты, графики и схемы... Вербальные и знаковые модели, как правило, взаимосвязаны. Мысленный образ, родившийся в мозгу человека, может быть облечен в знаковую форму. И наоборот, знаковая модель помогает сформировать в сознании верный мысленный образ.}

По форме представления можно выделить следующие виды информационных моделей:

-геометрические модели — графические формы и объемные конструкции;

-словесные модели — устные и письменные описания с использованием иллюстраций;

-математические модели — математические формулы, отображающие связь различных параметров объекта или процесса;

-структурные модели — схемы, графики, таблицы и т. п.;

-логические модели — модели, в которых представлены различные варианты выбора действий на основе -умозаключений и анализа условий;

-специальные модели — ноты, химические формулы и т. п.;

-компьютерные и некомпьютерные модели.

-Компьютерные и некомпьютерные модели

{Если модель выражена в абстрактной, умозрительной форме, то нужны некоторые знаковые системы, позволяющие описать ее — специальные языки, чертежи, схемы, графики, таблицы, алгоритмы, математические формулы и т. п. Здесь могут быть использованы два варианта инструментария: либо традиционный набор инженера или конструктора (карандаш, линейка), либо самый совершенный в наши дни прибор — компьютер.}

4. Классификации информационных знаковых моделей: по способу реализации:

компьютерные и некомпьютерные модели.

Компьютерная модель – модель, реализованная средствами программной среды.

Общенаучный метод моделирования и специфика его применения в лингвистике

Метод моделирования - центральный исследовательский метод в науке.

Моделирование  в науке - это выяснение свойств какого-либо предмета при помощи построения его модели.

Моделью можно назвать образ какого-либо объекта, используемый в определенных условиях в качестве его заместителя (фотография в паспорте - модель человека).

Общие свойства моделей:

* условность * образ может быть не только материальным, но и мысленным и передаваться посредством знаковой системы * моделью может быть не только образ, но и прообраз оригинала * модель чаще всего является гомоморфной оригиналу (то есть многим элементам оригинала соответствует меньшее количество элементов модели в отличие от изоморфизма)

Моделирование необходимо предполагает использование абстракции и идеализации.  Отображая релевантные существенные (с точки зрения исследования) свойства оригинала и отвлекаясь от несущественных, модель выступает как некоторый абстрактный идеализированный объект.  Всякая модель строится на основе гипотезы о возможном устройстве оригинала и представляет собой функциональный аналог оригинала. что позволяет переносить знания с модели на оригинал.  Критерием адекватности модели является эксперимент.

В идеале модель должна быть формальной (т.е. в ней должны быть в явном виде и однозначно заданы исходные объекты, связывающие их отношения и правила обращения с ними) и обладать объяснительной силой (т.е. не только объяснять факты или данные экспериментов, необъяснимые с точки зрения уже существующей теории, но и предсказывать неизвестное раньше, хотя и принципиально возможное поведение оригинала, которое позднее должно подтверждаться данными наблюдения или экспериментов).

Основные теоретические требования к модели:

1. полнота модели - способность отражать все факты, на которые она рассчитана, на охват которых она претендует

2. простота - удобство, использования как можно меньшего числа средств (символов, правил) для достижения поставленной научной цели

3. объяснительная сила - способность модели вскрывать причины наблюдаемых фактов и предсказывать новые факты (например. модели исторического изменения слова; системы машинного перевода в очень малой степени объяснительные)

4. адекватность - свойство максимальной похожести на моделируемый объект, на оригинал, можно свести к объяснительной силе или теоретико-множественному соответствию

5. экономность - экономичное использование энергетических и временных ресурсов при применении модели

6. точность - возможность выполнения операций представляемым моделью формальным аппаратом

7. эстетические свойства - красота модели

Прикладные критерий: главное - удобство модели.  Для моделирования языка очень важны логические средства реализации модели (компьютерное воплощение модели).

Модель в лингвистике - искусственно создаваемое лингвистом реальное или мысленное устройство, воспроизводящее, имитирующее своим поведением (обычно в упрощенном виде) поведение оригинала в лингвистических целях. Существует множество определений моделей в лингвистике. Чаще всего под термином понимают:

• модель -тип, образец (language pattern) каких-либо текстовых единиц (слов, предложений);  • модель – символы, схемы для описания языковых объектов (ПР: схема  модели составляющих в синтаксисе),  • модель – формализованная теория структуры с фиксированным метаязыком (ПР: формальные грамматики).

Главная цель моделирования в лингвистике - это моделирование целостной языковой способности человека.

Понятие лингвистической модели возникло в структурной лингвистике, но вошло в научный обиход  в 60-70 гг. 20 в. с возникновением мат. лингвистики и проникновением в лингвистику мат. методов.

Содержание термина "модель" в современной лингвистике в значительной степени охватывалось ранее термином "теория" (особенно Ельмслевым).  Считается, что наименования модель заслуживает лишь такая теория. которая достаточно эксплицитно изложена и в достаточной степени формализована (в идеале каждая модель должна допускать реализацию на ЭВМ).

Контруирование модели - не только одно из средств отображения языковых явлений, но и объективный практический критерий проверки истинности знаний о языке.  В единстве с другими методами изучения языка моделирование выступает как средство углубления познания скрытых механизмов речевой деятельности, его движения от относительно примитивных к более содержательным моделям, полнее раскрывающим сущность языка.

Внутри языка как системы существует принцип моделирования: одни его подсистемы моделируют другие, например, система письменной речи является моделью устной речи; внутри письменной речи мы имеем дело с несколькими моделями (печатной, рукописной); план выражения является моделью плана содержания.

Метод моделирования обычно опирается на знаковые систем, но язык - сам знаковая система, т.е. слова мы моделируем при помощи слов.

Всякая модель, в том числе лингвистическая, должна быть формальной. Модель считается формальной, если в ней в явном виде и однозначно заданы исходные объекты, связывающие их утверждения и правила обращения с ними (правила образования или выделения новых объектов и утверждений). В идеале всякая формальная модель является математической системой. Поэтому в некотором смысле понятие формальности равнозначно понятию математичности, точности, или однозначности.

Формальность, точность, однозначность — это свойство языка, на котором излагается теория. Само по себе это свойство не обеспечивает совпадения предсказаний формальной теории с объективными экспериментальными данными. Точность теории делает возможной постановку недвусмысленных экспериментов, которые способны подтвердить или опровергнуть ее, но никакой необходимой логической связи между точностью и истинностью теории нет и не может быть.

Формальная модель связывается с опытными данными посредством той или иной интерпретации. Дать интерпретацию модели — значит указать правила, вероятностные или строгие, подстановки объектов некоторой предметной области, например языка, вместо объектов (символов) модели.

46 Традиционные и нетрадиционные задачи прикладной лингвистики.

Одно из традиционных направлений прикладной лингвистики — участие в языковой политике государства.

Хотя возникновение прикладной лингвистики как автономной научной дисциплины относится к относительно недавнему прошлому (приблизительно к 1920-м годам), прикладные проблемы стояли перед языкознанием практически с самого начала его существования. Эти проблемы в конечном счете сводятся к оптимизации функций языка – будь то формирование и поддержание традиции чтения и понимания сакральных текстов (экзегетика и герменевтика) или обеспечение контактов между разными народами. В философии и лингвистической теории принято различать коммуникативную, эпистемическую и когнитивную функции языка, которые, в свою очередь, разделяются на более мелкие функции. Так, коммуникативная функция включает в себя фатическую (контактоустанавливающую) и информационную (в узком смысле) функции, функцию воздействия, социальную функцию (проявляющуюся в языковой политике). С точки зрения гносеологической (или, в западной традиции, эпистемической) функции, языковая система предстает как способ хранения и передачи знаний, а также как отражение специфически национального взгляда на мир. Когнитивная функция относится к той области жизни языка, которая связана с мышлением человека и с познанием действительности.

С функциональной точки зрения, прикладная лингвистика может быть определена как академическая дисциплина, в которой целенаправленно изучаются и разрабатываются способы оптимизации различных сфер функционирования языковой системы. Функции языка задают точки отсчета для классификации огромной области приложения лингвистических знаний. В оптимизацию коммуникативной функции вносят вклад такие дисциплины, как теория перевода, машинный перевод, теория и практика преподавания родного и неродного языка, теория и практика информационно-поисковых систем, создание информационных и, шире, искусственных языков, теория кодирования. Для оптимизации социальной функции языка – как части коммуникативной – значимы исследования в области социолингвистики (в частности, изучение и обоснование языковой политики), орфографии и орфоэпии, теории воздействия, политической лингвистики. Оптимизации гносеологической функции способствуют лексикография (в том числе компьютерная), исследования в области терминологии и терминографии, корпусная и полевая лингвистика. Наконец, целям оптимизации когнитивной функции служат исследования по компьютерной лингвистике, «лингвистической криминологии», психолингвистике и афазиологии, квантитативной лингвистике.

Курс основных задач прикладной лингвистики: 1. Переводы  2. Обучение иностранному языку, методики обучения, лингводидактика 3. Коммуникация с помощью технических средств 4. Создание искусственных языков 5. Информационный поиск 6. Аннотирование и реферирование текстов 7. Составление словарей (практическая лексикография) 8. Упорядочение, унификация и стандартизация научно-технической терминологии. 9. Организация библиографической информации 10. Транскрибирование устной речи 11. Эффективный типографический набор

Этот список можно продолжить, например, в настоящее время, в связи с развитием информационных технологий, прикладная лингвистика развивается по направлению автоматизации основных задач: 1. Машинный перевод, словари 2. Компьютерная лингводидактика 3. Компьютерная лингвистика (все приложения традиционной лингвистики в машинных средах) 4. Математическая лингвистика(разработка формальных моделей языков) 5. Автоматическая обработка естественных языков (распознавание и синтез речи, автоматизация информационных работ, автоматические системы информационного поиска) 6. Когнитивная лингвистика (частотный анализ текстов)

47 Системно-структурный подход к языковым явлениям и его отношение к другим возможным подходам. Понятие эвристики.

По «Эвристике» как по науке, информации ничтожно мало, она как довольно таки молодая наука плохо разработана с философской точки зрения, а вот с точки зрения математиков и физиков ненамного больше есть, но чаще всего авторы копируют друг у друга информацию, лишь мало чем, дополняя её.  

Эвристика  

специальные методы, используемые в процессе открытия нового (эвристические методы).

 Наука, изучающая продуктивное творческое мышление (эвристическая деятельность).

 Восходящий к Сократу метод обучения

Слово "эвристика" ведёт глубоко в историю. В соответствии со словарем, прилагательное "эвристический" означает "способствующий открытию". Оно является производным от "эврика", а слово "эврика", в свою очередь, произошло от греческого "heurisko" - "нахожу".

"Эврика!"-это восклицание древнего ученого и изобретателя Архимеда знакомо всем со школьной скамьи.  Это слово не просто констатация факта находки,  в нашем сознании оно ассоциируется с выражением высшего чувства удовлетворения, радости и восторга от найденного решения задачи,  которую до этого  никому  не удавалось решить  и  путь решения которой был тернист и долог.

"Эврика"-это финал поиска той истины, того знания, дорога к которому неизвестна, и не всегда нашедший эту истину может точно сказать, как он ее нашел.

Эвристика и техническое творчество.

2000 ЛЕТ! прошло, и в нашем лексиконе появилось слово "эвристика".  В наше время оно нашло широкое распространение. "Эвристическое мышление", "Эвристические приемы и методы",  "эвристическое свойство" и т.д. Произнося эти слова, мы не всегда задумываемся над тем,  какой смысл вкладываем в понятие "эвристика",  но в нашем  сознании  оно  всегда связано с творческой деятельностью.

     В научной литературе это понятие не имеет единого  толкования. В некоторых работах об интенсификации научно-технического творчества эвристика отождествляется с: 

психологией научного творчества:  "Психология научного творчества - эвристика изучает,  как решаются  научные  задачи,  требующие, кроме знаний и умений, также и сообразительности, догадки".

    Другие психологи считают,  что 

эвристика  -  это "абстрактно-аналитическая наука, изучающая один из структурных уровней организации творческой деятельности и ее продуктов".

Следующие определения эвристики:

 1.Специальные методы,  используемые в процессе открытия  (создания)  нового (эвристические методы). 

2.Наука, изучающая продуктивное творческое мышление (эвристическую деятельность). 

3.Восходящий к Сократу метод обучения (майевтика) .

     По мнению психологов,  эвристика - это отрасль знания, "изучающая формирование новых действий в необычной ситуации", она  может стать наукой "в том случае,  если эвристические процессы, приводящие к этим новым действиям, найдут наконец свое математическое описание".

      Приведенные высказывания (которых можно было бы  привести больше), свидетельствуют  о  том,  что эвристика как самостоятельная наука еще не сформировалась.

     Несмотря на большое количество научных трудов,  посвященных вопросам эвристики,  они, как правило, касаются ее частных проблем и  не  дают четкого представления ни об объекте,  ни о предмете эвристики, ни о ее статусе среди других наук.

     Попытка обобщения многочисленных концепций и формулирование на этой основе определения статуса  и  предмета  эвристики изложены в работах Буша Г.Я и Буша К.

     По определению авторов этой работы:

"Эвристика - это общенаучная теория решения проблемных задач, возникающих в человеческой деятельности и общении".

     Предметом эвристики является "выявление, обработка и упорядочение закономерностей,   механизмов   и   методологических средств антиципации  (предвосхищения) и конструирования нового знания и целеустремленных  способов  деятельности  и  общения, создаваемых на  основе обобщения прежнего опыта и опережающего отражения моделей будущего с целью более полного  удовлетворения потребностей людей".

     Множество толкований  эвристики говорит о разном содержании, которое вкладывают авторы различных  концепций  в  данное понятие. При этом общим и бесспорным является то,  что во всех случаях эвристика неразрывно связывается с творческой деятельностью, с творчеством.

     Общими звеньями,  связывающими в единую цепь понятия "эвристика" и "творчество",  являются представления о нетривиальности, неординарности, новизне и уникальности. Применительно к понятию "творчество" такими качествами характеризуется результат творческой деятельности, применительно к эвристике - методы и средства получения этого результата.

А про подход только это

системно - структурный метод, то есть Системный анализ — научный метод познания, представляющий собой последовательность действий по установлению структурных связей между переменными или элементами исследуемой системы. Опирается на комплекс общенаучных, экспериментальных, естественнонаучных, статистических, математических методов. 

Структурный и функциональный метод в лингвистике - два принципиальных подхода к изучению  языка -учащийся изучает структуру языка, т.е. правила, по которым строятся предложения: видовременные. Структурная лингвистика Совокупность воззрений на язык и методов его исследования, в основе которых лежит понимание языка как знаковой системы (см. Знак языковой) с четко выделимыми структурными элементами (единицами языка, их классами и пр.) и стремление к строгому (приближающемуся к точным наукам) описанию языка. Своё название С. л. получила благодаря особому вниманию к структуре языка, которая представляет собой сеть отношений (противопоставлений) между элементами языковой системы (см. Оппозиция в лингвистике), упорядоченных и находящихся в иерархической зависимости в пределах определённых уровней-учебники с подробным изложением грамматических правил, упражнениями, учебными текстами, различными дополнительными материалами. Твой преподаватель постоянно требовал: «прочитай и переведи». То есть ты изучал иностранный язык так называемым структурным методом. 

48 Проблемы компьютерного воплощения лингвистических моделей.

Разумеется, прикладные модели отличаются определенным упрощением, огрублением языковой реальности, но эта их черта не имеет ничего общего с упрощенчеством, с игнорированием реальной сложности моделируемого объекта. Как нельзя при осуществлении компьютеризации отмахнуться от языкового фактора, так нельзя отмахнуться и от многоаспектности, многоуровневости, „открытости" языкового механизма. Методология прикладного исследования должна предусматривать неуклонное повышение эффективности создаваемых моделей на основе все более полного учета реальных свойств языка.

Назовем лишь некоторые из наиболее фундаментальных качеств естественного языка: принципиальная нечеткость значения языковых выражений (эта нечеткость в полной мере относится и к деловой сфере общения, и даже к дефинируемым ее элементам — терминам [10]), динамичность языковой системы, образность номинации (основанная прежде всего на метафоричности), бесконечные творческие потенции в освоении новых знаний, семантическая мощь словаря (позволяющая выражать любую информацию с помощью конечного инвентаря элементов), гибкость в передаче эксплицитной и имплицитной информации, разнообразие функций (включающее коммуникативную, когнитивную, планирующую, управляющую, обучающую, эстетическую, метаязыковую и другие функции), специфическая системность (под которой имеется в виду не только членение языка на уровни, но и членение его на подъязыки — относительно независимые функционально-тематические подсистемы). В целом по числу своих внутренних диалектических противоречий естественный язык может быть с полным основанием оценен как сложнейший объект для моделирования. Достаточно упомянуть тот факт, что перечисленные С. Маркусом «пятьдесят две оппозиции между научным и поэтическим общением» [38] представляют, по сути, противоположные тенденции, присущие языку в целом (сюда входят: субъективность — объективность; переводимость — непереводимость; отсутствие синонимии — бесконечность синонимических средств; дискретность значения — континуальность значения; информативность — избыточность; логичность — нелогичность; алгебраичность — геометричность и т.д.). Да и сами поэтические и научные подъязыки диалектически связаны: это механизмы, служащие целям открытия, познания мира. Язык — незаменимый помощник в сфере рационального мышления, так жг как и в сферах эмоционального общения. Язык — это фактор регулирования практически любой человеческой деятельности.

Компьютерное моделирование языка и речевой деятельности нуждается в солидной теоретической базе, и фундаментальная наука должна вплотную заняться соответствующими актуальными проблемами. Нам нужны специальные теории, которые в настоящее время существуют в зачаточном состоянии либо отсутствуют вовсе. Думается, моделирование языков (естественных и искусственных) вписывается в проблему моделирования способностей человека. Языковая способность — это способность, делающая человека человеком, возникающая и развивающаяся под воздействием практических потребностей. Проявления ее многообразны, но в когнитивном плане следует особо подчеркнуть ее роль в рече-мыслительной деятельности, в организации памяти, в процессах аутокоммуникации. Предстоит развить теорию моделей языкового общения, теорию подъязыков естественного языка, теорию лингвистической семантики в ее связи с „экстралингвистическими" семан-тиками (упомянем хотя бы логическую, психологическую, социологическую, этическую, эстетическую, этнокультурную семантику). К числу более частных, но не менее важных направлений относятся, например, типология естественных и искусственных языков (заметим, что естественный язык все более впитывает в себя элементы „искусственности"), теория понимания текста, теория вербализации коммуникативного замысла, теория коммуникативных неудач, теория   семантической   эквивалентности   сообщений   и другие.

Практические выводы из сказанного очевидны. Лингвистика должна повернуться лицом к новым задачам, выдвигаемым компьютеризацией. У нас в стране начинают предприниматься некоторые меры для расширения подготовки языковедов по специальности „структурная, прикладная и математическая лингвистика", но здесь надо обратить особое внимание на овладение методами представления и обработки знаний. Очевидно, мы должны ставить вопрос и шире: компьютерная грамотность в стране в целом немыслима по большому счету без лингвистической грамотности. По-новому должно вестись и преподавание языковедческих предметов в школе (а у нас уже есть некоторый опыт развития у школьников творческого, самостоятельного, точного подхода к анализу фактов языка [19]). Назрела необходимость и в специальном отечественном журнале по компьютерной лингвистике. В свете очерченных перспектив, диктуемых жизнью, естественны те усилия, которые начинает наращивать издательство „Прогресс" в деле оперативного ознакомления советского читателя с опытом зарубежных коллег, исследующих язык в соответствии с его новым статусом в современном мире.

Проблемы взаимосвязи науки и практики сегодня преломляются для лингвистики через призму требований глобальной компьютеризации. Язык носит всепроникающий характер. Любая проблема информатики, искусственного интеллекта, экспертных систем и — шире — рационализации человеческой деятельности имеет языковой аспект. Подобно тому как советские специалисты по информатике ведут сейчас активную разъяснительную работу, направленную на устранение «досадного непонимания существа и растущей экономической значимости проблемы формирования и промышленной эксплуатации национальных информационных ресурсов», лингвисты-прикладники озабочены все еще часто встречающимся среди представителей технических наук непониманием сущности и роли вклада лингвистики в компьютеризацию, а также распространенным среди многих языковедов непониманием роли компьютеризации как стимула перестройки лингвистической теории. Постараемся в какой-то мере прояснить эти моменты.

Корень многих недоразумений кроется в неточном определении информационной природы естественного языка. Здесь важно иметь в виду, что язык — это не столько «форма выражения» готовых мыслей, сколько способ содержательной организации и представления знаний. Этот способ первичен, универсален, возникает с самим зарождением человеческого интеллекта и служит надежным инструментом его развития. Без широкого целенаправленного моделирования информационного механизма естественного языка и процессов речевой деятельности можно обходиться лишь до поры до времени. Компьютеризация разнообразных видов интеллектуальной деятельности (а это значит — практически любой деятельности человека) рано или поздно приводит к необходимости экспликации языковой способности пользователя ЭВМ с последующим созданием соответствующих банков знаний и машинных программ.

Что же конкретно заставляет уже сегодня говорить об остроте потребности в лингвистическом обеспечении компьютеризации? яркий образец конкретного взаимодействия общественных, естественных и технических наук).

Прежде всего укажем на гигантские объемы накопленной и постоянно создаваемой информации, которая подлежит обработке с помощью ЭВМ. Поскольку эта информация часто организована средствами естественного языка, ее реальное освоение возможно лишь при условии автоматической смысловой обработки текстов, без предварительной препарации их человеком. Лишь тогда откроется доступ в машину большим массивам организационно-управленческой, плановой, научно-технической, социально-политической, правовой, проектной, библиотечной, справочно-бытовой и прочей информации.

Эффективное использование знаний, содержащихся в текстах, требует новых стратегий обработки информации, отличных от традиционных логических подходов. Такие стратегии должны учитывать семантические законы естественного языка. Например, из высказывания Иван вернул мне книгу следует, что книга ранее была у меня (этот вывод мы делаем на основании той части толкования глагола вернуть, которая называется пресуппозицией). Или: из высказывания Он заставил мотор остановиться можно сделать заключение «Он остановил мотор нестандартным способом» (это так называемая коммуникативная импликатура, подсказываемая в данном случае именно тем способом выражения, который выбрал говорящий).

Далее, потребность в лингвистическом обеспечении обусловлена перспективной установкой на создание человеко-машинных систем решения интеллектуальных задач, Заметим, что нередко представители и гуманитарных, и естественных наук грешат рассмотрением компьютера как сугубо внешней силы, абсолютно отчужденной от человека. А между тем серьезный разговор об усилении природных возможностей человеческого разума должен предусматривать налаживание гибкого взаимодействия человека и машины. Оперативная, удобная, развивающаяся кооперация при таком взаимодействии будет опираться на естественный язык (точнее, определенный подъязык, связанный с некоторой сферой общения или классом решаемых задач).

Особо следует подчеркнуть необходимость учитывать лингвистическую семантику при построении языков представления знаний вне системы обработки текстов в ее полном виде. Даже в этом случае естественный язык служит надежной точкой отсчета: ведь и создатели систем, и пользователи говорят, пишут и думают преимущественно на естественном языке. Учет этого факта поможет в решении таких острых проблем компьютеризации, как унификация создаваемых систем и автоматизация по возможности большего числа процессов.

В социальном плане значимость лингвистических проблем компьютеризации связана с возникновением новых видов массовой деятельности, включающих построение искусственных языков и машинных словарей, разработку информационных банков, построение алгоритмов обработки текстов, разработку режимов, общения в системе „человек — компьютер — человек" и т. д. Вообще, языковой аспект немаловажен для всех основных направлений индустрии обработки знаний, таких, как сбор, создание, хранение, систематизация, распространение, интерпретация информации.

Замечу, что и с исторической точки зрения язык оказывается центральным фактором важнейших этапов развития информационной технологии: вспомним возникновение письменности, изобретение книгопечатания, создание искусственных информационных и алгоритмических языков, являющихся производными от естественного языка и формализующих некоторые из его функций. Наконец, с точки зрения науковедения, можно констатировать, что лингвистика входит в ядро складывающегося в настоящее время комплекса когнитивных наук, объединяемых по их интересу к проблемам организации, представления, обработки и использования знаний.

Итак, лингвистическое обеспечение автоматизированных систем — это совокупность средств, позволяющих осуществлять компьютеризацию языковой деятельности, сопровождающей (в явной или скрытой форме) практически любую интеллектуальную деятельность человека. С технологической и системной точек зрения речь идет о создании того или иного типа автоматизированной системы обработки текста (АСОТ)—некоторого процессора, на входе и на выходе которого присутствует текстовая информация на естественном языке. Типы АСОТ многообразны и могут быть нацелены на моделирование различных языковых процессов, таких, например, как диалоговое взаимодействие, сжатие информации, реферирование текста, логическая обработка содержания, перевод на другой естественный язык и т. д. С собственно лингвистической точки зрения процессы, осуществляемые в машине при решении подобных задач, сводятся к перезаписи информации на тех или иных (естественных и искусственных) языках. Внешние критерии, которыми руководствуются создатели АСОТ, подводятся под общую формулу «оптимизация общения человека и машины». Именно эту задачу решает такая комплексная научная дисциплина, как компьютерная (вычислительная) лингвистика и ее наиболее существенная часть — вычислительная семантика. Прикладные результаты, получаемые в данной области,— это семантические алгоритмы и семантические метаязыки, то есть модели процессов (извлечения информации из текста и воплощения ее в текст) и соответствующих языков представления знаний (на которых хранится и перерабатывается информация, извлеченная из текстов).

Разумеется, прикладные модели отличаются определенным упрощением, огрублением языковой реальности, но эта их черта не имеет ничего общего с упрощенчеством, с игнорированием реальной сложности моделируемого объекта. Как нельзя при осуществлении компьютеризации отмахнуться от языкового фактора, так нельзя отмахнуться и от многоаспектности, многоуровневости, „открытости" языкового механизма. Методология прикладного исследования должна предусматривать неуклонное повышение эффективности создаваемых моделей на основе все более полного учета реальных свойств языка.

Назовем лишь некоторые из наиболее фундаментальных качеств естественного языка: принципиальная нечеткость значения языковых выражений (эта нечеткость в полной мере относится и к деловой сфере общения, и даже к дефинируемым ее элементам — терминам [10]), динамичность языковой системы, образность номинации (основанная прежде всего на метафоричности), бесконечные творческие потенции в освоении новых знаний, семантическая мощь словаря (позволяющая выражать любую информацию с помощью конечного инвентаря элементов), гибкость в передаче эксплицитной и имплицитной информации, разнообразие функций (включающее коммуникативную, когнитивную, планирующую, управляющую, обучающую, эстетическую, метаязыковую и другие функции), специфическая системность (под которой имеется в виду не только членение языка на уровни, но и членение его на подъязыки — относительно независимые функционально-тематические подсистемы). В целом по числу своих внутренних диалектических противоречий естественный язык может быть с полным основанием оценен как сложнейший объект для моделирования. Достаточно упомянуть тот факт, что перечисленные С. Маркусом «пятьдесят две оппозиции между научным и поэтическим общением» [38] представляют, по сути, противоположные тенденции, присущие языку в целом (сюда входят: субъективность — объективность; переводимость — непереводимость; отсутствие синонимии — бесконечность синонимических средств; дискретность значения — континуальность значения; информативность — избыточность; логичность — нелогичность; алгебраичность — геометричность и т.д.). Да и сами поэтические и научные подъязыки диалектически связаны: это механизмы, служащие целям открытия, познания мира. Язык — незаменимый помощник в сфере рационального мышления, так жг как и в сферах эмоционального общения. Язык — это фактор регулирования практически любой человеческой деятельности.

Компьютерное моделирование языка и речевой деятельности нуждается в солидной теоретической базе, и фундаментальная наука должна вплотную заняться соответствующими актуальными проблемами. Нам нужны специальные теории, которые в настоящее время существуют в зачаточном состоянии либо отсутствуют вовсе. Думается, моделирование языков (естественных и искусственных) вписывается в проблему моделирования способностей человека. Языковая способность — это способность, делающая человека человеком, возникающая и развивающаяся под воздействием практических потребностей. Проявления ее многообразны, но в когнитивном плане следует особо подчеркнуть ее роль в рече-мыслительной деятельности, в организации памяти, в процессах аутокоммуникации. Предстоит развить теорию моделей языкового общения, теорию подъязыков естественного языка, теорию лингвистической семантики в ее связи с „экстралингвистическими" семантиками (упомянем хотя бы логическую, психологическую, социологическую, этическую, эстетическую, этнокультурную семантику). К числу более частных, но не менее важных направлений относятся, например, типология естественных и искусственных языков (заметим, что естественный язык все более впитывает в себя элементы „искусственности"), теория понимания текста, теория вербализации коммуникативного замысла, теория коммуникативных неудач, теория   семантической   эквивалентности   сообщений   и другие.

Практические выводы из сказанного очевидны. Лингвистика должна повернуться лицом к новым задачам, выдвигаемым компьютеризацией. У нас в стране начинают предприниматься некоторые меры для расширения подготовки языковедов по специальности „структурная, прикладная и математическая лингвистика", но здесь надо обратить особое внимание на овладение методами представления и обработки знаний. Очевидно, мы должны ставить вопрос и шире: компьютерная грамотность в стране в целом немыслима по большому счету без лингвистической грамотности. По-новому должно вестись и преподавание языковедческих предметов в школе (а у нас уже есть некоторый опыт развития у школьников творческого, самостоятельного, точного подхода к анализу фактов языка). Назрела необходимость и в специальном отечественном журнале по компьютерной лингвистике. В свете очерченных перспектив, диктуемых жизнью, естественны те усилия, которые начинает наращивать издательство „Прогресс" в деле оперативного ознакомления советского читателя с опытом зарубежных коллег, исследующих язык в соответствии с его новым статусом в современном мире.

Тематика настоящего сборника обозначена термином „компьтерная лингвистика". Именно так можно назвать ту дисциплину, которая разрабатывает лингвистические проблемы компьютеризации. Этот термин все более приобретает права гражданства. Именно так называется одна из секций Научного Совета АН СССР по проблеме „Искусственный интеллект". Выскажем некоторые соображения о целесообразности   использования   данного   термина   как более удобного (в ряде отношений), чем термин „вычислительная лингвистика" (который, впрочем, в определенных контекстах должен сохранять все свои права, так как выделяет свои аспекты предмета).

Итак, наши соображения об этих терминах сводятся к следующему. Во-первых, термин „компьютерная лингвистика" задает общую ориентацию на использование компьютеров для решения разнообразных научных и практических задач, связанных с языком, никак не ограничивая способы решения этих задач. Термин же „вычислительная лингвистика" может пониматься более узко, ибо даже при широкой трактовке понятия „вычисление" за его пределами как бы остаются такие стороны решения лингвистических задач, как, например, представление знаний, организация банков языковых данных, психолингвистические аспекты взаимоотношений и взаимодействия человека и компьютера и ряд других аспектов. Тем самым можно считать, что термин „компьютерная лингвистика" (по своей внутренней форме) шире, чем „вычислительная лингвистика". Во-вторых, уже сложились параллельные термины типа „компьютерная грамотность", „компьютерная логика" и т. п. В-третьих, английский эквивалент computational linguistics содержит прилагательное computational,родственное слову computer, и оно может переводиться и как „компьютерный", и как „вычислительный". Отметим, кстати, что в русском языке термины „компьютер", „ЭВМ", „вычислительная машина" употребляются как синонимы и, естественно, используются при рассмотрении проблем компьютерной лингвистики на равных.

Поток зарубежных публикаций по вопросам компьютерной лингвистики огромен. Выходит много монографий, сборников, издаются журналы „Компьютерная лингвистика" (США), „Искусственный интеллект" (Нидерланды) и ряд других. Раз в два года проводится Международная конференция по компьютерной лингвистике (сокращенно — КОЛИНГ). Десятая конференция состоялась в 1984 г. в Станфордском университете (США), Одиннадцатая — в 1986 г. в Бонне. Кроме того, в промежутках между ними теперь проходят конференции Европейского отделения Ассоциации компьютерной лингвистики. Значительное место эти вопросы занимают на Международных объединенных конференциях по искусственному интеллекту, последняя из которых прошла в 1987 г. в Милане. Ежегодно проводится не менее десятка международных научных симпозиумов по прикладной лингвистике, по машинному переводу, по применению компьютеров в управлении, в гуманитарных науках, в словарном деле, в обучении и т. д.

Компьютерная лингвистика — важная часть прикладного языкознания. Круг ее задач, проблем, методов широк и разнообразен; во многом он связан со спецификой того или иного вида практической деятельности людей — деятельности, требующей сегодня применения компьютеров. Но существуют, конечно, и типовые исследовательские ситуации, повторяющиеся от задачи к задаче. Надо, правда, признать, что и таких типовых проблем довольно много. Поэтому отразить их все в одном сборнике невозможно. Надеясь на регулярное освещение развития компьютерной лингвистики в последующих выпусках настоящей серии, мы отобрали для данного сборника статьи, которые по своему содержанию близки к фундаментальным теоретическим проблемам языкознания, а таковыми сегодня с полным основанием можно считать проблемы процессуального описания языка, раскрытия механизмов его деятельности, проблемы, связанные с закономерностями речевого общения, с конструктивным моделированием коммуникативной функции языка. Таким образом, в центре внимания настоящего сборника — моделирование языкового, или речевого, общения (речевого — в широком смысле, например по М. М. Бахтину). Работы, включенные в сборник, иллюстрируют тот сдвиг в подходах, который произошел за последние несколько лет по сравнению с теми методами процессуального описания языка, которые нашли отражение в сборнике «Новое в зарубежной лингвистике», вып. XII (1983). Если ряд идей и методик сохранил свою силу и на сегодня, то общий контекст прикладных разработок меняется буквально на глазах. На первый план выдвигаются модели целостного речевого взаимодействия (диалога), и каждый частный процесс или элемент интерпретируется в составе двустороннего коммуникативного акта. И таким образом, если выше мы подробно говорили о роли компьютерной лингвистики в современном мире, в ускорении научно-технического прогресса, то теперь мы можем констатировать существенное методологическое значение компьютерной лингвистики для самой науки о языке: компьютерное моделирование речевого общения представляет собой с этой точки зрения удобный полигон для эффективного испытания общетеоретических концепций и гипотез о природе языка, о принципах его действия; сегодня это одна из важнейших форм «эксперимента в языкознании» (Л. В. Щерба)—эксперимента вычислительного, эксперимента компьютерного.

49 Моделирование понимания и производства языка как комплексная научная задача.

Далее, потребность в лингвистическом обеспечении обусловлена перспективной установкой на создание человеко-машинных систем решения интеллектуальных задач, Заметим, что нередко представители и гуманитарных, и естественных наук грешат рассмотрением компьютера как сугубо внешней силы, абсолютно отчужденной от человека. А между тем серьезный разговор об усилении природных возможностей человеческого разума должен предусматривать налаживание гибкого взаимодействия человека и машины. Оперативная, удобная, развивающаяся кооперация при таком взаимодействии будет опираться на естественный язык (точнее, определенный подъязык, связанный с некоторой сферой общения или классом решаемых задач).

Особо следует подчеркнуть необходимость учитывать лингвистическую семантику при построении языков представления знаний вне системы обработки текстов в ее полном виде. Даже в этом случае естественный язык служит надежной точкой отсчета: ведь и создатели систем, и пользователи говорят, пишут и думают преимущественно на естественном языке. Учет этого факта поможет в решении таких острых проблем компьютеризации, как унификация создаваемых систем и автоматизация по возможности большего числа процессов.

В социальном плане значимость лингвистических проблем компьютеризации связана с возникновением новых видов массовой деятельности, включающих построение искусственных языков и машинных словарей, разработку информационных банков, построение алгоритмов обработки текстов, разработку режимов, общения в системе „человек — компьютер — человек" и т. д Вообще, языковой аспект немаловажен для всех основных направлений индустрии обработки знаний, таких, как сбор, создание, хранение, систематизация, распространение, интерпретация информации.

Заметим, что и с исторической точки зрения язык оказывается центральным фактором важнейших этапов развития информационной технологии: вспомним возникновение письменности, изобретение книгопечатания, создание искусственных информационных и алгоритмических языков, являющихся производными от естественного языка и формализующих некоторые из его функций. Наконец, с точки зрения науковедения, можно констатировать, что лингвистика входит в ядро складывающегося в настоящее время комплекса когнитивных наук, объединяемых по их интересу к проблемам организации, представления, обработки и использования знаний.

Итак, лингвистическое обеспечение автоматизированных систем — это совокупность средств, позволяющих осуществлять компьютеризацию языковой деятельности, сопровождающей (в явной или скрытой форме) практически любую интеллектуальную деятельность человека. С технологической и системной точек зрения речь идет о создании того или иного типа автоматизированной системы обработки текста (АСОТ)—некоторого процессора, на входе и на выходе которого присутствует текстовая информация на естественном языке. Типы АСОТ многообразны и могут быть нацелены на моделирование различных языковых процессов, таких, например, как диалоговое взаимодействие, сжатие информации, реферирование текста, логическая обработка содержания, перевод на другой естественный язык и т. д. С собственно лингвистической точки зрения процессы, осуществляемые в машине при решении подобных задач, сводятся к перезаписи информации на тех или иных (естественных и искусственных) языках. Внешние критерии, которыми руководствуются создатели АСОТ, подводятся под общую формулу «оптимизация общения человека и машины». Именно эту задачу решает такая комплексная научная дисциплина, как компьютерная (вычислительная) лингвистика и ее наиболее существенная часть — вычислительная семантика. Прикладные результаты, получаемые в данной области,— это семантические алгоритмы и семантические метаязыки, то есть модели процессов (извлечения информации из текста и воплощения ее в текст) и соответствующих языков представления знаний (на которых хранится и перерабатывается информация, извлеченная из текстов).

50 Понятие лингвистического эксперимента в трактовке Л.В. Щербы и его отличие от других экспериментальных методов.

Одним из ведущих деятелей Петербургской школы был выдающийся языковед, оригинальный мыслитель, теоретик и экспериментатор Лев Владимирович Щерба (1880--1944). Диалектологические исследования на материале тосканских диалектов в Италии и одного из лужицких диалектов на территории Германии были его первыми научными опытами. Они послужили формированию исходных идей о функциональной природе звуков речи, способствуя становлению широкого понимания языка, данного в опыте через непосредственно наблюдаемые акты социально обусловленной речевой деятельности (говорение, с одной стороны, и восприятие и понимание, с другой).

Тексты/высказывания, по его мысли, образуют исходный для лингвистического исследования языковой материал. В текстах обнаруживается языковая система (язык в узком, специальном смысле слова). Речевые акты, тексты и языковая система представляют собой аспекты той же речевой деятельности. Он указывает на наличие индивидуальной психофизиологической языковой системы (речевой организации индивида), соотносящейся с общей для всех говорящих языковой системой. Грамматика определяется как сборник правил речевого поведения, а языковая система -- как совокупность правил речевой деятельности.

Концепцию Л.В. Щербы характеризует ярко выраженный семантизм (функционализм), проявившийся также в исследованиях звуковой стороны языка и обусловивший создание оригинального учения о фонеме, оказавшего сильное воздействие на формирование фонологической концепции Н.С. Трубецкого и ряда других теорий фонемы. Всемерно подчЈркивалась существенная роль функционального (смыслового) фактора в члененении звукового потока, выделении звуков речи и установлении состава фонем данного языка.

Л.В. Щерба создаЈт при университете лабораторию экспериментальной фонетики, где проводились и проводятся инструментальные исследования звукового состава многочисленных языков мира (и прежде всего своей страны). В школе Л.В. Щербы проводится требование применять строгие исследовательские методы (в частности метод лингвистического эксперимента, в котором угадываются черты будущего трансформационного метода) и одновременно допускается обращение и к "субъективному" методу (внутренней интроспекции лингвиста). Сегодня особенно ясна несправедливость многочисленных упрЈков того времени в адрес Л. В. Щербы со стороны представителей лингвистического формализма в психологизме, который как раз придавал щербовской концепции функционально-деятельностную (антропологическую) направленность.

В работе «О трояком аспекте языковых явлений и об эксперименте в языкознании» разграничил языковой материал, языковую систему и речевую деятельность, развив тем самым идею Ф. де Соссюра о разграничении языка и речи.

Щерба ввёл понятия отрицательного языкового материала и лингвистического эксперимента. При проведении эксперимента, полагал Щерба, важно не только использовать подтверждающие примеры (как можно говорить), но и систематически рассматривать отрицательный материал (как не говорят). В этой связи он писал: «особенно поучительны бывают отрицательные результаты: они указывают или на неверность постулированного правила, или на необходимость каких-то его ограничений, или на то, что правила уже больше нет, а есть только факты словаря, и т. п.»

Л. В. Щерба — автор фразы «Глокая куздра штеко будланула бокра и курдячит бокрёнка».

лингвистический эксперимент. Проверка условий функционирования того или иного языкового элемента для выяснения его характерных особенностей, пределов возможного употребления, оптимальных вариантов использования. “Таким образом, в языкознание вводится принцип эксперимента. Сделав какое-либо предположение о смысле того или иного слова, той или иной формы, о том или ином правиле словообразования или формообразования и т. п., следует пробовать, можно ли сказать ряд разнообразных фраз (который можно бесконечно множить), применяя это правило. Утвердительный результат подтверждает правильность постулата... Но особенно поучительны бывают отрицательные результаты: они указывают или на неверность постулированного правила, или на необходимость каких-то его ограничений, или на то, что правила уже больше нет, а есть только факты словаря, и т. п.” (Л. В.Щерба). Важность применения лингвистического эксперимента, особенно в области стилистики, отмечали Л. В. Щерба, А. М. Пеш-ковский, А. Н. Гвоздев.

51 Универсальные проблемы современной прикладной лингвистики.

Проблемы современной прикладной лингвистики.

Приложения языкознания: лингводидактика и информатика. Лингводидактика как

дисциплина, формирующая тексты для обучения языку, создающая руководства и справочники

для распространения и применения нормированной речи.

Информатика – раздел прикладной филологии, изучающий язык как средство хранения,

обработки и выдачи информации. Виды информационного обслуживания: рефераты,

информационно-поисковые системы, автоматизированные системы управления. Машинный

перевод.

Лингвистические аспекты управления машиной при помощи речевых команд.

Проблемы вычислительной семантики, имеющие в конечном счете большое народнохозяйственное значение, в настоящее время активно исследуются советскими учеными 2. Каковы же теоретические предпосылки прикладной лингвистики, рассматриваемой в указанном аспекте? Каковы те общие рамки, которые должны помочь осмыслению роли и места каждого отдельного результата, получаемого в данной области?

Самая общая проблема вычислительной семантики — формальное моделирование семантической способности человека. Частные проблемы связаны с моделированием отдельных аспектов этой способности. В собственно прикладном плане речь идет о построении автоматизированных систем обработки текста — АСОТ. Такие системы моделируют способность человека понимать текст (это анализ текста), строить текст, выражающий данный смысл (это синтез текста), а также хранить и перерабатывать информацию на некоторых внутренних промежуточных семантических метаязыках (языках представления знаний). Да и анализ и синтез сводятся, по существу, к перезаписи информации на некоторых метаязыках. Поэтому можно считать, что две важнейшие проблемы вычислительной семантики — это разработка семантических алгоритмов и семантических метаязыков. Из алгоритмов наибольшее практическое значение имеют алгоритмы анализа (модели понимания). Недаром системы типа АСОТ в теории искусственного интеллекта часто именуются "системами понимания естественного языка". Ю. Чарняк (см. настоящий сборник) начинает свою статью указанием на то, что с точки зрения вычислительной семантики «язык — это то, как он действует», и говорить о понимании безотносительно к какой-либо практической задаче бессмысленно. Знаменательно, что еще Л. В. Щерба придавал особое значение "громадной и мало исследованной проблеме понимания" х.

Через посредство различных типов АСОТ лингвистика оказывается существенным компонентом научно-технической революции в нашей стране и непосредственно участвует в рационализации трудовой деятельности человека. «Ведь создание и обслуживание ЭВМ, без которых немыслимо современное производство, требуют решения также экономических, психологических, логических и лингвистических задач... Построение искусственных языков, систематизация терминов и символов, создание систем моделирования — новая область лингвистики — науки, практическое применение которой прежде ограничивалось вопросами обучения человека родному или иностранному языку, перевода с одного языка на другой, имевшими лишь отдаленную связь с непосредственным производственным процессом» 2.

Здесь уместно пояснить понятие "совершенствования" (применительно к языковым системам и процессам), о котором говорилось при определении прикладной лингвистики. Именно такая направленность прикладной лингвистики соответствует общей тенденции развития науки и техники. К. Маркс писал: «Впоследствии естествознание включит в себя науку о человеке в такой же мере, в какой наука о человеке включит в себя естествознание: это будет одна наука» 3. Одновременно К. Маркс указал на необходимость рассматривать и технику в связи с самой сущностью человека, историю техники — как историю проявления действующих "человеческих сущностных сил" 4. Актуальность этого научного предвидения для лингвистики ясна из того факта, что язык (и особенно его содержательная сторона) составляет один из важнейших специфических аспектов человека. Следовательно, и эта функция человеческого интеллекта должна подвергнуться совершенствованию с применением технических средств и приемов. Как писал К. Маркс, машины по сути представляют собой "созданные человеческой рукой органы человеческого мозга", "овеществленную силу знания", овеществленную науку г. Процесс производства будущего характеризуется как "экспериментальная наука, материально-творческая и предметно-воплощающаяся наука" 2. Таким образом, и прикладная лингвистика должна внести свой вклад в совершенствование процессов пользования языком в различных материально-социальных системах.

Вычислительная лингвистическая система (АСОТ) может работать в автономном режиме или входить в надсистему, решающую те или иные задачи управления и интеллектуального моделирования. Это могут быть такие типы задач, как: общегосударственное управление и планирование, научно-техническая, социально-политическая, патентно-лицензионная, правовая информация, классификация изданий и автоматическое библиотечное обслуживание, машинный перевод, ведение систем стандартов и кодирование информации, учет и проверка исполнения решений на отраслевом и низших уровнях управления, прогнозирование и оптимизация решений, информационное обеспечение проектирования, управление роботом, диалог ЭВМ с пользователями и многие другие. С чисто лингвистической точки зрения процессы, осуществляемые в машине при решении всех упомянутых задач, сводятся к перезаписи информации на тех или иных (естественных и искусственных) языках, каково бы ни было разнообразие входных текстов (статьи, отчеты, рефераты, заголовки, приказы, резолюции, стандарты, анкеты, каталоги изданий, законодательные акты, запросы, команды, условия задач, описания ситуаций и т. д.). Прикладная семантика и призвана способствовать существенному улучшению параметров и повышению эффективности всех систем, использующих естественный язык 3.

В рамках вычислительной семантики получают новую интерпретацию многие традиционные проблемы лингвистической семантики (о чем наглядно свидетельствуют материалы настоящего сборника — см. Предметный указатель). Под воздействием требований прикладного моделирования в лингвистической семантике проявляются следующие существенные тенденции: расширение круга объясняемых языковых фактов; включение семантики в состав общей теории языка; трактовка семантики как центрального звена в системе лингвистических дисциплин; введение экспериментальных критериев истинности; повышенное внимание к семантическим отношениям; формальное моделирование семантических явлений; разработка семантических метаязыков для представления содержания текста; признание нескольких уровней глубины семантического представления; разработка разнообразных типов семантических словарей; исследование не только семантической структуры языка, но и семантических процессов речевой деятельности; установление связей между лингвистической и экстралингвистической семантикой.

52 Семиотическая типология знаков.

Знак является единством формы, представляющей некоторый предмет, и информации о нем. Говоря о представлении замещаемого предмета, нужно уточнить, что речь идет не о самом предмете, а именно о представлении, некоем типичном образе предмета. Например, за графической последовательностью (формой) «яблоко» стоит не конкретное, реальное яблоко, которое можно сорвать, разрезать, съесть, а обобщенное представление, некоторое типичное яблоко, яблоко «вообще». Этот типичный образ – представитель класса предметов (в данном случае – множества всех мыслимых яблок) – называется денотат.

Связываются денотаты со своими знаковыми формами с помощью устойчивых ассоциаций (мы хорошо представляем себе, например, облако, книгу, состояние сна и т. д.), произнося их соответствующие знаки. Эта ассоциация, связывающая форму и денотат, есть не что иное, как значение знака – отражения денотата в виде множества содержательных признаков, связывающее его с формой знака. Предположим, мы представляем себе денотат, соотносимый с формой «дорога», и если ребенок или человек, не владеющий языком, попросит нас объяснить, что значит это слово, мы будем пытаться как бы перевести имеющееся у нас представление (денотат) во множество содержательных признаков, характеризующих дорогу вообще: 1 – полоса земли, 2 – предназначенная для передвижения по ней, 3 – путь сообщения. Тем самым мы формулируем значение слова «дорога», общее для всех, кто пользуется этим знаком. Теперь ребенок, которому была известна только форма знака, создает для себя образ дороги – денотат, руководствуясь которым он сможет правильно применять форму «дорога» для обозначения именно дороги, а не чего-либо другого.

Значение знака (З) носит общественный (социальный) характер, поэтому его можно определить как социально закрепленную ассоциацию между формой (Ф) и денотатом (Д). Эта ассоциация является информационным центром знака.

Форма, значение и денотат образуют структуру знака, которую обычно изображают в общем случае в виде схемы, называемой «треугольник Фреге» (по имени немецкого философа и математика Г. Фреге, определившего в такой треугольной схеме внутризнаковые отношения).

  Пунктирная линия, соединяющая Ф и Д, означает, что они соотносятся между собой не непосредственно, а через З: денотат отражается в значении, значение придает знаковость форме (до этого форма – это просто то, что существует как материальный предмет), и форма вследствие этого представляет денотат.

Существует множество классификаций знаков. Общепризнанной и наиболее полной до сих пор считается классификация, данная основателем семиотики Чарльзом Пирсом еще во второй половине 19 века. Основание его классификации – взаимоотношение знака и его объекта. Это отношение (синонимично используются также термины: форма и денотат, знак и предмет, знак и референт, означающее и означаемое и пр.) служит основой для выделения трех базовых в семиотике типов знаков:

1) знаки-иконы (или иконические знаки, иногда их называют знаками-копиями, знаками-изображениями);

2) знаки-индексы (индексальные знаки, или знаки-признаки);

3) знаки-символы (символические знаки, или условные, конвенциональные знаки).

Эта классическая трихотомия и сегодня представляется нам исчерпывающей системой (несмотря на до сих пор выявляемые в ней погрешности), поскольку выбранный Ч. Пирсом различительный критерий – отношение между знаком и объектом – наиболее общий и релевантный принцип, не зависящий от множества частных свойств знаков.

Символы. Знаки такого рода называют условными, или конвенциональными (от слова конвенция – соглашение). Они потому условны, что их денотат связан с формой как бы по соглашению, договору, негласно заключенными между пользующимися этими знаками. Например, по графической форме «радость» мы не можем определить денотата, и только знание «условия», или «соглашения», что «радость» означает «состояние удовольствия, веселья», позволяет судить о его денотате. Условный знак отличается от других тем, что форма его выражения ни в каком отношении не сходна с его денотатом (формы слов «человек», «письмо», «встреча» и др. ничуть не похожи на человека, письмо, встречу как они есть; флаг и герб страны, будучи символами страны, совсем не похожи на саму страну; нимб над головой святого не похож на качество святости; нотные знаки не похожи на музыку, которую они условно обозначают; значки химических элементов не имеют ничего общего с самими химическими элементами и т. д.). Условный знак отличается тем, что форма его ни в каком отношении не сходна с его значением, никак не мотивирована: никто не знает, почему, например, звуковой комплекс «с-т-о-л», или «T-i-s-c-h», или «t-a-b-l-e» означает именно этот вид мебели, равно как неизвестно почему и другие слова национальных языков, в большинстве своем немотивированные, условно, как бы по негласному договору, означают именно те, а не иные, предметы, явления и прочие реалии. Итак, знак-символ, каким бы он ни был (словесным, схематическим, цветовым) совсем не похож на обозначаемый им предмет, поскольку форма знаков-символов не дает никакого представления о содержании; их действие основано на установленной по соглашению связи означающего и означаемого. Сущность связи знаков-символов состоит в том, согласно Ч. Пирсу, что она является правилом и не зависит от наличия или отсутствия какого-либо сходства или физической смежности. К символическим знакам относят естественные языки, искусственные знаковые системы (языки программирования, нотную грамоту, химические символы и т. д.).

Индексы. Это указательные знаки. Особенность их в том, что форма и денотат находятся в отношениях смежности, «соприкасаются» друг с другом в пространственном и временном отношениях. Задав вопрос прохожему на перекрестке: «Где находится улица Соборная?» и получив ответ – указательный жест или ответ: «Прямо», мы отлично поймем, куда нужно идти. Понимание достигается благодаря тому, что знак «прямо» или указательный жест употреблены в такой ситуации, когда слушающий и говорящий видят обозначенное ими пространство, одинаково осознают время и находятся в одном пространстве и времени. Форма знака и денотат находятся в отношениях пространственной и временной смежности. Форма является следствием значения, а значение – причиной формы.

Иконы (изображения). Иконические знаки (изобразительные) отличаются тем, что их форма и денотат сходны, похожи друг на друга, т. е. находятся в том или ином отношении аналогии. Действие иконического знака основано на фактическом подобии формы и денотата. В знаках-иконах (eikon (др. греч.), icon (англ.) – образ, подобие) форма как бы дублирует содержание, по форме знака можно определить его значение; можно сказать, что форма знака берет на себя функцию значения. Такой знак не нуждается в переводе, потому что он похож на свой объект. Например, рисунок какого-то животного подобен самому животному, человек на фотографии похож на реального человека. Первое заменяет второе «просто потому, – пишет Ч. Пирс, – что оно на него похоже». К иконическим знакам относят картины, рисунки, фотографии, скульптуры, пиктографическое письмо, чертежи, географические карты, звукоподражания и т. д.

«Иконический знак представляет собой знак, который связан со своим референтом благодаря некоторому физическому сходству между ними». Например, рисунок языка пламени является иконическим знаком огня, поскольку рисунок сохраняет некоторые двухмерные, зрительно воспринимаемые признаки огня. Смысл такого рода связи между знаком и референтом состоит в том, что если бы группа, использующая данное отношение между иконическим знаком и референтом, должна была бы исчезнуть без следа, то это отношение потенциально могло бы быть восстановлено и использовано другими мыслящими существами, способными заметить то же физическое сходство. Чем больше степень иконичности, тем больше вероятность повторного открытия этого отношения.

Знак-индекс – это знак, который связан со своим референтом при помощи некоторого непосредственного физического сосуществования. Например, дым является индексом огня, поскольку дым есть событие, которое порождается огнем, и, следовательно, всегда появляется вместе с ним. Смысл связи между референтом и знаком для сообщества носителей знака одинаков для знаков-индексов и иконических знаков: если бы сообщество мыслящих существ должно было бы исчезнуть без следа, то отношение индекс – референт вполне могло бы быть восстановлено другой группой в ходе практическом деятельности в том же физическом мире. Здесь, так же как и в предыдущем случае, чем больше степень индексальности, тем больше вероятность того, что данное отношение будет открыто вновь.

Знак-символ – это знак, который связан с референтом только посредством конвенций, принятых сообществом носителей. Это отношение совершенно произвольное, так как между его двумя компонентами отсутствует «естественное» физическое сходство или сочетаемость. Слово «огонь» представляет собой референт потому, что между нами есть договоренность использовать данную последовательность звуков именно таким образом. «Степень произвольности» в отношении знак – референт противоположна степени иконичности и/или индексальности между знаком и референтом. Смысл связи в этом случае состоит в том, что если бы сообщество мыслящих существ должно было бесследно исчезнуть, то это отношение никогда или почти никогда не могло бы быть самостоятельно открыто вновь. По мере того как степень произвольности отношения знак – референт приближается к 100 % (т. е. по мере приближения степени иконичности и/или индексальности к нулю) вероятность того, что данное отношение будет открыто вторично, приближается к нулю»[10].

+++ Семиотика (греч. semeiotikón, от seméion — знак, признак) - наука, исследующая свойства знаков и знаковых систем (естественных и искусственных языков). Семиотика изучает характерные особенности отношения «знак — означаемое», распространённого достаточно широко и несводимого к причинно-следственным отношениям. Термин «знак» понимается в широком смысле как некоторый объект (вообще говоря, произвольной природы), которому при определённых условиях (образующих в совокупности знаковую ситуацию) сопоставлено некоторое значение, могущее быть конкретным физическим предметом (явлением, процессом, ситуацией) или абстрактным понятием. 

Понятие знака является одним из основных в информатике и в науке вообще. Как и понятие информации, понятие знака относится к фундаментальным, предельно общим, в философии их называют категориями. Исчерпывающего, универсального определения таким понятиям дать нельзя, можно лишь раскрыть их смысл и содержание применительно к тем или иным областям человеческой деятельности или к конкретным ситуациям. Примером тому является термин «информация», который по-разному трактуется в биологии, социологии и в других науках.   В семиотике знак понимается в широком смысле как материальный объект, которому при определенных условиях соответствует некое «значение», могущее быть чем угодно - реальной или вымышленной вещью, явлением, процессом, фантастическим или сказочным существом, абстрактным понятием.  Важным свойством знака является то, что он может обозначать или замещать не единичный объект или конкретное явление, а целое множество объектов или явлений. Данная типология значения возникла из идей американского логика и философа Ч. Пирса.   Значение в этой концепции понимается как отношение знака. Задача тем самым состоит в том, чтобы учесть все возможные отношения знака: сколько типов отношений обнаруживается у знаков, столько и существует типов значений. Знак вступает в отношение c обозначаемой им сущностью (денотатом), c выражаемым им понятием или представлением (сигнификатом), с теми, кто пользуется знаками, a также c другими знаками. Отношения знака к другим знакам могут быть двоякого рода: 1) на парадигматической оси-отношения выбора или построения из множества знаков того, который удовлетворяет речевой задаче при заполнении определенной позиции в речевой цепи, и 2) на синтагматической оси-отношения совместимости, позволяющие сочетать знаки один c другим в речевых цепочках.  Отношение знака к обозначаемой вещи (денотату) образует его денотативное значение, отношение знака к выражаемому понятию - его сигнификативное значение, отношение между знаком и говорящим - прагматическое значение, отношении знака к другим знакам на парадигматической оси - его дифференциальное значение, или значимость, a его отношения к другим знакам на синтагматической оси - синтагматическое значение, или валентность (Арутюнова, 1988 : 279).   Все типы значений понимаются как дополнительные друг к другу, то есть как части (стороны, аспекты) целого. Это распространяется и на соотношение денотативного и сигнификативного значений. В знаке присутствуют и денотативный, и сигнификативный компоненты. В одних словах, как, например, абстрактных существительных, сильнее представлено или даже полностью доминирует сигнификативное значение c ориентацией на понятие. B других словах, как, например, конкpетныx существительных, напротив, усматривается преобладание денотативного компонента значения c ориентацией имени на денотат. Однако и здесь, в нереференционном употреблении, например предикативном, у существительных представлен единственно сигнификативный компонент (Дорошевский, 1973 : 202)  Остается неясным, как соотносятся оба компонента в значении существительного, репрезентирующем класс, a не единичное.   Вообще не предложено никаких критеpиев для разграничения денотативного и сигнификативного компонентов значения, в исследовательской практике их почти или никак не разграничивают, a при компонентном анализе значения выражают в одинаковых терминах. В практическом анализе значений оба компонента объединяют воедино общим термином «денотативное значение» (в расширительном смысле), а также пользуются обозначениями «референционное (референциальное) значение», «семантическое значение» (семантика в узком смысле). За пределами семиотической структуралистской традиции в том же совокупном смысле говорят o «предметно-логическом, вещественном, когнитивном, интеллектуальном (интеллективном) значении (содержании)».   Следует сказать o сложившихся в семиотике представлениях o денотативном и сигнификативном значениях. Их анализ обнаруживает, что они образовались в результате смешения, непоследовательного различения нескольких пар понятии: денотативного значения и репрезентативной функции имен, сигнификативного значения и описывающей функции имен; денотативного значения и экстенсионального значения имен, сигнификативного значения и контенсионального значения имен; денотативногo значения и конкретного значения имен, сигнификативного значения и отвлеченного значения имен. B каждой паре понятий есть значительные области наложения и взаимозависимости, но, даже пересекаясь, они не тождественны (Арутюнова, 1988 : 305).   Проблематика отношений значений знака требует более подробного рассмотрения. Исходная посылка: денотативное значение возникает в отношении знака к предмету (денотату), a сигнификативное - к понятию (сигнификату) - нуждается в существенном уточнении. Строго говоря, знак не относится прямо к вещи, это отношение всегда, даже в случае единичной вещи, опосредовано понятием (представлением) o вещи: прежде чем узнать и назвать вещь, то есть идентифицировать и обозначить ее, необходимо сначала отнести ее к некоему классу, составить понятие о ней, пасть даже весьма общее и неопределенное. Поэтому отношение знака к обозначаемой вещи и выражаемому понятию не вполне равноправны. Знак не обращен одинаково и к вещи, и к понятию. Схема их связей имеет вид: вещь - понятие - знак (относительно говорящего) или знак - понятие - вещь (относительно слушающего). Поскольку отношение знака и вещи опосредовано понятием, это разрушает антитезу - значение по отношению знака к вещи и значение по отношению знака к понятию. Oбpатимся ко второму разделу семиотики - прагматике и соответствующему типу значения - прагматическому. По определению, эта область образуется отношениями знаков и тех, кто использует знаки. Непосредственное отношение, существующее между знаками и теми, кто их использует, это отношение производства, порождения знаков (говорящий) к осмыслению, пониманию знаков (слушающий). Эти отношения, являющиеся зеркальным отображением одного другим, относятся к области психологии и не их имеют в виду, когда говорят o прагматике.   Прагматика имеет в виду нечто иное. Ее реальный предмет, как он сложился практически в семиотике и лингвистике, не соответствует определению и не может быть очерчен c необходимой четкостью и внутренним единством. Занимаясь важными аспектами знаковой деятельности, существенно расширяя лингвистическую и семиотическую проблематику, прагматика в ее нынешнем виде объединяет достаточно разнородные исследовательские предметы и задачи. Основанием для их объединения под общим названием служит не столько общность природы и общее отношение «говорящий - знак», сколько противопоставление через отрицание: к прагматике относят то из содержательной стороны знаковой деятельности, что не вмещала прежде лингвистика, разрабатывавшая в содержании словесных знаков преимущественно референциальный аспект. Можно c достаточной уверенностью полагать, что в последующем эти предметы вычленятся из прагматики в самостоятельные разделы лингвистики и семиотики. Об этом свидетельствует появление таких новых направлений и обозначений в науке, как коммуникативная лингвистика, теория речевых актов, теория речевой деятельности, теория речевого общения и т. д.   Уже сейчас очевидно, что лингвистическая прагматика включает, по меньшей мере два достаточно независимых предмета: 1) исследование языковых средств и речи относительно выражения прагматических значений (субъективно-оценочных, эстетических, модальных); 2) исследование языковых средств и речи относительно целей и результатов языковой коммуникации (Арутюнова, 1988 : 263). Из них первый входит составной частью в предмет семасиологии языка, а второй относится к семасиологии речи. При этом следует заметить, что прагматические значения языковых единиц там, где они существуют дополнительно к их когнитивному значению, например противоположные оценочные значения слов старец и старикашка, возникают не прямо из отношения говорящий - знак, а из отношения говорящий – денотат, спроецированного затем на обозначающий этот денотат знак.   Третья часть семиотики - синтактика. Ее предмет образуется отношением знаков между собой, причем отношения знаков на парадигматической оси выбора составляют так называемое дифференциальное значение знака, или значимость, отношения знаков на синтагматической оси – их синтаксическое значение, или валентность. Синтактика относится к устройству знаковых систем и знаковых выражений, но не к их содержанию, не к передаваемой ими информации 

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]