Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Пиотровский

.pdf
Скачиваний:
149
Добавлен:
06.06.2015
Размер:
9.13 Mб
Скачать

личине в этом случае соответствует множество, образованное одной точкой числовой оси.

3. Дискретные и непрерывные величины. Лингвистические явления могут быть представлены в виде дискретных и непрерывных переменных величин.

Область изменения дискретной величины состоит из отдельных изолированных точек числовой оси, например, —2, —1, 0, 1, 2. Область изменения непрерывной переменной величины состоит из всех точек, расположенных на каком-либо участке числовой оси, например между нулем и единицей, или из всех точек числовой оси,

 

 

 

 

 

которые

соответствуют

. — — — — — — — — j —

 

^ ^

всем

 

действительным

субстанция

 

к

^

т^-

числам. Иными словами:

«убсшиия

 

дискретно-непрерывное

 

S

 

 

между

 

любыми

двумя

построение

1 i

 

 

сколь

угодно

близкими

. форма

 

 

дискретное построение

м

 

 

значениями

непрерыв-

 

 

ной

величины

может

форма

 

ж

 

 

существовать

любое

ко-

дискретное построение

«

 

 

личество

ее

промежу-

субстанция

I

к

 

 

точных

значений.

 

 

 

ав

°>о.

 

 

4.

Дискретность

и

дискретно-непрерывное

 

3

 

 

 

я

 

 

непрерывность в

языке

построение

 

 

 

 

и речи. Известно, что

Рис. речь представляет собой последовательность

дискретных, т. е. отграниченных друг от друга лингвистических единиц — фигур (букв, фонем, слогов) и знаков (морфем, слов, словосочетаний и даже предложений). Система языка выступает в виде сети отношений между единицами-инвариантами, также имеющими дискретную природу (фонемы, морфемы, слова, грамматические схемы). Отсюда иногда делается вывод, что в математической лингвистике, в том числе и в квантитативном языкознании, лингвистические объекты должны интерпретироваться с помощью дискретных величин и конечных множеств, а понятие непрерывности и связанное с ним понятие бесконечного множества для интерпретации лингвистических явлений малопригодны.

Чтобы оценить справедливость этого

утверждения,

обратимся

к схеме речевой деятельности, изображенной на рис. 5.

Субстанция содержания охватывает

здесь все то,

что может

быть предметом мысли. Таким образом, сюда входят как объекты, имеющие дискретную природу, так и понятия, которым присуща непрерывность (ср. цветовую гамму). Структура (форма) содержа• ния представляет собой потенциально бесконечное множество идей. Эти идеи выступают в качестве особо упорядоченных в данном языке квазидискретных инвариантов плана содержания, образующих обычно нечеткие множества конкретных значений (см. § I, п. I).

Субстанция выражения представляет собой акустический, графический или иной материал, использующийся для формирования

20

знаков. Этот материал может иметь как дискретную природу (например, печатные буквы или импульсы тока, кодирующие эти бук-

вы в ЭВМ), так и непрерывное строение (последовательности

зву-

ков,

образующих

устный

текст).

Структура

выражения

орга-

низует этот материал в

систему

дискретных

и

квазидискрет-

ных

инвариантов

(например, в

систему фонем)

плана

выра-

жения.

 

 

 

 

 

 

Если рассматривать процесс изменения языка во времени, а также территориальное и социальное его варьирование, то здесь преобладают непрерывные процессы. Особенно наглядно прослеживается это в области субстанции выражения. Действительно, утрата русских редуцированных гласных [ь] и Ы представляет собой с акустической точки зрения непрерывный процесс: их акустические следы на конце слова обнаруживаются даже в современном произ-

ношении [18,

с. 33 и сл.]. Устранение

произносительно-акустиче-

ских различий

между

древнерусскими

[<f Г и [е] (обозначавшимся

через «ять») тоже имело непрерывный

характер не только

в хро-

нологическом,

но и

в территориальном

отношении

[1,

с.

41

и сл.].

 

 

 

 

 

 

 

Что касается количественного измерения смысловой и статисти-

ческой информации, содержащейся в тексте

(субстанция

плана

со-

держания), то она также осуществляется с помощью непрерывных переменных величин (см. ниже, § 8).

Однако если аппарат непрерывной математики следует использовать для описания явлений и процессов, происходящих в суГсганции выражения и субстанции содержания, которые рассматриваются

многими лингвистами

в качестве периферийных областей языка,

то можно ли применять

этот аппарат для интерпретации объектов

структуры выражения и структуры содержания, составляющих структурное ядро языка и речи (ведь все объекты структурного ядра языка имеют дискретный характер)?

В ходе количественных группировок постоянно возникают ситуации, когда разность между смежными дискретными переменными, характеризующими эти группировки, очень мала по сравнению с их величинами. Так, например, словарь языка состоит из многих десятков и сотен тысяч лексических единиц. Увеличение словаря на одно вновь образованное или заимствованное слово несущественно с точки зрения общего объема словаря. Поэтому постоянно увеличивающийся со временем объем словаря можно рассматривать в качестве непрерывной переменной величины. В то же время меняющийся от варианта к варианту объем какого-либо древнего памятника не может рассматриваться в качестве непрерывной величины. Объем такого памятника обычно невелик, и его увеличение или уменьшение даже на одно слово представляет собой заметное изменение. Таким образом, изменение объема словаря памятника выступает в качестве дискретной переменной величины.

Непрерывность возникает также при наложении диалектных и особенно идиолектных (т. е. индивидуальных) систем в фонологии, грамматике и лексике [24, с. 32 и сл.]; [26].

21

Итак, для интерпретации лингвистических явлений могут быть использованы не только дискретные, но и непрерывные переменные величины. Последние должны использоваться в первую очередь при описании изменений языка во времени и пространстве, а также при экспликации информационной структуры текста.

§4. Понятие функции

1.Соответствия между лингвистическими множествами и функциональные зависимости. В предыдущих разделах нам уже несколько раз приходилось сравнивать разные лингвистические и нелингвистические множества. Сопоставление множеств приводит к понятию соответствия, которое подобно понятию множества является одним из основных понятий математической лингвистики.

Рассмотрим вопрос о соответствии множеств на примере соотношения индоевропейских и готских согласных.

Если опустить все спорные и дискуссионные вопросы, то индоевропейские звонкие смычные придыхательные согласные могут быть традиционно [57, с. 11—116] представлены в виде множества А, имеющего вид [bh, dh, gh], а соответствующие им готские согласные объединены во множество В, имеющее вид [b, d, g]. Между множествами А и В имеется соответствие, описываемое в германистике с помощью так называемого первого передвижения согласных [58, с. 37 и сл.]. Сущность этого соответствия состоит в том, что каждому звукотипу во множестве А взаимно однозначно соответствует определенный звукотип во множестве В. При этом переход от звукотипа множества А к звукотипу множества В совершается по четко определенному правилу: каждый из индоевропейских звукотипов теряет придыхательность.

Если два множества находятся в таком соответствии, что каждому объекту х множества А ставится в соответствие некоторый опре-

деленный объект у из множества

В, то говорят, что между

А и В

существует функциональная зависимость. Правило /,

по которому

можно перейти от объекта х

£ А

к соответствующему

ему

объекту

у 6 В, называется функцией.

В

нашем примере правило

потери

придыхательности у индоевропейских [bh, dh, gh] можно рассматривать как пример лингвистической функции.

Для обозна^иия функции используется запись

у = /

(х).

2. Правила задания функций. Если соответствие

между

двумя

множествами установлено, то принято говорить, что на множестве А задана функция со значениями, принадлежащими множеству В. Объекты х множества А, которым поставлены в соответствие элементы множества В, называются значениями аргумента (или значениями независимой переменной)-, в нашем случае в этой роли выступают индоевропейские звуки [bh, dh, gh]. Все множество А называется множеством значений аргумента, или областью определения (существования) функции f (х).

Объекты у или / (х) множества В называются значениями функции (или значениями зависимой переменной), соответствующими аргу-

22

менту х, в нашем примере это готские [b, d, g], Множество В объектов, поставленных в соответствие элементам множества А, называется областью значений (изменения) функции f (х).

Вопрос о том, объекты какого множества следует считать независимыми переменными, решается обычно исходя из построения лингвистической задачи. Так, например, если первоначально заданными считать готские смычные звонкие согласные [b, d, g], от которых с помощью правила восстановления придыхательное™ можно реконструировать индоевропейские [bh, dh, gh], то первые можно рассматривать как значения аргумента, а вторые — как значения функции. Само же правило восстановления придыхательности выступает тогда в роли функции.

Введем еще одно важное понятие. Пусть задана функция у =

= / (х), где х — независимая, а у

— зависимая переменная. Если

этого требуют интересы задачи, можно рассматривать у

в качестве

независимой

переменной, а х — в качестве функции. В

результате

мы получаем

новую функцию

х =

ср (у), которая

называется

обратной по

отношению к исходной

(иначе — прямой) функции

У= f (*)•

3.Алгоритм и вычислимые функции. С понятием функции тесно связано понятие алгоритма, которое обычно толкуется как точное предписание о выполнении в определенной последовательности

некоторой системы операций для решения

всех задач данного

типа.

 

Если для рассматриваемой функции задан алгоритм, с помощью

которого можно найти ее значения, то такая

функция называется

вычислимой.

 

Однако данное в п. 2 определение функции не предусматривает задания в правиле соответствия какого-либо алгоритма. Правило соответствия может быть каким угодно, в том числе и таким, которое не дает реальной возможности определять по значению аргумента соответствующее значение функции либо в силу того, что алгоритм для решения этой задачи в данный момент не найден, либо потому, что такой алгоритм не существует вовсе [38].

Таких «невычислимых» функций в лингвистике много. Рассмотрим, например, в качестве области определения функции упорядоченное по употребительности множество словоформ. Каждая словоформа из этого множества выступает в качестве значения независимой переменной, а несомая этой словоформой статистическая информация является значением функции. Правилом соответствия назовем утверждение о том, что более употребительные словоформы несут меньше информации, чем более редкие формы. Хотя функцию можно здесь считать заданной, алгоритм для определения значений этой функции отсутствует. Для того чтобы задать такой алгоритм, необходимо получить для каждой словоформы количественные оценки вероятности ее появления в тексте. Если же речь пойдет не о статистической, а о смысловой информации, то современное состояние наших знаний вообще не позволяет нам задать алгоритм для определения значений этой функции.

23

Для математической лингвистики и особенно для ее инженерных приложений вопрос вычислимости функции имеет принципиальное значение. Пока для функции не получен вычисляющий ее алгоритм, корректная переработка с ее помощью лингвистической информации, особенно на ЭВМ, практически невозможна.

§5. Числовые функции в лингвистике

1.Построение числовых функций. Изучение функциональных зависимостей предусматривает сопоставление множеств, различающихся не только по качественной природе, но и по количественной характеристике составляющих его объектов. Так, например, формула

Pi=k(i + p)-y (1.2)

описывает соответствие, существующее между множеством номеров i словоформ частотного списка и множеством их вероятностей pt. Величина i выступает здесь в роли независимой переменной, а рг является ее функцией. Алгоритм правила соответствия заключается в том, что к i прибавляется величина р, затем эта сумма возводится в степень —у, а результат умножается на k. Аргумент i выражен числами натурального ряда и практически всегда ограничен, поскольку частотный словарь всегда содержит конечное число лексических единиц; параметры у, р, k — действительные числа. Поэтому и область определения функции (1.2), и область ее значений являются конечными множествами. Если же представить себе частотный список с бесконечным числом лексических единиц, то аргумент i выражался бы числом, лежащим в промежутке (1, + оо). Тогда и область определения функции, и область значений были бы бесконечными множествами.

В только что рассмотренной функциональной зависимости значения аргумента и значения функции—числа, а область определения и область значений функции — числовые множества. Такие зависимости называются числовыми функциями числового аргумента,

или сокращенно числовыми функциями. Наряду с числовыми функциями от числового аргумента существуют функции с нечисловыми или п р о и з в о л ь н ы м и областями определения (а также с нечисловыми областями значений). Примером таких функций служит зависимость между индоевропейскими звонкими смычными придыхательными согласными и их готскими производными.

Квантитативная лингвистика имеет обычно дело с числовыми функциями.

2. Способы задания числовых лингвистических функций. Числовая функция, описывающая лингвистические процессы, может задаваться либо таблицей, либо в виде формулы, либо с помощью графика.

В современных эмпирических языковедческих исследованиях численное соответствие между значениями аргумента и функции устанавливается с помощью наблюдения. Поэтому здесь обычно ис-

24

пользуется т а б л и ч н ы й с п

о с о б

задания

функции. Основ-

ное достоинство таблицы состоит

в том,

что она

непосредственно,

без всяких дополнительных измерений и вычислений соотносит значения аргумента и отвечающие им значения функции. Однако этот способ имеет существенный недостаток, состоящий в том, что таблица дает лишь выборочные значения среди всех значений, принимаемых аргументом и функцией. При этом в таблице может не оказаться тех значений аргумента и функций, которые для нас как раз и представляют наибольший интерес. Кроме того, табличный способ имеет слабую наглядность: по таблице трудно бывает определить характер изменения функции в зависимости от изменения аргумента.

А н а л и т и ч е с к и й (формальный) с п о с о б дает возможность вычислять значения функции при любом значении аргумента. Одновременно этот способ позволяет анализировать с помощью математического аппарата различные свойства функции, в том числе и такие, которые невозможно изучать методом прямого наблюдения. Недостатком аналитического способа является отсутствие наглядности.

Наглядное представление функции дает г р а ф и ч е с к и й с п о с о б . Его преимущество заключается в том, что он дает возможность охватить рассматриваемую функциональную зависимость «одним взглядом» и быстро выявить основной характер функции.

При решении практических задач квантитативной лингвистики к этому способу представления функции обращаются в том случае, когда в распоряжении исследователя имеются лишь ряды опытных данных. Один из этих рядов рассматривается в качестве значений аргумента, а другой — в качестве значений функции. Тогда по табличным данным строится график (кривая) зависимости, а по виду графика подбирается уравнение, соответствующее предполагаемой природе исследуемого лингвистического явления.

Составить формулу, описывающую лингвистическое явление, минуя табличный и графический способы представления функции, можно лишь тогда, когда заранее известен внутренний механизм этого явления. При моделировании диахронических процессов и описании построения устной и письменной речи подобная ситуация встречается сравнительно редко. Чаще приходится иметь дело с задачами такого типа, когда по экспериментальным данным, обобщенным в таблице, строится кривая, а по виду кривой определяется соответствующее ей уравнение.

Чтобы избежать ошибок при переходе от словесного лингвистического описания явления и эмпирических табличных данных к графику и уравнению, лингвист всегда должен иметь перед глазами набор таких числовых функций и соответствующих им графиков, с помощью которых обычно моделируются лингвистические процессы и явления. Поэтому каждому разделу, посвященному определенному виду лингвистического моделирования, предпослано краткое описание того математического аппарата, который обычно используется в этом моделировании, а также будет необходим в последующих разделах.

25

§ 6. Элементарные функции

Диахронические процессы, построение устной и письменной речи, а также диалектно-стилевую вариантивность можно моделиро-

вать в первом приближении

с помощью

различных элементарных

функций.

Рассмотрим некоторые из них.

 

 

 

 

1. Полиномы.

Полином

{многочлен)

п-й

степени

задается

в общем

виде выражением

 

 

 

 

 

 

у = а0хп + аххп~х

+ ... + ап_ух

+

ап,

(1.3)

где и—натуральное число,

а0, аъ ...,

ап

— постоянные дейст-

вительные числа

(коэффициенты).

 

 

 

 

Простейшими видами полинома являются следующие функции.

1. Двучлен первой степени {линейная функция)

 

 

 

 

 

у — ах + b.

 

 

(1.4)

График

этой

функции — прямая

линия. Постоянная величина а

представляет

угловой

коэффициент

прямой,

равный тангенсу

угла

ос, образованного

ею

с

осью Ох, а коэффициент b — отрезок,

от-

секаемый ею на оси Оу (рис. 6). Областью

определения

функции

является

вся

ось Ох (т. е. — оо <

х<С оо).

 

 

 

2. Трехчлен второй

степени

{квадратичная функция)

 

 

 

 

 

 

 

у — ахг

+

Ьх + с,

 

 

(1.5)

графиком которой служит парабола

с вертикальной осью симметрии

х — ~Ы{2а).

При я >

0 функция

сначала

убывает и,

достигнув

минимума, снова

возрастает; при а < 0 сначала возрастает, а до-

стигнув максимума, начинает убывать (рис. 7).

 

 

3. Степенная

функция

 

 

 

 

 

 

 

 

 

 

у =

ах"

 

 

(1.6)

представляет собой частный случай полинома п-й степени, когда коэффициенты аи а2, ..., ап равны нулю. При целых и положительных значениях х функция определена на всей оси Ох. На рис. 8

26

изображены графики

функций у — Xй при

различных значениях

параметра п.

 

 

 

2. Дробно-рациональная функция. Дробно-рациональная

функ-

ция, представляющая

собой отношение двух

многочленов,

опреде-

ляется равенством

 

 

 

о„ хп +.Я! хп~г+...

+fl„-1 *+ ап

b0X"+b1x»-1+...+bn-lx+bn'

Здесь п — натуральное число, а0, эффициенты.

Простейшим случаем дробно-рацион а л ь н о й функции является зависимость

ап и b0, Ьи

Л=2

(1.7)

ко-

 

у =

а/х.

 

 

(1.8)

 

Эта

функция *

вы-

 

ражает

закон

обратной

 

пропорциональности

ме-

 

жду

переменными х

и у.

 

Так

как

аргумент

 

может принимать любые

 

значения,

кроме

нуля

 

(деление на нуль невоз-

 

можно),

то

значение

 

функции

при

х =

0 не

 

существует,

и

 

кривая

 

распадается

 

на

. две

 

не

соединенные

между

 

собой

ветви

и,

как

 

говорят,

терпит

разрыв

Рис. 8

(ср.

гл.

3, §

3,

п. 1).

 

Областью существования функции и областью значений функции являются два интервала (— с», 0), (0, + <х>). Графиком функции (1.8) служит равносторонняя гипербола, ветви которой асимптоти-

чески

приближаются

к осям координат. Если а>

0, то ветви ги-

перболы ле?кат в I и III

четвертях; если же а < 0, то ветви распо-

ложены во II и IV четвертях (рис. 9).

 

3.

Показательная

функция.

Показательная

(экспоненциаль-

ная)

функция задается

равенством

 

 

 

 

у =

ах,

(1.9)

в котором основание а есть постоянное положительное число, не равное единице. Графиком этой функции служит монотонно возрастающая или убывающая кривая (экспонента), которая асимптотически приближается к оси Ох (рис. 10 и 11). Область определения

Ее можно рассматривать и как степенную функцию вида у = ах~1.

27

функции — вся ось абсцисс, т. е. —• оо < х <

оо, область ее

зна-

ний 0 <

у < оо.

 

 

В лингвистических приложениях используется показательная

функция,

где в качестве постоянной а взято

число Эйлера

е =

== 2,718 ..., выступающее в качестве основания натуральных

лога-

рифмов.

Функция

 

 

 

у = е*

 

(1.10)

4. Логарифмическая функция. Логарифмической

функцией на-

зывается функция вида

 

0 = l0go x,

(1.11)

где основание логарифма а есть положительное, отличное от единицы число. По определению логарифма, равенство у = log0 х является обратным по отношению к равенству х — а», и, наоборот, у — а" обратно х = log0 у. Поэтому график логарифмической функции (логарифмика) является зеркальным отображением экспоненты относительно биссектрисы I координатного угла (см. рис. 10 и 11). Логарифмика асимптотически приближается к оси Оу. Областью

определения функции служит правая полуось Ох, т. е. О <

х <

оо,

а областью значений функции — вся ось Оу,

т. е. — оо <

у <

оо.

5. Периодические функции: Для ряда

лингвистических

яв-

лений характерна отчетливо выраженная периодичность. Такой периодичностью обладают не только акустическая субстанция речевого сигнала, но также и распределение информации в письменном тексте. Явления этого типа описываются с помощью периодических функций.

Основная особенность периодических функций состоит в том, что имеется такое постоянное число Т, прибавление которого к любому допустимому значению аргумента не изменяет значения функ-

ции, т. е.

 

У — f (х + Т) = f (х).

(1.12)

28

Н а и м е н ь ш е е положительное число т, от прибавления которого к любому допустимому значению аргумента значение функции не изменяется, называют периодом. Следует иметь в виду, что f (х +

nx) = f (х), где п — любое число.

К периодическим функциям отнрсятся тригонометрические и обратные тригонометрические функции.

6. Тригонометрические функции. Рассмотрим следующие четыре основные тригонометрические функции.

1. Синус:

 

 

у = г sin (сох +

ф);

 

(1.13)

здесь и

далее х — аргумент, выраженный

в радианной

мере*, г,

о, ср — коэффициенты; если г =

© == 1 и Ф=0, то получается функ-

ция

 

У =

sinx,

 

 

(1.14)

 

 

 

 

графиком которой

является обыкновенная

синусоида с

периодом

Т — 2л

(рис. 12),

причем — оо < л; <

оо, — 1 < у <

1.

2.Косинус.

 

 

г/ =

гсоз((од; +

ф) =

г8т^(од; +

ф + -у^5

 

(1-15)

его графиком служит косинусоида, также

имеющая

период Т = 2л

и

сдвинутая

относительно синусоиды

(1.13) на

л/2,

причем

— < 5 0 < X < 0 0 , — 1 < « / < 1 .

 

 

 

 

 

 

3.

Тангенс.

 

 

У = tgx;

 

 

 

(1.16)

 

 

 

 

 

 

 

 

 

*

Единицей

радианного

измерения служит

дуговой

радиан,

представ-

ляющий собой отношение дуги,

равной по длине радиусу,

к самому

радиусу.

Угол,

образованный этой дугой,

составляет

57° 17'45".

Отсюда

sinl =

=

sin 57° 17'45" =

0,8414.

 

 

 

 

 

 

29