Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
СулеймановСтатья Татфак ИФИ.doc
Скачиваний:
1
Добавлен:
14.11.2019
Размер:
151.04 Кб
Скачать
    1. Морфологический эллипсис и явление рекурсии в татарском языке

Явления морфологического эллипсиса и рекурсии в татарском языке также могут быть отнесены к признакам, повышающим технологичность татарского языка. Морфологический эллипсис определяется как возможность пропуска последовательности аффиксов при однородных именных словоформах с сохранением ее в последней словоформе. То есть, возможность вывода последовательности аффиксов любой длины, общей для однородных членов, вправо, за последовательность однородных членов, и присоединение их к последнему справа однородному члену.

Например: Ишек алды тавыкларга, казларга, сыерларга тулы = Ишек алды тавык, каз, сыерларга тулы. ‘Двор полон кур, гусей, коров’.

Мин кырларыбызга, урманнарыбызга, елгаларыбызга, тауларыбызга шатланам = мин кыр, урман, елга, тауларыбызга шатланам . ‘Я радуюсь нашим полям, лесам, рекам’.

Явление рекурсии определяется как возможность циклического порождения нового значения путем последовательного применения одной и той же «формулы», т.е. повторного присоединения одной и той же аффиксальной морфемы.

Такими свойствами обладают аффиксальные морфемы –ДАгЫ (локатив2, место-временной падеж 2) и –нЫкЫ (притяжат.падеж), которые можно назвать также аффиксами неопределенности, т.е. аффиксами, придающими неопределенность лексемам, к которым присоединяются.

Например, пусть задана лексема тау (‘гора’). Присоединение аффикса –дагы порождает новые объекты или свойства, являющиеся неопределенными: таудагы – ‘нечто на горе’; таудагыдагы – ‘нечто на нечто на горе’; тауныкы – ‘то, что принадлежит горе’; тауныкыныкы – ‘то, что принадлежит тому, что принадлежит горе’.

По такой формуле может быть образована словоформа практически неограниченной длины. Естественно, такие длинные последовательности морфем в речи практически не используются. Это, прежде всего, как мы считаем, связано с проблемами глубины памяти, удобства общения между людьми. Тем не менее, подобное словоизменение является совершенно корректной с точки зрения грамматики татарского языка и словоформа, образованная присоединением последовательности любой длины, гипотетически всегда имеет смысл, конкретное значение приобретается при «погружении» словоформы в определенный контекст.

Приведем пример со следующей словоформой: тауныкындагыныкыныкындагы, которая однозначно раскладывается на следующие составляющие - тау+дагы+ныкы+ндагы+ныкы+ндагы - ‘тау’ (имя сущ.+локатив2+притяж.пад.+ локатив2+ притяж.пад. +локатив2).

Данная словоформа означает следующее:

‘нечто, находящееся на/в нечто, принадлежащее нечто, находящееся на/в нечто, принадлежащее нечто, находящееся на/в горе’.

Нетрудно заметить, что, задавая параметры после каждой морфемы эксплицитно, в явном виде, можно добиться определенности значения словоформы. То есть словоформа, после подстановки конкретных значений вместо аффиксов неопределенности, также приобретает конкретное значение. В реальных случаях, в речи, такие параметры наполняются конкретным значением из контекста речи, дискурса.

Рассмотрим следующий пример для иллюстрации изложенного утверждения. Пусть после каждого аффикса неопределенности стоят параметры: тау+дагы(x1)+ндагы(x2)+ныкы(x3)+ныкы(x4)+ндагы(x5)+ныкы(х6), где xi – контекстные объекты, т.е. объекты, приобретающие конкретное значение либо из контекста, либо их задает пользователь (i=1,6). Таким образом, придавая значения параметрам: x1= мәгәрә (“пещера”) , x2= аю (“медведь”), x3= лапа («аяк»), x4= тырнак («коготь»), x5= бал («мед»), мы получаем следующее контекстное значение: «нечто (значение х6, придаваемое параметру последним аффиксом, осталось неопределенным), что присуще меду, что на когте, что принадлежит лапе, что принадлежит медведю, что находится в пещере, что находится на горе».

На месте корневой морфемы также может стоять неопределенный параметр: Х+дагы(x1) +ндагы(x2) +ныкы(x3) +ныкы(x4) +ндагы(x5) +ныкы(х6). При этом на месте Х может быть любое понятие, задаваемое имплицитно, и раскрываемое через контекст, либо задаваемое эксплицитно (т.е. явно) пользователем. Например, для нашего случая: Х=тау (‘гора’). В речи, зачастую, в качестве Х используется местоимение «ни», выступающее как метаслово, интенсионал, конкретное значение которого приобретается непосредственно из контекста: ни/дәге/ндәге/неке/неке/ндәге/неке.

Рассмотрим проявление свойства рекурсии в языке на примере предложений.

Кыр куяны колакларындагы кара тапларда матурлык бар. Урман куяныныкылардагыларныкыннан башкарак. (‘Есть красота в черных пятнах на ушах полевых зайцев. Несколько иная, чем та красота, которая в черных пятнах на ушах лесного зайца’).

Здесь в словоформе куяныныкылардагыларныкыннан = куяны(‘его/ее заяц’)+ныкы(х0)+лар(множ.)+дагы(х1)+лар(множ.)+ныкы(х2)+ннан(исх.падеж) ряд понятий (х0, х1, х2) задан имплицитно, однако, однозначно раскрывается по предыдущему контексту (т.е. по пресуппозиции): х0 = колак (‘ухо’); х1 = кара тап(‘черное пятно’); х2 = матурлык(‘красота’).

Второе предложение при полном эксплицитном написании выглядит следующим образом: Урман куяны колакларындагы кара таплардагы матурлыктан башкарак (‘Несколько иная, чем та красота, которая в черных пятнах на ушах лесного зайца’).

Даже на этом коротком примере элементарный расчет показывает, что применение рекурсивных аффиксов приводит к сжатию информации и существенной экономии памяти. В случае применения рекурсии в приведенном примере количество слов сокращается в два с лишним раза и число используемых символов уменьшается на 23 (в варианте без рекурсии: 7 слов, 64 знака; в варианте с рекурсией: 3 слова, 41 знак). При этом по контексту осуществляется достаточно простая и однозначная экспликация неопределенностей, которые известны в лингвистике как явление анафоры. В нашем случае этот тип анафоры можно назвать анафорой рекурсии.

1.3. Нечеткость описания команд и действий и описание одной глагольной словоформой ролевой ситуации

Известно, что поверхностное, лексическое описание предикатов (команд, действий, отношений), как правило, осуществляется глагольными словоформами.

Далее рассмотрим следующие два признака технологичности, отражающие естественные когнитивные механизмы, проявляющиеся в глагольных словоформах:

1) Возможность рекурсивно задавать нечеткие команды и описывать нечеткие действия и связи между объектами.

2) Возможность рекурсивно описывать в рамках одной словоформы действия, относящиеся к целой ролевой ситуации.

Признак (1) кодируется глагольными аффиксами, занимающими позицию залога, т.е. сразу же после глагольной основы, – ГАлА, - штЫр.

Например:

у (‘стирай’) – ‘стирать’ (3 лицо, ед.ч., повел. накл.);

угала (‘стирай время от времени’) - у(‘мой’)+гала (‘время от времени’);

угалаштыр (‘стирай время от времени, время от времени: реже’) - у(‘мой’)+гала(‘время от времени’)+штыр (‘время от времени’);

угалаштыргала (‘стирай время от времени, время от времени, время от времени: еще реже’) - у(‘стирай’)+гала(‘время от времени’)+штыр (‘время от времени’)+гала(‘время от времени’);

угалаштыргалаштыргала… (‘стирай время от времени, время от времени, время от времени: и еще реже…’)

у (стирать, корень, 3 лицо, ед.ч., повел.накл.)+гала(‘время от времени: изредка’)+штыр(‘время от времени: еще реже’)+гала(еще реже)+штыр(еще реже)+гала(еще реже)…

Сам факт, насколько редко требуется стирать, определяется исходя из контекстной информации или из модели мира. Например, футболканы уыштыргала – ‘стирай футболку время от времени’, может означать команду: стирать футболку один раз после нескольких дней одевания, в то время как команда галстукны уыштыргала - ‘стирай галстук время от времени’, скорее всего, означает: стирать галстук один раз в год или даже еще реже, по необходимости.

Реализация признака 2 обеспечивается рядом специальных глагольных аффиксов, занимающих также залоговую позицию: -н, -Ыш, -т, -ДЫр.

Рассмотрим изменения ролевой ситуации при присоединении соответствующих аффиксов на примере с глагольной словоформой ташла (‘бросай’).

Участники действия: субъект S, объект-предмет Ok, где k ≥ 1.

Для словоформы ташла (‘бросай’) ролевая ситуация следующая:

S воздействие на Ok

Присоединение аффиксов -н, -Ыш, -т, -ДЫр приводит к изменениям, описанным ниже.

1) –н:

ташлан – ташла+н (‘бросайся’)

Ролевая ситуация:

S воздействие S (рефлексия)

2) -Ыш:

ташлаш – ташла+ш (‘помогай бросать/бросай вместе’)

Участники действия: субъект S, объект-актор Ai,j, объект-предмет Ok, где i – номер группы объекта-актора, i ≥ 1; j – число участников в группе i, j≥ 1.

Ролевая ситуация:

S воздействие (помощь) Ai,j и (S & Ai,j) воздействие (бросить) Ok.

3) -т, -ДЫр:

ташлат – ташла+т (‘сделай так, чтобы бросил/бросили’)

Ролевая ситуация:

S воздействие Ai,j -> Ai,j воздействие (бросить) Ok. Здесь стрелка -> означает импликацию.

ташлаттыр – ташла+т+тыр (‘сделай так, чтобы сделали так, чтобы бросили’)

Ролевая ситуация:

S воздействие Ai,j -> Ai,j воздействие Al,m -> Al,m воздействие (бросить) Ok.

ташлаттырт - ташла+т+тыр+т (‘сделай так, чтобы сделали так, чтобы сделали так, чтобы бросили’)

Ролевая ситуация:

S воздействие Ai,j -> Ai,j воздействие Al,m -> Al,m воздействие As,t -> As,t воздействие (бросить) Ok.

По такой формуле, подставляя новые определенные аффиксы, можно создавать все новые и новые ролевые ситуации и описывать процессы на лексическом уровне. Например, добавление аффикса –Ыл к последней полученной словоформе: ташлаттыртыл превращает сам субъект в объект-предмет, объект воздействия, т.е. S= Ok.

Получается следующая ролевая ситуация с рефлексией:

S воздействие Ai,j -> Ai,j воздействие Al,m -> Al,m воздействие As,t -> As,t воздействие (бросить) S.

1.4. Активность знаний

Известно, что английские предложения строятся по схеме S-V-O (subject-verb -object: субъект-глагол-объект), а татарские - по схеме: S-O-V. То есть, англичанин, если говорит, например, о намерении сходить в кино, сначала скажет, пойдет или не пойдет, и только после этого выдает информацию – куда, какой, зачем, с кем, когда и т.д. (“I’ll go to the cinema “Atilla” with my friend afternoon”). Очевидно, здесь действие управляет ситуацией. После того, как высказано однозначно намерение субъекта, дальнейшая информация становится пассивной, практически не влияет на выбор способа действия или усложняет его. А в татарском языке сначала дается информация и ее анализ, и только после этого, возможно, с учетом реакции слушающего, определяется - положительное или отрицательное, само действие. («Мин дустым белән төштән соң буласы “Атилла” киносына барам/бармыйм» - буквально: ‘Я со своим другом после обеда на фильм «Атилла» пойду/не пойду’).

В системах искусственного интеллекта это называется активностью знаний, что является одним из важных признаков интеллектуальности системы [2]. Для интеллектуальных систем естественным и основополагающим является стиль размышления: анализ-действие, размышление-цели-алгоритмы, а не командный стиль: действие-анализ, алгоритм-цель, как это реализовано в современных технологиях, языках и системах программирования, основанных на менталитете английского языка. То есть в ситуации, описываемой системой, основанной на менталҗности татарского языка, сначала анализируется, обрабатывается информация, а затем осуществляется некое действие - подбирается соответствующая адекватная модель представления знаний или выбираются соответствующие алгоритмы и схемы реализации, оптимальность и эффективность которых во многом определяется корректностью и полнотой анализа информации. Это можно назвать событийным или ситуационным программированием.

Такие возможности, являющиеся естественными для татарского языка и закрепленные в грамматике татарского языка, позволяют ставить задачу о разработке интеллектуальных программ накопления и извлечения знаний в глобальных компьютерных сетях, что, как известно, становится сверхактуальной задачей в современном информационном мире.

Заключение

Лексико-грамматические возможности описания, запоминания, хранения, обработки и передачи информации на естественном языке являются теми технологическими признаками, которые позволяют на поверхностном уровне вербализовать, фиксировать и отображать эксплицитно глубинные стереотипы, когнитивные модели и механизмы, описывающие ситуации и процессы в модели мира.

В данной статье на примере татарского языка рассмотрен ряд лексико-грамматических признаков, определяющих технологичность языка, представляющих определенный методологический и практический интерес для создания программных средств эффективной обработки естественно-языковой информации.

Как показывают исследования [1, 3], татарский язык, как агглютинативный язык, обладающий регулярной морфологией и вместе с тем естественной сложностью, разрешаемой контекстно, является эффективным инструментом для создания интеллектуальных систем обработки информации. В силу минимальных показателей временных и емкостных оценочных функций для генерации и анализа цепочек татарских словоформ (за счет регулярности) достигается эффективность при накоплении и обработке информации на татарском языке. Компактность передачи смысла текста на поверхностном, лексическом, уровне объясняется также возможностями языка синтетически, т.е. словоформой, кодировать смысл, который для других языков (английский, русский) формируется аналитически, чаще всего несколькими предложениями. Агглютинативность языка, алгоритмические закономерности, минимальность исключений, наличие мощного мета-аппарата, достаточная жесткость синтаксиса позволяют ставить задачу о построении языка промежуточной трансляции, т.е. языка-посредника на базе татарского языка, и даже разработки новых операционных систем на основе новой идеологии.

Литература

  1. Сулейманов Д.Ш., Гатиатуллин А.Р. Структурно-функциональная компьютерная модель татарских морфем. – Казань, Изд-во «Фэн», 2003. - 220 с.

  2. Поспелов Д.А., Осипов Г.С. Прикладная семиотика. (Из неизданных книг). Доступно: http://raii.org/library/ainews/1999/1/OSPOS.ZIP

  3. Suleymanov D.S. Natural possibilities of the Tatar morphology as a formal base of the NLP // In Proceedings of the First International Workshop “Computerisation of Natural Languages” (Varna, Sept. 3-7, 1999). –Sofia (Bulgaria): Information Services Plc, 1999. -P.113.

1 Работа выполнена при поддержке гранта РФФИ №

15