- •О потенциале татарского языка для создания новых технологий обработки информации1
- •Д.Ш. Сулейманов
- •Институт филологии и искусств, Академия наук рт
- •Абстракт
- •Ключевые слова технологический аспект естественных языков (ея), аффиксальные морфемы, морофтактика, активность знаний,морфологический эллипсис, рекурсия.
- •1. Когнитивные лексико-грамматические признаки, определяющие технологичность языка
- •Регулярность и естественная сложность морфологии
- •Именным словоформам соответствует следующая морфотактика:
- •Примеры именных форм:
- •Морфологический эллипсис и явление рекурсии в татарском языке
Примеры именных форм:
китаплар (‘ книги’) - китап (‘книга’ - имя сущ.)+лар (афф.множ.); китабым (‘моя книга’) - китап (‘книга’ - имя сущ.)+ым (афф.притяж., 1л., ед.ч.); китапмы? (‘книга ли?’) – китап (‘книга’ - имя сущ.) + мы (афф.вопрос.); китапларымнанмыни? (китап-лар-ым-нан-мыни?) (‘неужели из моих книг?’) - китап (‘книга’ - имя сущ.)+лар (афф.множ.)+ым(афф.притяж.,1л., ед.ч.)+нан (афф.аблатив-исх. пад. )+мыни (афф.вопрос., удивление); китапларымдырмы(‘то ли мои книги’);китап(‘книга’ - имя сущ.)+лар (афф.множ.)+ым (афф.притяж.,1л., ед.ч.)+дыр(афф.модальности, сомнение)+ мы(афф. вопрос.).
Еще одной особенностью татарской грамматики, которая следует из описания морфотактики и может быть использована как технологический признак при создании модели обработки текста, является то, что аффиксальная морфема (или последовательность морфем), присоединяясь справа к именной словоформе, являющейся самой правой составляющей в последовательности словоформ именной группы, относится ко всей именной группе. Например: Балачактан яраткан китапларым - ‘любимые мной с детства книги’ (Балачактан яраткан китап)+лар+ым, Балачактан яраткан китабыбыз - ‘любимая нами с детства книга’ (Балачактан яраткан китап)+ы+быз).
Свойства регулярности морфотактики и фиксированности позиций соответствующих типов аффиксальных морфем в татарском языке присущи также и глагольным формам. Глагольным словоформам соответствует следующая морфотактика:
<Глагольная форма> ::= <ОСНОВА> [<залог>] [<отрицание>] [<время>] [<лицо>] [<модальность>]
Здесь <ОСНОВА> определяется как глагольная корневая морфема в словарной форме. Примеры:
кал (‘останься’ - глагол); калдыр (‘сделай так, чтобы остался’) - кал (‘останься’) + дыр (залог понудит.); калдырма (‘сделай так, чтобы не остался’) - кал (‘останься’) + дыр (залог понудит.)+ма (отрицание); калдырдыгыз (‘сделали так, что остался’) - кал (‘останься’)+дыр (залог принудит.)+ды (прошедшее вр.)+гыз (3 лицо, мн. число); калдырмадыгыз (‘не сделали так, чтоб остался’) - кал (‘останься’)+дыр (залог принудит.)+ ма (отрицание)+ды (прошедшее вр.)+гыз (3 лицо, мн. число); калдырмадыгызмыни (‘разве не сделали так, что остался’) - кал (‘останься’)+дыр (залог принудит.)+ ма (отрицание)+ды (прошедшее вр.)+гыз (3 лицо, мн. число).
Последовательность аффиксов, служащая для описания соответствующих значений ролевой ситуации, кодируемой глагольной группой, также как и в случае именной группы, определяется для глагольной словоформы, следующей самой правой в последовательности словоформ, входящих в глагольную группу.
Например, в глагольной группе:
чабып барып карап алып кайттыгызмы? (букв.: бегом+сходив+посмотрев+взяв возвратились ли?) последовательность аффиксов –ты+гыз+мы присоединяется к последней глагольной морфеме кайт (пов. накл., 2 л., ед.ч.) (‘возвратись’), очевидно, являясь некоторой заскобочной цепочкой, завершающей глагольную группу и относящейся ко всей глагольной группе. То есть для смысловой экспликации выражения было бы вполне корректно отобразить глагольную группу (скажем, при разметке текста для машинных применений), используя скобочную запись следующим образом: (чабып ‘бегом’ барып ‘сходив’ карап ‘посмотрев’ алып ‘взяв’ кайт ‘возвратись’)+ты(прош. время)+гыз(3 лиц, мн.ч.)+мы(мод., вопрос.)?
Рассмотрим ряд признаков, определяющих естественную сложность татарской морфологии: 1) возможность присоединения к словоформе определенных аффиксальных морфем, изменяющих тип слова, превращающих, например, именную словоформу в глагольную или в форму прилагательного и наоборот; 2) морфологическое (синтетическое) задание признаков модальности, настроения, эмоционально-личностного отношения к ситуации, объекту или процессу, описываемым данной словоформой; 3) контекстное разнообразие значений аффикса.
Известно, что именная группа, как правило, кодирует некую семантическую ролевую ситуацию, а глагольная группа – контекстные отношения над этими ролями. Таким образом, возможность перехода с именной формы к глагольной и, наоборот, с глагольной формы к именной, через присоединение соответствующих аффиксов, позволяет описывать одновременно в пределах одной словоформы как сложную ролевую ситуацию, так и контекстные отношения между семантическими ролями.
Тем самым обеспечивается компактность описания и хранения информации. Синтетический, аффиксальный способ словоизменения обеспечивает кодирование в рамках одной словоформы некоторого значения, описываемого на флективно-аналитических языках (например, на английском) несколькими словосочетаниями и даже предложениями.
В качестве примера реализации признака (1) рассмотрим следующую словоформу, являющуюся корректной для татарского языка: татар/ча/ла/штыр/гала/штыр/у/чы/лар/дагы/ныкы/лар/га/мыни? (Примечание: здесь разделительные косые - «слэш» расставлены только для удобства зрительного восприятия словоформы, в реальной словоформе их нет) (перевод: разве тем (к тем/на тех), что принадлежит тому (той), что на тех, кто (что) время от времени занимаются татаризацией (переводом на татарский язык)?). Данная словоформа имеет следующую структуру: татар (имя сущ.) + ча (наречие) + ла (глагол) + штыр (глагол, залог) + гала (глагол, залог)+штыр (глагол, залог)+у (субстантив., имя действ.)+чы (имя сущ.) + лар (множ.) + дагы (субстантив., локатив) + ныкы (субстантив., притяжат.) + лар (множ.) + га (директив) + мыни (вопрос, удивление).
Возможность аффиксального задания признака модальности (2), в отличие от других языков, в которых данный признак отображается либо эмоционально-просодически, либо с помощью дополнительной словоформы, также является свойством, способствующим адекватной интерпретации значения словоформы и минимизирующим время его распознавания.
Третий признак сложности татарской морфологии определяет контекстное разнообразие значений аффикса. Практически все аффиксальные морфемы обладают свойством полисемии. В частности, как показывают наши исследования [3], аффиксальная морфема –ГА имеет порядка 20 значений, то есть используется для кодирования до 20 различных контекстных значений. В таблице 1 показано несколько примеров с аффиксом –ГА.
Таблица 1
Кодируемое значение |
|
Пример |
1. Исполнитель процесса |
+ |
укытучыга хат укыту ('дать учителю прочитать письмо'), т.е. учитель читает письмо |
2. Объект |
|
|
2.1. Прямой |
— |
|
2.2. Косвенный |
+ |
укучыга кушу ('поручить ученику') |
3. Цель процесса |
+ |
утынга бару ('ехать за дровами') |
4. Причина совершения процесса |
+ |
матурлыкка соклану ('восхищаться красотой') |
5. Время совершения процесса |
+ |
биш атнага кайту (приехать на пять недель') |
6. Место совершения процесса |
|
|
6.1. Конечный пункт назначения |
+ |
урманга бару ('идти в лес') |
6.2. Исходный пункт |
— |
|
7. Способ совершения процесса |
+ |
барлык көчкә чабу ('бежать изо-всех сил') |
8. Мера, степень процесса, действия |
|
|
8.1. Мера процесса |
+ |
бер атнага кайту ('вернуться на неделю') |
8.2. Мера объекта процесса |
+ |
ун сумга алу ('купить на десять рублей'). |
9. Средство достижения цели |
+ |
акчага алу (купить за деньги) |