- •1 Этап: Выбор материала-корпуса яз-ых данных.
- •2 Этап: Выбор концепт-ой перем-ой и опред-ие ее знач-ий – яз-ых репрезентантов в тексте
- •3 Этап: Выбор ед-цы кодирования
- •4 Этап: Отбор кодировщиков и формулировка инструкций по кодирования
- •5 Этап. Кодировка данных
- •6 Этап.
- •4. Переведите предложения. Сравните морфемную и словообразовательную структуру выделенных слов. Объясните, как эти слова образованы.
- •5. Распределите по шкале линейно-синтагматической свободы следующие морфологические единицы: над рекой, щик, бы, сад, саду, я, при, вы, лесов, лесу, в лесу, он, и, лес, ник
- •6. Выявите, представьте в графическом виде и объясните иерархическую структуру текста.
- •7. Выделите тему и рему
- •8. Объясните, почему представленный рассказ Даниила Хармса «Встреча» из цикла «Случаи» является аномальным? Какие принципы построения дискурса нарушены?
- •9. Исходные данные: текст.
- •13. Сколько значений слова банк представлено в следующих примерах? Выделите эти значения, дайте соответствующие им краткие толкования и опишите их, как они связаны между собой.
- •14. Исходные данные: 2 текста
- •16. Исходные данные: Таблица распределения терминов в трех текстах.
- •17. Проведите сравнительный анализ двух словарей (словарная статья – politics, policy).
- •18. Провести сравнительный анализ bns и нкря.
- •19. Проведите лексикографический анализ словаря.
- •20. Ниже даны предложенные на языке Самоа (остров на юге Тихого океана) и соответствующие им предложения на английском:
13. Сколько значений слова банк представлено в следующих примерах? Выделите эти значения, дайте соответствующие им краткие толкования и опишите их, как они связаны между собой.
Этот банк построен в прошлом веке.
В этом месяце были лишены лицензии три банка.
Мой знакомый вчера сорвал в казино банк.
В нашем банке данных нет этой информации.
«В банке сейчас около ста тысяч рублей», – сказал банкомёт.
Наш госпиталь создавал свой банк крови в течение пяти лет.
[Решение задачи:
Строгой процедуры выделения лексич-их знач-ий не существует. Тем не менее, в этой задаче предлагаются достаточно ясные случаи полисемии. Количество выделяемых ниже значений соответствует лексикографич-ой традиции. В шести предложенных примерах слово банк употреблено в четырех значениях.
1. ‘Кредитное учреждение (в котором хранятся деньги)’ – 2.
2. ‘Здание кредитного учреждения’ – 1.
3. ‘Деньги, поставленные на кон в карточной или другой азартной игре’ – 3, 5.
4. ‘Систематизированное хранилище’ – 4. 6.
Первым в данном случае дается наиболее важное значение (иногда его называют главным), из которого путем различных операций и переносов получаются остальные. Второе значение связано с первым регулярным метонимическим переносом (учреждение → здание) и иногда объединяется с ним в одно значение. Третье значение связано с первым идеей хранения денег (в игре — временного) (метафорический перенос – f-циональное сходство). Четвертое значение связано с первым идеей систематизированного хранения.]
14. Исходные данные: 2 текста
Задание: установить степень среднего отклонения распределения слов по частотности от закона Ципфа в двух текстах на основе абсолютных вероятностных величин.
Программное средство: конкорданс AntConc
[Решение задачи:
AntConc сохранить например в Excel
Подсчитать д/каждого слова вероятностную величину
частотность/общее количество токенов текста реального распределения
21/139 = 0,151
Распределение по закону Ципфа = вероятность одного слова/ранг слова
Разница 1-2 (ABS…)
Суммировать разницу отклонения от закона Ципфа
Высчитать разницу отклонений в двух текстах]
15. Установите пары, тройки и т.д. слов, встречающихся в тексте и находящихся в одном из четырех отношений: синонимии, антонимии, гипонимии и меронимии. Подчеркните в тексте все слова, участвующие в данных отношениях.
Мне на день рождения подарили секундомер, а я не знаю, что с ним делать. Прибор, конечно, нужный, но непонятно зачем. Если бы сейчас было лето, я бы бегал с ним стометровку или другую дистанцию, и замерял бы время.
А сейчас другой сезон – зима. По улицам с секундомером не побегаешь. Лучше бы мне часы подарили, а то я всегда тороплюсь и всегда опаздываю. В моих стрелки сломались. Бабушка мне говорила: «Не спеши, людей насмешишь». В общем, в этом году секундомер мне не понадобится. Да и вообще секунды слишком маленькие интервалы, важнее минуты или часы. Я вчера в школу на час опоздал, меня не пустили, и секундомер бы не помог. А вообще, из часовых механизмов самый полезный таймер.
[Решение задачи:
Мне на день рождения подарили секундомер, а я не знаю, что с ним делать. Прибор, конечно, нужный, но непонятно зачем. Если бы сейчас было лето, я бы бегал с ним стометровку или другую дистанцию, и замерял бы время. А сейчас другой сезон — зима. По улицам с секундомером не побегаешь. Лучше бы мне часы подарили, а то я всегда тороплюсь и всегда опаздываю. В моих стрелки сломались. Бабушка мне говорила: «Не спеши, людей насмешишь». В общем, в этом году секундомер мне не понадобится. Да и вообще секунды слишком маленькие интервалы, важнее минуты или часы. Я вчера в школу на час опоздал, меня не пустили, и секундомер бы не помог. А вообще, из часовых механизмов самый полезный таймер.
Исходя из значений, данных в тексте:
Синонимия:
нужный – полезный;
спешить – торопиться.
Антонимия:
зима – лето;
торопиться – не спешить.
Гипонимия:
механизм – прибор, часы, секундомер, таймер;
прибор – часы, секундомер, таймер;
время – год, день, час, минута, секунда, сезон, лето, зима;
интервал – год, день, час, минута, секунда, сезон, лето, зима;
сезон – лето, зима;
дистанция – стометровка.
Меронимия:
механизм, прибор, часы, секундомер – стрелка;
год, сезон, лето, зима, день, час, минута – секунда;
год, сезон, лето, зима, день, час – минута;
год, сезон, лето, зима, день – час;
год, сезон, лето, зима – день;
год – сезон, лето, зима. ]