Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Силлабус элементарная статистика.doc
Скачиваний:
3
Добавлен:
07.05.2019
Размер:
236.03 Кб
Скачать

1. Методологические и философские проблемы математики

1.1. Математические методы в системе методов научного познания. Предмет математики. Роль математики в гуманитарных исследованиях. Формализация и моделирование.

1.2. Математика и действительность. Математические модели действительности. Математические модели и гуманитарные науки.

1.3. Аксиоматический метод. Дедуктивные и индуктивные науки.

2. Графический метаязык лингвистики как проявление математизации языкознания [11-доп.; сс. 84, 96-112]

3. Языкознание и естественные науки. Количественные методы в языкознании. Математическая экспликация [3-осн., соответствующие статьи]; [4-доп., сс. 5-10]; [5-доп., сс. 38-40]; [7-доп., сс. 14-15]

4. Квантитативная лингвистика

4.1. Множество лингвистических объектов. Нечёткие множества и полевая структура [4-доп.; сс. 11-16], [11-доп.; сс. 26-28]

4.2. Метод глоттохронологии [3-осн.], [4-доп.; сс. 57-62], [13-доп.]

4.3. Статистические, теоретико-вероятностные, теоретико-информационные модели языка и текста [Турыгина Л.А., Головин Б.Н., Пиотровский Р.Г.]

4.4. Статистический подход к исследованию языковых структур. Основы построения лингвостатистических моделей [7-доп.; сс. 8-17]

4.5. Основания и условия вероятностно-статистического изучения языка и речи [6-доп.; сс. 10-18]; [7-доп.; сс. 11-14]

4.6. Минимально-необходимые статистические инструменты [6-доп.; 19-27]

4.7. Методика статистического эксперимента [7-доп.; 19-25]; [4-доп.; 294-301]

– определение и дальнейшее уточнение целей лингвостатистического анализа;

– определение единицы анализа;

– методика сбора информации, генеральная совокупность, выборочный метод;

– репрезентативность выборки; приемы, позволяющие обеспечить надежную репрезентативность тематических выборок;

– рациональный объём выборки, определение достаточности объёма выборки.

5. Основные области приложения структурно-вероятностных моделей языка и текста

5.1. Основные области приложения структурно-вероятностных моделей языка и текста [5-доп., сс. 40-43]

5.2. Авторизация / атрибуция текста [5-доп., сс. 43-51]; [сайт 3]

5.3. Корпусная лингвистика [5-доп., сс. 112-137]; [сайты 5, 6, 7, 9]

5.4. Контент-анализ [5-доп., сс. 247-281]; [сайт 2]

Задание № 3. Самостоятельная работа «Статистический анализ текста»

Работа заключается в проведении статистического анализа литературного текста по грамматическим категориям и должна быть сдана преподавателю для проверки не позднее, чем на 4-ом практическом занятии. Текстом служит предисловие к роману М.Ю. Лермонтова «Герой нашего времени».

Текст

«Во всякой книге предисловие есть первая и вместе с тем последняя вещь; оно или служит объяснением цели сочинения, или оправданием и ответом на критики. Но обыкновенно читателям дела нет до нравственной цели и до журнальных нападок, и потому они не читают предисловий. А жаль, что это так, особенно у нас. Наша публика так еще молода и простодушна, что не понимает басни, если в конце её не находит нравоучения. Она не угадывает шутки, не чувствует иронии; она просто дурно воспитана. Она еще не знает, что в порядочном обществе и в порядочной книге явная брань не может иметь места; что современная образованность изобрела орудие более острое, почти невидимое и тем не менее смертельное, которое, под одеждою лести, наносит неотразимый и верный удар. Наша публика похожа на провинциала, который, подслушав разговор двух дипломатов, принадлежащих к враждебным дворам, остался бы уверен, что каждый из них обманывает свое правительство в пользу взаимной, нежнейшей дружбы.

Эта книга испытала на себе еще недавно несчастную доверчивость некоторых читателей и даже журналов к буквальному значению слов. Иные ужасно обиделись, и не шутя, что им ставят в пример такого безнравственного человека, как Герой Нашего Времени; другие же очень тонко замечали, что сочинитель нарисовал свой портрет и портреты своих знакомых... Старая и жалкая шутка! Но, видно, Русь так уж сотворена, что все в ней обновляется, кроме подобных нелепостей. Самая волшебная из волшебных сказок у нас едва ли избегнет упрека в покушении на оскорбление личности!

Герой Нашего Времени, милостивые государи мои, точно портрет, но не одного человека: это портрет, составленный из пороков всего нашего поколения, в полном их развитии. Вы мне опять скажете, что человек не может быть так дурен, а я вам скажу, что ежели вы верили возможности существования всех трагических и романтических злодеев, отчего же вы не веруете в действительность Печорина? Если вы любовались вымыслами гораздо более ужасными и уродливыми, отчего же этот характер, даже как вымысел, не находит у вас пощады? Уж не оттого ли, что в нем больше правды, нежели бы вы того желали?..

Вы скажете, что нравственность от этого не выигрывает? Извините. Довольно людей кормили сластями; у них от этого испортился желудок: нужны горькие лекарства, едкие истины. Но не думайте, однако, после этого, чтоб автор этой книги имел когда-нибудь гордую мечту сделаться исправителем людских пороков. Боже его избави от такого невежества! Ему просто было весело рисовать современного человека, каким он его понимает и, к его и вашему несчастью, слишком часто встречал. Будет и того, что болезнь указана, а как её излечить – это уж Бог знает!»

Анализ

1 этап. Используя раздел «Аналитическая грамматика словаря» из «Частотного словаря русского языка» под ред. Засориной [5-доп.], справочную литературу по грамматике (в т.ч. и словари), определите для каждой единицы анализа её грамматическую категорию и заполните таблицу. В строке «Остальные» значение абсолютной частоты F не должно превышать 3-4.

Грамматические категории

Абсолютная частота (F)

Относительная частота (f)

Существительное

Глагол

Прилагательное

Наречие

Числительное

Местоимение

Союз

Предлог

Частица

Причастие

Остальные

Итого (общая сумма)

2 этап. Проведите анализ распределения частот грамматических категорий слов, сравнив полученные данные с данными таблицы 4, приведенной в приложении 4 частотного словаря русского языка под редакцией Засориной:

– проанализируйте расхождения и совпадения относительных частот грамматических категорий слов, полученных Вами, со средними «по Засориной» значениями для всех функциональных стилей (жанров); укажите возможные на Ваш взгляд причины этих расхождений и совпадений;

– определите функциональный стиль, к которому «тяготеет» этот отрывок и можно ли однозначно ответить на этот вопрос;

– какие типы текстов могут давать похожие таблицы;

– можно ли «догадаться», и каким образом о формальном содержании текста только по таблице частот.