Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Текст1.doc
Скачиваний:
9
Добавлен:
03.05.2019
Размер:
801.79 Кб
Скачать

§3.4. Контр. Работа №3. Задача 3.4.

ОЦЕНКА ДОСТОВЕРНОСТИ СДВИГА В ЗНАЧЕНИЯХ ИССЛЕДУЕМОГО ПРИЗНАКА.

Методические рекомендации и схема решения задачи №4

Достаточно часто перед психологом встает задача доказать, что в результате действия каких-либо факторов у группы индивидов достоверно изменились какие-либо показатели или показатель (то есть произошел "сдвиг"). Например, лонгитюдные исследования учитывают фактор времени (временной сдвиг): у одних и тех же испытуемых через какой-то промежуток времени измеряется один и тот же показатель, что позволяет сделать вывод о развитии интеллекта (у детей), улучшении или ухудшении творческих способностей с возрастом, изменении рефлексии и т.д. и.т.п. Лонгитюдные исследования, как известно, широко распространены в возрастной психологии, хотя применение их ограничивается организационными аспектами.

Сопоставление показателей, полученных по одним и тем же методикам на одних и тех же испытуемых, но в разных условиях измерения, дает нам ситуационный сдвиг. Примером является экспериментальное воздействие для выявления реакции испытуемых – если замер, произведенный после воздействия, значимо отличается от первоначального, то сдвиг считается статистически достоверным, и можно сделать вывод, что воздействие оказалось существенным, или эффективным.

Собственно, такое экспериментальное воздействие широко используется в педагогике как формирующий эксперимент, где также создаются условия для формирования или развития каких-либо знаний или умений2. Диагносцируется уровень знаний "до" экспериментального воздействия и "после" него. Таким же образом исследуется эффективность развивающих и коррекционных программ в психологии. Например, организуется группа для подростков, у которых с помощью методики Филлипса выявлен высокий уровень тревожности; разрабатывается коррекционная программа, проводятся занятия и в конце их по той же самой методике Филлипса повторно диагносцируется уровень тревожности. Если показатели тревожности после занятий у большинства участников уменьшились, то можно сделать вывод о том, что программа оказалась эффективной.

Однако, как известно, все психологические измерения являются величинами вероятностными, и для объективного вывода о статистической достоверности сдвига необходимо применить статистический критерий. В данном случае мы имеем зависимые ряды значений, поскольку они измерены на одних и тех же испытуемых, поэтому используются критерии оценки достоверности величины сдвигов для связанных выборок.

На практике достоверность сдвигов под влиянием экспериментальных условий, когда исследователя интересует изменение одних и тех же показателей, измеренных у одних и тех же испытуемых до и после воздействия при отсутствии контрольной группы определяется с помощью непараметрических статистических критериев: G – критерия знаков и T –критерия Вилкоксона.

Критерий знаков G предназначен для установления общего направления свига исследуемого признака. Он позволяет установить, в какую сторону в выборке в целом изменяются значения признака от первого замера к второму: изменяются ли показатели в сторону улучшения, повышения или усиления или, наоборот, в сторону ухудшения, понижения или ослабления.

Критерий знаков применим и к тем сдвигам, которые можно определить лишь качественно (например, изменение отрицательного отношения на положительное), так и тем сдвигам, кото

рые могут быть измерены количественно (например, увеличение количества слов, которые запоминаются после первого предъявления после тренировки памяти).

Однако, для измерения сдвигов, которые варьируют в достаточно широком диапазоне, лучше применять Т-критерий Вилкоксона. Он позволяет учитывать не только направление, но и интенсивность сдвигов.

Пример расчета G – критеря знаков.

С учащимися младшей школы, которые обнаруживают слабую способность запоминать информацию, психолог провел методику "Десять слов (по Лурия)" и выявил уровень развития кратковременной слуховой вербальной памяти. Затем эти 12 детей принимали участие в специально разработанной программе по развитию памяти. После окончания программы из 10 занятий психолог повторно провел диагностику уровня памяти (предлагалось запомнить 10 слов). Уровень развития памяти в данном случае представлен количественным показателем – количество запомненных слов из 10 возможных. Полученные данные приведены в таблице.

Таблица 1.

Учащиеся (инициалы)

В.

А.

У.

Г.

Н.

Л.

Ж.

З.

О

И.

К.

М.

Среднее

Результаты до проведения программы (количество запомненных слов из 10)

3

5

7

6

4

5

3

6

2

4

5

3

4,4

Результаты после проведения программы

5

7

7

5

6

7

4

8

4

4

6

5

5,7

Знак изменения результата (сдвиг)

+

+

=

-

+

+

+

+

+

=

+

+

В таблице 1. ставим знак "+" в четвертой строке, если показатель улучшился (сдвиг в сторону повышения показателя). Подсчитаем количество таких сдвигов, если их больше, чем других, будем считать их "типичными". Знак "-" ставится в колонке, где количество слов после коррекционной программы стало меньше, т.е. сдвиг в сторону ухудшения. Таких сдвигов мало (в нашем случае – всего один), поэтому они называются нетипичными. Знак "=" означает, что сдвиг "нулевой" – показатель не изменился, остался на прежнем уровне. "Нулевые" сдвиги при подсчете критерия знаков исключаются из рассмотрения. При этом количество сопоставляемых пар уменьшается на число таких "нулевых" сдвигов.

Суть критерия знаков состоит в том, что он определяет, не слишком ли много наблюдается "нетипичных сдвигов", чтобы сдвиг в "типичном" направлении считать преобладающим? Мы не называем эти сдвиги положительными или отрицательными, так как в некоторых случаях именно понижение показателя (например, уменьшение уровня тревожности) является желательным результатом коррекционной программы или какого-либо другого воздействия. В этом случае желательно, чтобы типичные сдвиги оказались отрицательными.

Рассматривая среднее арифметическое в группе до и после проведения программы, мы видим разницу: "до" было 4,5, а после – 5,7. Исходя из полученных данных, можно сформулировать две гипотезы: Н0 – различия между результатами до и после проведения программы случайны и, следовательно, она неэффективна для развития памяти (нулевая гипотеза в статистике всегда утверждает случайность различий или изменений). Н1 – различия в результатах не случайны, а вызваны применением данной коррекционной программы, следовательно, ее можно применять для развития памяти и у других младших школьников.

При проверке любых статистических гипотез решений в пользу одной из них никогда не принимается с полной уверенностью; всегда остается вероятность (контролируемая исследователем) принятия неправильного решения. Здесь нужно выбрать уровень достоверности. Как известно, они могут быть 95%-, 99%- и 99,9%. В первом случае вероятность принять ошибочное решение составляет 5% (0,05). Эта величина и называется уровнем значимости и всегда указывается в статистическом выводе.

Алгоритм расчета критерия знаков G.

  1. Подсчитываем количество нулевых реакций и исключаем их из рассмотрения. В результате n (количество измерений) уменьшится на количество нулевых реакций.

  2. Определяем преобладающее направление изменений. Считаем сдвиги в преобладающем направлении "типичными".

  3. Определяем количество "нетипичных" сдвигов. Считаем это число G эмпириченским (G'эмп.) – это количество нетипичных сдвигов. Чем меньше G'эмп , тем более вероятно, что сдвиг в "типичном" направлении статистически достоверен.

  4. По таблице 4 Приложения I определяем критические значения G для данного n.

  5. Сопоставляем G'эмп с G'крит . Если G'эмп меньше G'крит или по крайней мере равен ему, сдвиг в типичную сторону может считаться достоверным.

В нашем примере типичным сдвигом является положительный сдвиг. Отрицательный сдвиг один. Это – "нетипичный сдвиг", следовательно G'эмп = 1.

Количество "нулевых" сдвигов – 2, поэтому n = 12 –2 = 10. В таблице 4 Приложения I ищем G'крит для n = 10 находим критическое значение G = 1. Таким образом, наше значение G'эмп ≤ G 0,05 (На уровне вероятности 0,05).

Таким образом, нулевая гипотеза отвергается и принимается гипотеза Н1: различия в результатах не случайны, а вызваны применением данной коррекционной программы, следовательно, ее можно применять для развития памяти и у других младших школьников. Гипотеза верна на 95% уровне достоверности.

Критерий Т Вилкоксона.

Критерий применяется для сопоставления показателей, измеренных в двух разных условиях (например, "до" и "после" проведения коррекционной программы) на одной и той же (связанной) выборке испытуемых. Он позволяет установить не только направленность изменений, но и их выраженность. С его помощью мы определяем, является ли сдвиг показателей в каком-то одном направлении более интенсивным, чем в другом. Орграничением применения критерия Вилкоксона является количество испытуемых – из должно быть не менее 5 и не более 50 человек.

Критерий Т применяется в тех случаях, когда сдвиги между первым и вторым замерами варьируют в широком диапазоне, например, от –30 до +45. Подсчет критерия предполагает ранжирование абсолютной величины сдвигов (без учета знака), и суммирование рангов. Если сдвиги в положительную и отрицательную сторону происходят случайно, то суммы рангов их абсолютных значений будут примерно одинаковы. Если же интенсивность сдвига в одном из направлений перевешивает, то сумма рангов абсолютных значений сдвигов в противоположную сторону будет значительно ниже, чем это могло бы быть при случайных изменениях.

Здесь также предлагается называть типичными сдвиги в более часто встречающемся направлении, а нетипичным, или редким – сдвиг в более редко встречающемся направлении. Нулевые сдвиги из рассмотрения исключаются, и n уменьшается на их количество.

Рассмотрим пример.

Таблица 2

Инициалы испытуемых

Уровень коммуникативной компетентности

Разность значений (Кпосле - Кдо)

Абсолютное значение разности

Ранговый номер разности

До тренинга (Кдо)

После тренинга (Кпосле)

А.И.

46

48

2

2

4

Б.Г.

60

63

3

3

7

В.А.

62

60

-2

2

4

Г.В.

54

71

17

17

16

Д.А.

48

37

-11

11

14

Ж.К.

82

86

4

4

9,5

З.П.

74

75

1

1

1,5

И.Б.

41

43

2

2

4

К.М.

58

55

-3

3

7

Л.Т.

50

51

1

1

1,5

М.И.

62

67

5

5

11

Н.С.

58

74

16

16

15

О.Ю.

48

39

-9

9

13

П.К.

86

90

4

4

9,5

Р.В.

66

73

7

7

12

С.Н.

68

65

-3

3

7

Сумма

136

Алгоритм подсчета Т - критерия Вилкоксона.

  1. Вынести результаты измерения исследуемого признака в сводную таблицу отдельно в колонки "до" и "после" воздействия.

  2. Вычислить разность между индивидуальными значениями во втором и первом замерах ("до" и "после" ). Определить, что будет считаться типичным сдвигом и сформулировать статистические гипотезы.

  3. Перевести разности в абсолютные числа (без знака) и записать их в отдельный столбец.

  4. Проранжировать абсолютные величины разностей, начисляя меньшему значению меньший ранг.

  5. Найти ранговую сумму.

  6. Отметить ранги, соответствующие сдвигам в "нетипичном" направлении.

  7. Подсчитать сумму этих рангов по формуле: Т = ∑Rr где Rr - ранговые значения сдвигов с более редким знаком.

  8. Определить критические значения Т для данного n по таблице 5 Приложения. Если Тэмп. меньше или равен Ткр , сдвиг в "типичную" сторону по интенсивности достоверно преобладает.

В нашем примере нулевая гипотеза формулируется следующим образом: тренинг по развитию коммуникативных качеств оказался неэффективным (повышения показателей коммуникативной компетентности не обнаружилось). Гипотеза H1 : изменения в желаемую сторону произошли, коммуникативные качества после тренинга у участников повысились.

Отметим те сдвиги, которые являются нетипичными. Повышение показателя выявилось у 11 человек из 12, а понижение – у 5 человек. Таким образом, более редким ("нетипичным") является отрицательный сдвиг.

Сумма рангов этих "редких" сдвигов и составляет эмпирическое значение критерия Т:

Т = ∑Rr где Rr - ранговые значения сдвигов с более редким знаком.

В нашем примере Т эмп. = 4+14+7+13+7 = 45.

По таблице 5 Приложения I определяем критическое значение Т для n = 16. На уровне значимости 0,05 оно составляет 35, а на уровне значимости 0,01 - 23.

Так как типичный сдвиг является достоверно преобладающим по интенсивности, если Тэмп ниже или равен Т 0,05, а полученный в нашем примере Тэмп = 45, что больше Т 0,05 = 35, можем сделать вывод о том, что гипотеза Н0 принимается: различий по интенсивности сдвига в сторону улучшения коммуникативных качеств после тренинговой программы не оказалось. То есть программа не эффективна для развития коммуникативной компетентности.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]