Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Словарь-справочник по психодиагностике.doc
Скачиваний:
3
Добавлен:
12.11.2019
Размер:
2.52 Mб
Скачать

20 Заданий - 0,01; для теста из 30 заданий - 0,007.

Вслед за Дж. Наннелли (1978), П. Клайн (1986) распространяет суждение о возрастании

точности коэффициента надежности при увеличении состава теста и на саму величину

надежности. В самом деле, поскольку истинные показатели теста определяются через

меру представленности заданий генеральной совокупности, должно выполняться пред-

положение о том, что чем больше тест, тем выше корреляция с истинным показателем.

Предельным случаем будет гипотетическая ситуация, когда тест состоит из всех заданий

генеральной совокупности за исключением одного. Для доказательства надежности теста,

задания которого, как заранее известно, принадлежат одной генеральной совокупности,

можно воспользоваться формулой Спирмена- Брауна:

пг,,

где г, - надежность теста, п

количе-

где ст, - стандартная ошибка измерения, Ї,, - стандартное отклонение корреля-

ство заданий, г,. - средняя взаимная корреляция заданий. В формуле Спирмена- Брауна

показатель г/ (см. Надежность частей теста) заменен на ?, что вытекает из вывода

модели коэффициента надежности.

197

НАД -----------------

Предположим, имеются три набора заданий {п = 10, 2Q"30), средняя корреляция между

которыми равна 0,20, тогда:

-для 10 заданий: =

10-0,20

-для 20 заданий: =

- для 30 заданий: =

1+(9-0,20)

20-0,20 1+09-0,20)

30-0.20 1+(29-0,20)

=0,667;

=0,800;

=0,959.

Причем эти показатели получены для заданий, взаимная корреляция которых была низкой.

Для более однородного теста из 30 заданий при /ц- = 40 получаем:

30-0,40 12

1+029-0,40) 13

=0,923.

Таким образом, при наличии набора однородных заданий тест будет заведомо надежным.

Даже если разделить совокупность заданий на две параллельные формы по 15 пунктов,

они обе также будут иметь удовлетворительную надежность.

Теоретические значения коэффициента надежности при данном способе определения

существенно превышают эмпирические значения надежности ретесто-вой и надежности

параллельных форм. Это происходит из-за ряда допущений. Прежде всего следует указать

на то, что при определении Н. п. в. с. не учитываются другие источники погрешности

измерений, связанные с неконтролируемыми факторами среды, состояния и мотивации

испытуемого (см. Надежность}. В этой связи между Н. п. в. с. и ретестовой надежностью

имеется противоречие. Ретес-товая надежность может уменьшаться при увеличении

состава заданий (чем больше заданий, тем выше вероятность случайного или

закономерного изменения ответа при ретесте). Противоречие может быть снято за счет

признания некорректности допущения о равенстве интеркорреляций между заданиями,

зависимости погрешности лишь от представленности в тесте генеральной совокупности

заданий. В противном случае необходимо было бы согласиться с тем, что в двух тестах,

связанных общим фактором и имеющих одинаковое количество заданий, но совершенно

разных по характеру выполнения и трудности, надежность будет одинаковой, что

невозможно.

Следует обратить внимание на невозможность определения таким способом надежности

тестов скорости, так как связь каждого из заданий исследуемой генеральной совокупности

не определена из-за большого количества заданий, интеркорреляции заданий могут терять

смысл (см., напр., Корректурная проба).

Важным аспектом оценки применимости Н. п. в. с. является парадокс, возникающий в этом

случае при сочетании показателей надежности и валидности теста. Кажется, что высокая

внутренняя согласованность должна быть основной целью разработчиков теста (Л.

Кронбах, 1920). Такая точка зрения является довольно распространенной. Однако Р. Кэт-

телл (1977) обоснованно утверждает, что высокая внутренняя согласованность (особенно

при изучении сложных психологических конструктов, личностных показателей) в известном

смысле противостоит высокой валидности.

Возникающее противоречие можно иллюстрировать следующим примером. Тест

вербальных способностей может включать задания (и соответственно, субтесты) на

подбор антонимов, синонимов, понимание слов, словарный запас. Предположим, что

каждый из субтестов имеет высокие показатели Н. п.в.с. Однако если бы мы

воспользовались только одним субтестом (например, подбором антонимов), то показатель

Н. п. в. с. теста несомненно возрос бы по сравнению с полным набором субтестов, так как

используется

только один тип высокосогласованных заданий. Высокая надежность субтеста антонимов

будет отражать тот факт, что эта выборка заданий в высокой степени коррелирует с

гипотетической генеральной совокупностью заданий на антонимы. Однако этот истинный

показатель отражает не вербальные способности, а только способность подбирать

антонимы (т. е.валид-ность теста станет низкой по отношению к измерению вербальных

способностей).

Приведенные данные свидетельствуют о специфичности применения каждого из

имеющихся подходов к характеристике надежности теста. Н. п. в. с. имеет, очевидно, в

основном теоретическое значение. Как и надежность частей теста в предельном случае

разбивания материала на отдельные задания, рассматриваемый способ имеет

практическое значение для оценки точности коэффициента надежности, а также при

характеристике некоторых тестов, состоящих из специально подобранных

факторизованных заданий (см. Факторно-аналитический принцип).

НАДЕЖНОСТЬ РЕТЕСТОВАЯ - характеристика надежности психодиагностической

методики, получаемая путем повторного обследования испытуемых с помощью одного и

того же теста. Надежность в этом случае вычисляется по соответствию результатов

первого и второго обследований или по сохранению ранговых мест испытуемых в выборке

при ретесте. Коэффициент надежности (г) соответствует коэффициенту корреляции между

результатами таких обследований. При использовании интервальных шкал (см. Шкалы

измерительные} применяется коэффициент корреляции произведения моментов Пирсона

(см. Корреляционный анализ). Для шкал порядка в качестве меры устойчивости к

перетестированию может быть использован коэффи-

------------------- НАД

циент ранговой корреляции Спирмена или Кэндалла (см. Корреляция ранговая).

При характеристике Н. р. особое значение имеет временной интервал между первым и

вторым обследованиями. С его увеличением показатели корреляции имеют тенденцию к

снижению, существенно повышается вероятность воздействия посторонних факторов -

могут наступить закономерные возрастные изменения измеряемых тестом свойств,

произойти различные события, влияющие на состояние и особенности развития

исследуемых качеств. По этой причине при определении Н. р. стараются выбирать

непродолжительные временные интервалы (до нескольких месяцев), а при обследовании

детей младшего возраста эти интервалы должны быть еще меньше, поскольку возрастные

изменения и развитие в этом случае происходят еще быстрее.

Несмотря на указанную тенденцию, при получении характеристик теста проводятся

повторные испытания и с длительным временным промежутком. Иногда они

осуществляются в целях оценки валидности прогностической, элементов валидности

конструктной, связанных с дифференциацией по возрастному критерию и др. Определение

же Н. р. главным образом ограничивается анализом краткосрочных случайных изменений,

характеризующих тест как измерительную процедуру, а не его отношение к исследуемой

области поведения.

Наряду с очевидной простотой Н. р. как метод определения надежности обладает

существенными недостатками. Так, при повторном применении одних и тех же заданий,

особенно при относительно непродолжительном временном интервале между

обследованиями, у испытуемых может сформироваться навык работы с данной

психодиагностической методикой, что приводит к улучшению индивидуальных результатов,

хотя и не одинаково вы-

НАД

раженному у разных лиц. Это неизбежно ведет к заметной перестановке ранговых мест

отдельных испытуемых в данной выборке и, соответственно, ухудшению коэффициента

надежности. Еще более заметное воздействие на результаты анализа надежности

оказывает запоминание испытуемыми отдельных решений, воспроизведение в повторном

обследовании предыдущей картины правильных и неправильных решений. В этом случае

результаты двух предъявлений теста не будут независимыми и корреляция между ними

окажется завышенной.

Один из путей устранения влияния тренировки на результаты оценки Н. р. -

формирование устойчивого навыка в работе с соответствующей методикой перед

проведением тест-ретеста. Однако количество повторений теста при этом неизбежно

возрастает, что приводит к увеличению числа запомнившихся решений. Такой прием

может быть рекомендован для методик типа тестов скорости, содержащих большое

количество элементов тестового материала.

Для других методик, очевидно, единственным приемлемым путем снижения влияния

тренировки остается увеличение интервала ретеста, что, однако, как уже говорилось выше,

вступает в противоречие с определением надежности как характеристики теста.

Для большинства тестов общих способностей характерно улучшение показателей Н. р. с

возрастом испытуемых за счет лучшего контроля условий их выполнения. Другим

фактором увеличения расчетных показателей Н. р. является относительное замедление с

возрастом темпа психического развития в области тех характеристик, которые могут стать

объектом измерения или влиять на результат теста. Благодаря этому, спустя время, со-

ставляющее интервал ретеста, случайные колебания результатов обследования ста-

новятся менее выраженными. Это искусственно завышает показатели Н. р. Эта

закономерность требует отдельных измерений Н. р. в разных возрастных контин-гентах

испытуемых, что особенно существенно для методик, предназначенных для обследования

в широком возрастном диапазоне (см. Станфорд-Бине умственного развития шкала,

Векслера интеллекта измерения шкалы.}.

Указанные особенности и недостатки метода определения надежности путем ретеста

делают его пригодным лишь для ограниченного числа методик, допускающих многократное

повторное обследование. К их числу относятся сенсомоторные пробы, тесты скорости и

ряд других методик, отличающихся большим количеством пунктов (см. Миннесотский

многоаспектный личностный опросник).

НАДЕЖНОСТЬ ФАКТОРНО-ДИСПЕРСИОННАЯ - способ определения надежности,

основанный на дисперсионном анализе результатов теста. Надежность теста

соответствует отношению истинной дисперсии (т. е. дисперсии самого исследуемого

фактора) к реально полученной эмпирической дисперсии. Последняя складывается из

истинной дисперсии и дисперсии погрешности измерения (см. Ошибка измерения). Фак-

торно-аналитический подход к определению надежности дополнительно расчленяет и

дисперсию истинного показателя (Дж. Гилфорд,1956).

Дисперсия истинного показателя, в свою очередь, может состоять из дисперсии общего

фактора для групп аналогичных тестов (см. Фактор G), особых факторов. обеспечивающих

тесты специфической направленности (см. Факторы групповые) и дисперсии факторов,

присущих конкретной тестовой методике. Следовательно, полная дисперсия теста равна

сумме дисперсий для общих, специфи-

НАД

ческих и единичных факторов плюс дисперсия погрешности:

о, - а-

О +...G-+0:

где ст7 - дисперсия теста, Од - сг,, - дисперсия общих, групповых и единичных факторов,

ст - дисперсия погрешности. Разделив уравнение на ет2;, получим:

ЇL ст;

t ~ i v t i чго может быть записано в виде:

1 = а2 + Ь\ +

2 2

+ п,. + т,

где а~у - доля дисперсии, выраженная общим фактором а, и т. д.

Таким образом, коэффициент надежности теста равен:

/-,=1 -=+++4

Факторно-дисперсионный способ определения надежности подходит для оценки уже

факторизованного теста (см. Факторно-аналитический принцип), но не для тестов,

измеряющих широкий набор разнообразных параметров.так как некоторые из них могут не

входить в установленную область валидности методики.

НАДЕЖНОСТЬ ЧАСТЕЙ ТЕСТА-

характеристика надежности психодиагностической методики,получаемая путем анализа

устойчивости результатов отдельных совокупностей тестовых задач или единичных

пунктов (заданий) теста.

Наиболее простым и распространенным способом определения Н.ч.т. является метод

расщепления, суть которого заключается в выполнении испытуемым заданий двух

равноценных частей теста. "основанием метода является вывод о м, что при

нормальном или близком к ""рмальному распределении оценок по полному тесту (см.

Нормальное распре-вление) выполнение любого случайного

набора из частей теста даст аналогичное распределение (при условии, что части

однородны по характеру заданий по отношению к тесту в целом).

Для оценки надежности методом расщепления выбирают две эквивалентные по характеру

и степени трудности группы задач (см. Внутренняя согласованность, Трудность заданий

теста). Разделение объема заданий теста на сопоставимые части достигается:

- распределением заданий на четные и нечетные (в том случае, если задания в тесте

строго ранжированы по степени субъективной трудности);

- распределением пунктов по принципу близости или равенства значений индексов

трудности и дискриминативно-сти (см. Дискриминативность заданий теста). Такой принцип

разделения пригоден для тестов достижений, в которых обязателен ответ испытуемых на

все пункты;

- распределением задач по времени решения каждой из частей (для тестов

скорости).

Для испытуемых в выборке определения надежности (раздельно для каждой из частей

теста) вычисляются оценки успешности решений, среднеквадратические отклонения

первого и второго рядов оценок и коэффициенты корреляции сравниваемых рядов.

Естественно, эти коэффициенты будут характеризовать надежность лишь половины теста.

Уравнение Спирмена-Брауна отражает влияние изменения количества заданий на

коэффициент надежности теста:

г, =

пг

1+(л-1)г/

где r - коэффициент надежности для полного объема заданий, г1, - его значение после

изменения числа заданий, п - отношение нового числа заданий к первоначальному (если

число заданий полного

201

НАД ------------------

теста - 100, а его части, полученной методом расщепления на половины, - 50, то п =

0,5). Отсюда для полного теста:

< -

2г;

1+г/

Приведенные формулы справедливы для случаев равных стандартных отклонений обеих

половин теста (ст; = ст)- Если СГ(1 отличается от сг, для определения коэффициента

надежности применяется формула Фланагана:

4ст.,су,,г/

Этот же показатель для малых выборок рассчитывается по формуле Кристофа:

г, =

2 п-3

п-\ п-\

При определении г; целого теста можно воспользоваться формулой Рюлона:

л-1

Ч ~1 ~Г

х где oi - дисперсия разностей между результатами каждого испытуемого по двум

половинам теста, <з\ - дисперсия суммарных результатов. В данном случае коэффициент

надежности рассчитывается как доля <истинной> дисперсии результатов теста (см.

Надежность, Ошибка измерения).

При расщеплении тестов скорости применяется особая процедура группировки заданий.

Определяется минимальное время (t) решения целого теста, затем отсчитываются

ло..ув1!ча и четвертая часть этого времени. Все испытуемые работают половину

минимального времени, после чего ставят отметку против задания, выполняемого в

момент подачи сигнала, и продолжают работать еще четверть минимального времени.

Коэффициент надежности в этом случае будет соответствовать степени корреляции между

числом задач, решенных до первого сигнала (0,5( . ) и решенных за время между первым и

вторым сигналами (0,25<).

Разделение заданий теста на равноценные половины является лишь частным случаем Н.

ч. т. Вполне возможно расщепление на три, четыре и более частей. В предельном случае

число частей равно числу пунктов. При этом для определения надежности применяют

анализ внутренней согласованности.

При разделении всего набора заданий теста на любое количество групп для правильного

определения Н. ч. т., как уже указывалось выше, должно соблюдаться требование

равноценности таких групп. Поэтому при вычислении коэффициента надежности методом

анализа внутренней согласованности отобранные задания теста должны быть в высокой

степени однородны по содержанию и трудности (гомогенны). При гетерогенных задачах

значения г, ниже истинных.

Наиболее распространенным методом оценки надежности отдельных заданий является

вычисление коэффициента Кью-дера-Ричардсона:

f -"

Р<?

Га2

2ст,

aJ-Spg 2о2 ,

где о - дисперсия первичных оценок теста, р - индекс трудности, выраженный

в виде доли - (см. Трудность заданий

i UU

теста), q = 1 - р, г- коэффициент дискриминации (см. Дискриминатив-ность заданий

теста).

В целях упрощения вычисления может быть применена формула Гуликсена:

1-

Это уравнение может быть упрощено следующим образом:

г, =

k-\[

1-

T,pq

При отсутствии коэффициента дискриминации применим вариант формулы Кьюдера-

Ричардсона:

г, =

k f-Spg

k-\[ (Т2 ,

Пример вычислений г< по методу Кьюдера-Ричардсона приведен в табл. 17.

Предложенные выше формулы для определения коэффициента надежности пригодны для

случаев, когда задания оцениваются в дихотомической шкале (см. Шкалы измерительные)

по принципу <выполнено-не выполнено>. Для случаев с более дифференцированной

оценкой применима формула коэффициента альфа:

_п(-)

(п-Н

где Ест. - сумма дисперсий результатов отдельных заданий.

В практике психологической диагностики считается, что тест надежен, если >0,6.

-----------------НАД

Коэффициент надежности обладает доверительным интервалом,определение которого

особенно важно в связи с большим количеством факторов, способных влиять на его

значение. Доверительный интервал для г; определяется как

Er=Z,

где Or - стандартная ошибка коэффициента надежности сг,,

,п-3

-(г)

преобразование Фишера -In +rt-2 l-r,

(определяется по статистическим таблицам). На практике применяется только нижняя

граница /< (Z", при у = 0,05 составляет 1,96, при а =0,01 -2,58).

Характеристика надежности по типу Н. ч. т. имеет серьезные преимущества по сравнению

с надежностью ретестовой и надежностью параллельных форм, главным образом

благодаря отсутствию необходимости в повторном обследовании. Таким образом,

снимается влияние многих посторонних факторов, в частности тренировки, запоминания

решений и т. д. Это обстоятельство определяет широкое распространение методов

характе-

Определение коэффициента надежности методом Кыодера-(п = 50; ст = 8,01; k = 16)

Таблица 17 -Ричардсона

Номе

р

Число лиц,

задач

и

решивших

задачу

Р

q

РЧ

Вычисление

1

48 0,96 0,04 0,04

2

43 0,86 0,14 0,12 =--х 1- =

3

33 0,66 0,34 0,22 k-\ \- ax

4

39 0,78 0,22 0,17

5

28 0,56 0,44 0,25 fi-2551=072

151, 8,01 J

где k - число заданий в тесте.

1 0,02

0,98

0,02

1 0,02

0,98

0,02

- -

-

Lpq = 2,55 -

202

НАР

ристики Н. ч. т. по сравнению с другими типами надежности. К недостаткам метода

относится невозможность проверить устойчивость результатов теста спустя определенное

время. Это требует комбинирования метода Н. ч. т. с другими типами характеристики

надежности психологической методики.

<НАРИСУЙ ИСТОРИЮ> (Draw -a-Story, DAS) - проективная методика исследования

личности. Предложена Р. Силве-ром в 1987 г. Предназначена для раннего обнаружения

депрессии, в частности - скрытой депрессии.

<<Н. и.> основывается на обычных для проективных методик положениях: а) детское

восприятие одних и тех же рисунков различно; б) на восприятие оказывает влияние личный

опыт; в) рисунки могут отражать элементы личности, поддающиеся квантификации.

В методике комбинируются исследовательские процедуры разных проективных техник.

Первоначально обследуемый должен выбрать из 14 картин две и по ним придумать

историю (на предлагаемых картинах в основном содержатся изображения людей и

животных). Затем необходимо сделать рисунок по мотивам ранее воображенной истории.

Наконец, предлагается записать историю. Темы рисунка и истории оцениваются по 7-

балльной шкале (от <выражение негативная> до <выра-женно позитивная>). Негативные

темы содержат указания на <грусть>, <печаль>, <смерть>, <беспомощность>, <будущее

без надежд на лучшее> и т. п. и рассматриваются как знаки депрессии.

<Н. и.> предназначена для группового обследования детей и подростков, начиная с 5-

летнего возраста. Сообщается о высокой надежности методики. Так, надежность

ретестовая (интервал ретес-та - неделя) при обследовании детей с эмоциональными

расстройствами - 0,87.

Данные о валидности ограниченны, тем не менее имеются сведения о том, что темы

депрессивных детей и подростков оцениваются в основном как <выражение негативные>,

чего не наблюдается в других группах. Имеются нормативные данные, полученные при

обследовании 380 детей и подростков, однако они не могут быть признаны

репрезентативными.

Сведений об использовании в СНГ нет.

<НАРИСУЙ ЧЕЛОВЕКА> ТЕСТ (Draw-A-Person Test, DAP} - проективная методика

исследования личности. Разработана К. Маховер в 1948 г. на основе теста Ф. Гудинаф,

предназначенного для определения уровня интеллектуального развития детей и

подростков с помощью выполненного ими рисунка мужчины (см. Гудинаф <Нарисуй

человека> тест}.

<Н. ч.> т. можно использовать для обследования как взрослых, так и детей, допускается

групповое обследование.

Обследуемому предлагают карандашом на чистом листе бумаги нарисовать человека.

После выполнения рисунка ему дают задание нарисовать человека противоположного

пола. Заключительный этап обследования - опрос. К. Маховер составлены специальные

перечни вопросов о нарисованных фигурах. Эти вопросы касаются возраста,

образования,семейного положения, привычек и т. д.

При интерпретации полученных данных автор исходит из идеи о том, что рисунок является

выражением <Я> обследуемого. Значительное внимание уделяется анализу

разнообразных деталей рисунка, прежде всего особенностям изображения основных

частей тела, которые зачастую оценивают в соответствии с психоаналитической

символикой.Изучение валидности <Н. ч.> т. западными психологами привело к

противоречивым результатам в силу умозрительности предлагаемых автором

интерпретаций. Имеются данные о

НАР

том. что общие субъективные оценки более валидны и надежны, нежели оценки по

отдельным деталям рисунка.

В СССР <Н. ч.> т. первоначально применялся в клинико-психологических исследованиях.

Анализировались преимущественно формальные аспекты рисунков, напр. размер фигуры,

ее расположение на листе бумаги, степень законченности рисунка и т. п. (Ю. С. Савенко,