Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
_Прыгин Г.С., Основы психодиагностики.doc
Скачиваний:
86
Добавлен:
23.08.2019
Размер:
1.57 Mб
Скачать

Тема 3: "Основы конструирования психодиагностических методик".

§ 1. Статистическая природа тестовых шкал.

Любые первичные результаты, полученные с помощью какого-либо психологического теста, остаются бессмысленными, если отсутствует дополнительная информация, позволяющая их интерпретировать. Чаще всего результаты психологического теста можно проинтерпретировать, сопоставляя их с нормами выполнения этого теста группой лиц, которую принято называть выборкой стандартизации. Следовательно, в психодиагностике нормы устанавливаются опытным путем, исходя из того, как выполняет задания теста некоторая (репрезентативная) группа испытуемых. Зная распределение показателей в такой репрезентативной группе, можно выяснить место каждого индивидуального показателя (т.е. определить, отвечает ли он среднему значению, выше или ниже его).

Для того чтобы более точно определить место испытуемого относительно выборки стандартизации, полученный результат необходимо перевести в некую относительную меру – найти производный показатель. Таким образом, производные показатели выполняют две функции [1]:

- позволяют определить положение каждого обследуемого относительно выборки стандартизации и таким образом оценить его выполнение теста на фоне других испытуемых;

- позволяют сравнивать между собой результаты, полученные по разным тестам (или по разным шкалам теста).

Примером простейшего производного показателя является обычный процентный показатель, однако в психодиагностике он не нашел применения, так как сам по себе процент правильно выполненных испытуемым заданий теста нельзя интерпретировать без другой дополнительной информации, например, без учета трудности заданий теста.

Производные показатели могут выражаться в одних и тех же единицах и относиться к одним и тем же или похожим нормативным выборкам для различных тестов. Поэтому, оказывается возможным сравнение индивидуальных относительных данных по многим различным психическим функциям.

Производные показатели можно получить разными путями (в соответствие с их функциями):

- определение достигнутого уровня развития;

- установление относительного положения индивида в некоторой группе.

Существующие типы производных показателей, будут рассмотрены ниже. Прежде необходимо дать дефиниции некоторым понятиями (в том числе и статистическим), лежащими в основе разработки и использования тестовых норм.

По определению, данному в словаре [3], тест – в психологии - фиксированное во времени испытание, предназначенное для установления количественных (и качественных) индивидуально-психологических различий.

Наиболее типичное понятие теста в психодиагностике можно представить так [15]: тест - это последовательность кратких заданий (или пунктов), которая после выполнения их испытуемым, подвергается однозначной количественной интерпретации.

Исходы (ответы) испытуемых зависят от вида теста. Например, в интеллектуальных тестах, состоящих из отдельных задач, ответы могут интерпретироваться так: "правильное решение", "ошибочное решение", "отсутствие ответа" (пропуск задачи из-за недостатка времени). Примеры интерпретации в личностных опросников, состоящих из высказываний, предлагаемых для подтверждения испытуемым: "подтверждение" (ответ "верно"), "отвержение" (ответы "не согласен", "неверно").

Суммарный балл по тесту подсчитывается с помощью ключа: ключ устанавливает числовое значение исхода по каждому пункту. Например, за правильное решение задания - "+1", за неправильное или пропуск - "0". Тогда балл буквально выражает количество правильных ответов.

Известно [1, 15], что исход по отдельному заданию подвержен воздействию не только со стороны измеряемого фактора - способности или черты испытуемого, но и побочных шумовых факторов, которые являются иррелевантными по отношению к задаче измерения.

Примеры случайных факторов: колебания, вызванные неожиданными отвлекающими событиями (шум на улице, стук в дверь и т.п.), трудности в понимании смысла задания (вопроса), вызванные особенностями опыта данного конкретного испытуемого, и т.п.

Последовательность ответов оказывается последовательностью событий, содержащей постоянный и случайный компоненты, причем случайные компоненты могут оказывать как положительное, так и отрицательное влияние на результаты выполнения теста. Как известно, основным приемом, позволяющим устранить искажающее влияние случайных факторов на результат (суммарный балл), является балансирование этого влияния с помощью повторения. При этом фактически предполагается, что повторение обеспечивает рандомизацию (случайное варьирование) неконтролируемого фактора, в результате чего при суммировании исходов положительные и негативные эффекты случайных факторов взаимопоглощаются [15].

В оптимальном тесте набор заданий организуется таким образом, чтобы повысить долю постоянного компонента и сократить долю случайного в величине суммарного балла. Необходимо признать однако, что несмотря на различные статистические ухищрения, суммарный балл в психологических измерениях содержит несравненно большую долю случайного компонента, чем в обычных физических измерениях. Поэтому, суммарный балл, набранный испытуемым по тесту, можно определить лишь в известных пределах, заданных ошибкой измерения.

Прежде, чем перейти к анализу типов кривых распределений суммарных баллов вспомним, что понимается в психологии под измерением и какие типы измерительных шкал существуют.

В психологии различают три основные процедуры измерения. Основанием для различения является объект измерения. Различают [7, 9]: "измерение испытуемых" (например, особенности их поведения); "измерение, как задача для испытуемого" (например, задача испытуемого состоит в ранжировании или классификации внешних объектов); процедура совместного измерения "стимулов и людей" (например, поведение субъекта можно рассмотреть как проявление взаимодействия личности и ситуации). В узком смысле слова психологическим измерением является только "измерение испытуемых".

С точки зрения математики, измерением называется операция установления взаимно однозначного соответствия множества объектов и символов (чисел); причем символы (числа) приписываются объектам по определенным правилам.

Правила, на основании которых происходит приписывание чисел объектам, определяют шкалу измерения. Различают множество различных видов шкал, однако наибольшее распространение в психологии получили следующие [1, 5, 15]: "шкала наименований", "шкала порядка", "шкала интервалов" и "шкала отношений". Основные их характеристики можно представить в виде таблицы 1.

Таблица 1. Измерительные шкалы.

Тип шкалы

Измерительная операция

Описательные статистические величины

Примеры

Наименования

Приписывание одинаковых чисел - наименований объектам, имеющим общий признак.

Число объектов в классе (категории).

Приписывание числового кода лицам с определенными социально- демографическими характеристиками.

Порядка

Ранжирование объектов по выраженности определенного признака.

Медиана, процентили.

Ранжирование специалистов по степени профессиональной пригодности.

Интервалов

Определение величины различий между объектами.

Среднее арифметическое, стандартное квадратичное отклонение, коэффициент корреляции.

Шкала температуры Цельсия.

Отношений

Определение равенства отношений величин.

Коэффициент вариации.

Измерение длины, массы и т.д.

Основная цель применения статистики - представить количественные данные в систематизированной и сжатой форме для того, чтобы облегчить их понимание.

Чтобы навести порядок в хаосе цифр, полученных в результате тестирования какой-то группы (например, в 1000 человек) нужно, прежде всего, составить таблицу частотного распределения (этих тестовых баллов). Для этого показатели распределяются по заранее выбранным интервалам (классам) значений. После того, как тестовые показатели распределены по интервалам, подсчитывается их количество в каждом из них. Полученное таким способом число и есть частота (количество случаев) для соответствующего интервала.

Как известно [1, 7, 9, 15], любое частотное распределение суммарных баллов можно представить графически в виде кривых распределений: гистограммы, полигона частот и кумуляты.

На гистограмме по оси абсцисс откладываются "границы классов", на которые разбиваются первичные показатели суммарных баллов, а высота столбцов (ось ординат), вычерченных над каждым интервалом, соответствует числу испытуемых, чьи результаты попали в этот интервал. (Их количество определяет высоту столбца в относительной частоте встречаемости показателя или в процентах). В полигоне частот число испытуемых указывается точкой, расположенной над серединой интервала на высоте, соответствующей его частоте, а сами точки последовательно соединяются прямолинейными отрезками.

Если на оси абсцисс нанести срединные значения классов, а по оси ординат - накопленные частоты классов, то получится график называемый кумулятой [11].

Идеальная нормальная кривая это такая кривая, которая обладает важными математическими свойствами, на ней основаны многие виды статистического анализа. По существу эта кривая означает, что число случаев максимально в середине распределения и постепенно спадает к ее краям. Кривая симметрична и имеет единственный пик в центре. Причем, чем больше группа, тем ближе распределение к теоретической нормальной кривой.

Как отмечает А. Анастази [1], группа тестовых показателей может быть описана в терминах той или иной меры центральной тенденции. Такая мера показывает наиболее типичный (или репрезентативный) результат, характеризующий выполнение теста всей группой. Самой известной из таких мер является среднее (среднеарифметическое) значение (Х). Другой мерой центральной тенденции является мода (Мо) или наиболее часто встречающийся результат. В частотном распределении мода определяется как середина интервала, для которого частота максимальна.

Третья мера центральной тенденции - это медиана (Ме), т.е. результат, находящийся в середине последовательности показателей, если их расположить в порядке возрастания или убывания. Медиана есть точка, делящая распределение ровно пополам, причем одна половина результатов лежит справа от нее, а другая слева.

Для наиболее полного описания результатов теста используются меры разброса данных, показывающие степень отклонений индивидуальных показателей от центральной тенденции. Наиболее наглядным и известным способом представления разброса является размах распределения, т. е. разность между самым высоким и самым низким результатом. Но эта мера крайне точна и неустойчива, поскольку она определяется только двумя показателями. Единственный необычно высокий или низкий результат может заметно повлиять на величину размаха. Более точный метод измерения разброса основан на учете разности между каждым индивидуальным результатом и средним значением по группе.

Такой мерой разброса является стандартное отклонение, обозначаемое буквой "σ" (при ее вычислении отрицательные знаки устраняются благодаря возведению каждого отклонения в квадрат), которая вычисляется исходя из дисперсии (σ2) или среднего квадрата отклонения.

Если дисперсия очень удобна при выяснении влияния различных факторов на индивидуальное выполнение тестовых заданий, то стандартное отклонение широко применяется как мера сравнения разбросов результатов измерений в различных группах.

Контрольные вопросы для самопроверки: §1. Статистическая природа тестовых шкал.

1. Что понимается под термином "тест" в психодиагностике?

2. Для чего применяется повторное тестирование?

3. Что понимается под термином "измерение" в психодиагностике?

4. Какие типы шкал используются в психометрике?

5. Дайте определение, что в психометрике понимается под "гистограммой", "полигоном частот" и "кумулятой"?

Литература к теме.

1. Анастази А. Психологическое тестирование. В 2-х кн. М., 1982.

2. Бурлачук Л.Ф., Морозов С.М. Словарь-справочник по психодиагностике. - СПб.: Изд-во "Питер", 1999. - 528 с.

3. Общая психодиагностика / Под ред. А. А. Бодалева, В. В. Столина.- М., 1987.

4. Основы психодиагностики / Под ред. А. Г. Шмелева. Ростов-на-Дону., 1996.