18. Ошибка измерения.

ОШИБКА ИЗМЕРЕНИЯ (Se) и надежность измерения (R), согласно общепринятой психометрической теории, связаны следующей формулой: где Sx — дисперсия тестовых показателей X. Формула (1) является чисто теоретической, и на ее основе нельзя подсчитать надежность теста, так как величина Se оказывается также неизвестной величиной. Поэтому на практике применяют корреляционные методы. Самый известный из них — метод перетестирования (тест-ретест) или метод измерения «РЕТЕСТОВОЙ НАДЕЖНОСТИ». На одной и той же выборке испытуемых (не менее 30 человек, участвующих в пилотажном психометрическом экспериментальном исследовании) проводят первое тестирование X, а затем повторное тестирование Y. Интервал, как правило, — две недели, что гарантирует забывание вопросов теста. Затем для двух рядов значений Х и Y подсчитывается, например, линейный коэффициент корреляции (возможный и нередко более корректный вариант — подсчитывать ранговый коэффициент корреляции): — стандартные отклонения Х и Y, Cov (X,Y)— ковариация двух переменных Х и Y. В этой книге мы не ставим целью научить студентов-педагогов корреляционным методам и пытаемся изложить лишь принципиальную суть дела. Интересующиеся найдут все необходимые формулы и вычислительные примеры в любом учебнике по статистике, а также в специализированных изданиях по психодиагностике и психометрике («Общая психодиагностика», 1987; Клайн, 1994). Что важно для сути теории надежности тестов, так это возможность определить ошибку измерения после того, как подсчитана корреляция «тест-ретест» по формуле (3), полученной путем простого преобразования формулы (I): Ищете любимца? Простые и редкие породы котят ждут Своих хозяев - здесь! avito.ru от 50 руб. Новейшие технологии Телефоны опережающие прогресс! slando.ru от 2 000 руб. Доставка в подарок Надежный металлический смартфон от Mercedes! mercedesmob.info 6 190 руб. Таким образом, если стандартное отклонение в тесте составило 10 очков (среднее отклонение, которое в среднем допускают испытуемые от среднего балла для выборки), а корреляция «тест-ретест» оказалась равной лишь 0,5, то ошибка измерения оказывается очень большой: То есть оказывается, что ошибка измерения перекрывает большую часть разброса тестовых показателей, так как истинный балл по тесту может отклоняться от измеренного балла на целых 7 очков! И если испытуемый набрал на 6 очков больше, чем «средний» испытуемый, мы не можем с достаточной уверенностью (статистической достоверностью) говорить о том, что он значимо превзошел среднего испытуемого, так как это отклонение оказывается в пределах стандартной ошибки измерения. Таким образом, низкая корреляция результатов теста между первым и повторным тестированием говорит о том, что случайные факторы существенно искажают результаты теста. Это значит, что тест не обладает необходимой помехоустойчивостью, и его нельзя использовать как измерительный инструмент. 19. Валидность. Виды валидности.

Основные понятия.

Валидность или обоснованность всякой процедуры измерения состоит в однозначности (устойчивости) получаемых результатов относительно измеряемых свойств объектов, т. е. относительно предмета измерения.

В психофизике физические стимулы достаточно однозначно детерминируют измеряемые свойства ощущений, в психодиагностике связь может быть сложнее.

Надежность необходимое, но не достаточное условие валидности.

Валидность≤надежность.

Повышение надежности не обязательно повышает валидность. Если тест измеряет область поведения, которая складывается из различных феноменов, то содержательная валидность теста автоматически требует представленности в нем моделей всех этих феноменов.

Содержательная валидность — взяв глобальное понятие «речевая способность», необходимо рассматривать такие независимые

навыки, как навыки письма и чтения. Заботясь о содержательной валидности, в тест нужно вводить задания на проверку обоих этих качеств. Вводя разнородные пункты и субъекты, сокращают внутреннюю согласованность, одномоментную надежность, но повышают валидность. Психодиагност должен избегать излишней согласованности. Содержательная валидность устанавливается за счет экспертов.

Эмпирическая валидность измеряется с помощью статистического коррелирования: подсчитывается корреляция двух рядов значений — баллов по тесту и показателей по внешнему параметру, избранному в качестве критерия. Такими показателями могут быть «успеваемость», «производительность труда», «текучесть кадров», «совместимость», «срабатываемость коллектива», «преступность».

Пытающийся скоррелировать результаты теста с этими показателями психолог решает сразу две задачи: задачу измерения валидности и задачу измерения практической эффективности своей психодиагностической программы. Если получается значимый коэффициент корреляции, то решены сразу две эти задачи. Если корреляция не обнаружена, то остается неопределенность: либо невалидна сама процедура, либо неверна гипотеза о причинно-следственной связи.

На практике от психодиагноста ждут вмешательства — отбор кадров, обучение, консультирование и т. п. Повышение показателей доказывает эффективность самого вмешательства. Неопределенность делает невозможным отделить неэффективность вмешательства от низкой валидности диагностики.

Процедура эмпирической валидизации.

Если критерий — событие в прошлом, то применяется метод контрастных групп. Коррелирование с суммарным баллом по тесту оценивается с помощью бисериального коэффициента.

Где ∑x* — сумма финальных баллов тех индивидов, которые дали утвердительный ответ на i-тый пункт теста (решили i-тую задачку);

S_x — стандартное отклонение для суммарных баллов всех индивидов из выборки;

— стандартное отклонение по i-тому пункту;

x̄ — средний балл по всем пунктам.

Если критерий Y будущее событие, то выборка должна быть составлена с запасом (проспективная валидизация). Проспективная валидизация выявляет прогностическую эффективность диагностической процедуры.

Конструктивная валидность.

Новый тест сравнивают со старым, апробированным тестом с известной валидностью. В этом случае психодиагност может сформулировать ряд предсказательных гипотез о том, как будет новый тест коррелировать с другими тестами, измеряющими родственные характеристики испытуемых. Подтверждение гипотез указывает на валидность выдвигаемого конструкта, т. е. на конструктную валидность.

Конвергентная и дискриминантная валидность.

Соответствие пунктов теста измеряемому фактору обеспечивает конвергентную валидность.

Сбалансированность пунктов теста относительно иррелевантных факторов обеспечивает дискриминантную валидность.

Валидность целого теста зависит от валидности входящих в него пунктов. Максимальная валидность достигается за счет отбора таких пунктов из пилотажной батареи, которые, обладая значимой корреляцией с критерием, минимально коррелируют между собой. Отбор пунктов именно по критерию валидности обеспечивает максимальную прагматическую эффективность теста. Такой отбор можно произвести, рассчитывая бисериальную корреляцию критерия с каждым пунктом из пилотажной батареи.

<<< < Предыдущая 1 2 3 45 / 125 6 7 8 9 10 11 12 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
19.04.2015276.48 Кб10происхождение биомембран.doc
#
19.04.201532.5 Кб6прокурорский надзор 2 семинар.docx
#
23.03.2016174.08 Кб41Проф этика.doc
#
04.08.2019165.89 Кб6Психиатрия и наркология.doc
#
21.04.20191.24 Mб20Психиатрия общее.doc
#
25.09.2019247.3 Кб10Психодиагностика ответы.doc
#
19.12.2018528.94 Кб12психодиагностика.docx
#
04.05.20191.77 Mб26Психология игры Эльконин .doc
#
02.05.2019143.87 Кб7Психология семьи - Федорова Н.И..doc
#
03.09.2019678.4 Кб5психология управления.doc
#
16.11.2019306.18 Кб48Психолого-медико-педагогический консилиум в си...doc