IV Загальне уявлення та шляхи підвищення надійності тестів
Надійністю тестів називають ступінь співпадання результатів при повторному тестуванні одних і тих же осіб в однакових умовах. Це означає, що повторне тестування теоретично має давати ідентичні результати при:
• багаторазовому тестуванні одним і тим же вчителем (тренером) од них і тих же учнів;
• проведенні тестування різними вчителями в одній і тій же групі. Проте у практиці такого співпадання результатів не буває. Учень, який виконав стрибок у довжину з місця три рази з інтервалом у 2 хв, покаже три різних результати. Подібну варіацію називають внутрішньоіндивідуальною, або внутрішньокласовою, її спричиняють такі обставини:
Випадкові зміни стану школярів під час тестування (зміни мотивації до виконання тесту, зміни концентрації уваги – відсутність налаштування перед виконанням, психічний стрес, утома, попереднє навчання).
Неконтрольовані зміни зовнішніх умов (вітер, температура, вологість, сонячна радіація, присутність сторонніх осіб).
Нестабільність метрологічних характеристик технічних засобів вимірювання, що використовуються при тестуванні (механічні неполадки приладу, зміна напруги в електромережі, нестабільність характеристик електронних елементів вимірювальних приладів та датчиків при зміні температури і вологості, наявність електромагнітних перешкод).
Зміна стану тестуючої особи (вчителя, тренера), а також заміна одного вчителя іншим.
Непридатність даного тесту для оцінки конкретної рухової здібності, обумовленої низьким значенням змістовної (логічної ) інформативності даного тесту.
Ступінь надійності (інколи говорять про відтворюваність) тесту перевіряється у тих випадках, коли результати тестування можна виразити у певних одиницях вимірювання. Можливі два способи встановлення надійності тестів (Ашмарин, 1986).
Перший спосіб полягає в порівнянні середніх помилок середніх арифметичних величин, отриманих декількома вчителями для однієї групи (класу) учнів або одним вчителем — для декількох аналогічних груп (наприклад, паралельних класів) учнів. Якщо коливання двох або більше середніх арифметичних величин мають зони співпадання, то ступінь надійності тесту вважається достатнім. Наприклад, якщо середні арифметичні величини і середні їх помилки становлять в одній групі 23±2, а у іншій 25±4 (показники сили згиначів кисті в 11 -річних хлопців), то можна вважати, що цей тест достатньо надійний.
Другий спосіб передбачає оцінку надійності тесту здійснювати за допомогою коефіцієнтів кореляції. Розраховується коефіцієнт надійності (гп) за допомогою так званого внутрішньокласового коефіцієнта кореляції між двома рядами результатів, отриманих під час першого і другого тестування групи школярів:
Надійність вважається:
відмінною, якщо коефіцієнт надійності більший або дорівнює 0,95;
доброю, коли гп знаходиться у межах 0,90 - 0,94;
припустимою при гп = 0,80 - 0,89;
поганою, коли гп = 0,70 - 0,79;
при гп = 0,60 - 0,69 використання тесту для індивідуальних оцінок сумнівне, він придатний лише для характеристики рухових здібностей групи школярів.
Надійність тестів можна підвищити. Для цього існують такі шляхи:
Стандартизація вимірювальних процедур при виконанні тестів. Розминка, що передує виконанню тесту, послідовність виконання тесту, особливості відпочинку потребують суворої регламентації.
Виконання оптимальної кількості спроб. В експериментальному дослідженні для деяких тестів визначено оптимальну кількість спроб, необхідну для досягнення кращого результату, а також визначено їх на дійність (Сергієнко, Крик, 1986).
Стабільність тестів
Різновидом надійності е стабільність тесту. Під стабільністю тесту розуміють ступінь співпадання результатів тестування, що проведені в різний час. Повторне тестування звичайно називають ретестом.
Стабільність тесту залежить від виду тесту, — статевого і вікового контингенту школярів, часового інтервалу між проведенням тесту і ре-тесту (Заціорський, 1 982).
Розглядаючи морфофункціональні особливості та рухові здібності школярів, відзначимо, що морфологічні характеристики (наприклад, довжина тіла, обхват плеча, гомілки тощо) при вимірюванні протягом незначних часових інтервалів досить стабільні. Меншу стабільність мають тести, що визначають силові здібності школярів.
У дорослих результати тестування більш стабільні, ніж у дітей. У спортсменів також спостерігається більша стабільність між повторними тестуваннями, ніж у неспортсменів.
Зі збільшенням часу проведення тесту і ретесту стабільність тесту знижується.
Узгодженість тестів
Узгодженість тесту — це надійність оцінки результатів тестування незалежно від особистих якостей різних людей, які його проводять. При співпаданні результатів тестування, отриманих у групі одних і тих же школярів різними вчителями (тренерами), говорять про високий ступінь узгодженості тесту, відсутність якої може залежати від суб'єктивних факторів осіб, які проводять тестування, а саме:
- різних психофізіологічних особливостей тестуючого;
- неоднакової вимогливості при тестуванні до школярів; деякі вчителі успішно застосовують моральні способи заохочення, викликають інтерес, краще мотивують рухову діяльність школярів.
Еквівалентність тестів
Певну рухову здібність (наприклад, швидкісно-силову) можна виміряти за допомогою декількох тестів. Наприклад, оцінити розвиток такої здібності можна за результатами стрибків у довжину з місця, угору з місця, потрійного з місця тощо. У випадках, коли використовуються декілька досить схожих тестів, говорять про їх еквівалентність. Тобто еквівалентні тести є майже рівноцінними в практиці тестування певної рухової здібності.
Практично ситуація складається таким чином. Якщо школяр у стрибках у довжину з місця показав себе кращим у класі, а також був першим у стрибках угору з місця, то це свідчить про еквівалентність тестів.
Кількісно еквівалентність тестів визначається за коефіцієнтом кореляції, котрий називають коефіцієнтом еквівалентності.
Використання еквівалентних тестів підвищує надійність оцінки розвитку рухових здібностей школярів. Якщо всі тести, що входять у запропонований комплекс тестів, високоеквівалентні, то він називається гомогеннім. І навпаки, якщо тести вимірюють різні сторони моторики людини, тобто комплекс складається з нееквівалентних тестів, його називають гетерогенним.
Приклад гетерогенної батареї тестів: біг на 100 м, згинання-розгинання рук в упорі лежачи, викрут рук назад із гімнастичною палицею (визначення рухливості у плечових суглобах), біг на 2000 м.