Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Спортивна метрология

.pdf
Скачиваний:
616
Добавлен:
10.02.2015
Размер:
7.35 Mб
Скачать

Ниже приводится пример метрологически корректного описания теста «Отжимание на гимнастических брусьях».

1.Цель применения теста: определение силовой выносливости рук и пле чевого пояса.

2.Возраст спортсменов: 16—18 лет.

3.Пол: упражнение выполняют только юноши.

4.Оборудование и материалы: параллельные брусья; их высота относи тельно пола такова, чтобы испытуемый любого роста, выполняя упражнения, не касался пола ногами.

5.Порядок выполнения теста: исходное положение — упор на прямых ру ках. Сгибая руки в локтях, опуститься вниз до полного сгибания. Затем выпрямить руки, приняв исходное положение. При выполнении упражнения тело держать в вертикальном положении, раскачивание не допускается. Выполнить максимальное количество повторений («до отказа»).

6.Надежность теста: rtt*=0,90, если повторное измерение проводилось на следующий день. Если же обе попытки выполнялись подряд, то надежность низка: rtt=0,56.

7.Согласованность оценок результатов в тесте: 0,99.

8.Информативность теста: по результа

там логической экспертизы признана высокой. 9. Оценка результатов: баллы начисляют ся в зависимости от количества повторений

теста по следующей шкале (см. табл.). 10. Дополнительные указания:

а) подсчет повторений теста заканчива ется, когда испытуемый останавливается;

б) специалист, . проводящий измерения, должен следить за действиями испытуемого и вносить коррективы, если последний иска жает порядок выполнения теста;

в) можно поддерживать испытуемого ру кой, если он начинает раскачиваться.

3.4. НАДЕЖНОСТЬ ТЕСТОВ

3.4.1. Основные понятия теории надежности

Надежностью теста называется степень совпадения результатов при повторном тестировании одних и тех же людей в одина-

ковых условиях. Как уже отмечалось, полное совпадение результатов при повторных измерениях практически невозможно, и поэтому основное уравнение измерений выглядит так:

где xt — зарегистрированный в процессе измерений результат теста; xист — так называемый истинный результат. Условно он соответствует среднему значению измеряемой величины при беско-

* rtt—коэффициент надежности, о котором более подробно будет рассказано в разделе 3.4.

21

нечно большом числе измерений одного показателя в одних и тех же условиях. Видно, что xист — абстрактная величина и измерить ее в действительности невозможно. В идеальных условиях значе ние xист должно соответствовать реально существующей величине искомого показателя. Но такого соответствия никогда не бывает и вот почему. Рассмотрим следующий пример. Из определения теста следует, что его надежность — это, по сути дела, надеж ность оценки состояния спортсмена, его способностей. Чем ближе значения xt и xист , тем надежнее оценка. Из формулы (1) видно,

что степень близости xt и xист зависит от величин е1 2 и е3. Что они представляют собой?

Величина e1—это систематические и случайные ошибки измерений, причины появления которых рассмотрены в разделе 2.3.2. Величина е2 отражает различия в процедуре тестирования при повторных измерениях. И наконец, величина е3 характеризует внутреннюю нестабильность функциональных систем организма.

Подтвердим сказанное следующим примером. При измерении времени простой реакции спортсмена на световой раздражитель были получены следующие результаты: первая попытка — 0,225 с; вторая — 0,296 с; третья — 0,203 с. Точность работы измерительных устройств (±2%) позволяет сравнительно легко вычислить значение e1 и учесть его при анализе результатов.

Предположим, что во второй попытке яркость светового раздражителя была вдвое меньшей, чем в первой и третьей. Если провести исследование о зависимости яркости светового сигнала и времени реакции, то можно определить, как изменение процедуры тестирования изменяет результат теста. Полученная в результате такого исследования величина и будет характеризовать составляющую е2.

Отметим сразу, что процедура тестирования во всех случаях должна быть стандартной, но в реальной практике это не всегда достижимо. К сожалению, меняются внешние условия тестирования, его могут проводить разные специалисты и т. д., и все это будет сказываться на результате.

Предположим теперь, что при измерении времени реакции использовали высокоточную аппаратуру, погрешности работы которой не превышают сотых долей процента. Тестирование проводилось в идеально стандартных условиях. В этом случае результаты повторных измерений также будут различаться: мера их вариативности численно будет равна составляющей е3. Причина же различий в значениях времени повторного реагирования будет теперь заключаться в нестабильности работы зрительного и нервномышечного аппаратов спортсмена. Эта нестабильность и будет определять надежность измерений.

С учетом всего сказанного можно сформулировать следующее положение: в практике необходимо использовать тесты, результаты xt которых есть сумма xист + e3 (составляющие е1 и е2 предполагаются пренебрежимо малыми). Проиллюстрируем его следующим примером. На чемпионате СССР в индивидуальной

22

гонке преследования на 4 км измерение результатов проводится с высокой точностью (составляющая е1 пренебрежимо мала и одинакова во всех заездах). Условия заездов одинаковы (поэтому составляющая е2 одинакова во всех измерениях).

Если взять два равных по времени заезда одного и того же спортсмена, то различия в скорости на разных участках дистанции будут определяться исключительно состоянием и действиями самого спортсмена. Такие данные приведены на рис. 3. Видны высокая стабильность скорости чемпиона СССР Екимова и относи-

тельная

вариативность этого

же

 

показателя у второго призера —

 

Шкундова.

 

 

 

 

 

 

 

 

С течением времени (например,

 

на разных этапах годичного цикла)

 

вариативность

показателей

мо-

 

жет меняться. На рис. 4 показано,

 

что в соревновательном

периоде

 

(по сравнению с подготовительным)

 

время

достижения

максимальной

 

скорости стало более стабильным.

 

Если его использовать как тест,

 

то он в этот момент характеризуется

 

большей надежностью.

 

 

 

В спортивной практике мы од-

 

новременно сталкиваемся как ми-

 

нимум

с

тремя

разновидностями

 

вариативности.

1)

внутриклассовая

 

Вариант

А:

 

(внутрииндивидуальная) — вариа-

 

тивность

индивидуальных

резуль-

 

татов в серии повторных измере-

 

ний; 2) межклассовая (межиндиви-

 

дуальная) — вариативность ре-

 

зультатов разных спортсменов.

 

 

Вариант

Б:

1)

внутриклассовая

 

(как в варианте А); 2) межклассовая

 

— вариативность серий инди-

 

видуальных данных, зарегистриро-

 

ванных на разных этапах трениро-

 

вочного цикла.

 

1)

 

 

Рис. 3. Вариативность прохожде-

Вариант

В:

 

внутриклассо- ния дистанции в

индивидуальной

вая— различия между спортсменами вгонке преследования на чемпиона-

измерениях,

проведенных

в

те СССР 1986 года: а — два заезда

одинчемпиона СССР Екимова; б — два

день;

2)

 

межклассовая—различиязаезда второго

призера —

между сериями измерений спортсмена, Шкундова

 

проведенных

на

разных

этапах

 

тренировочного цикла *.

 

 

 

* Отметим, что здесь одними терминами (например, внутриклассовая) обозначены разные признаки. Для устранения путаницы необходимо в каждом случае специально оговаривать, что и каким термином обозначается.

23

Рис, 4. Динамика стартового разгона в пяти забегах на 100 м спортсмена К.:

а —различия по времени достижения Vmax; б—различия по уровню Vmax

От соотношения внутриклассовой и межклассовой вариативности зависит надежность тестов. Пример, подтверждающий это, представлен в следующем разделе.

Вернемся вновь к основному уравнению измерения, представив его в следующем виде:

xt=xист+e

(2)

(В этом уравнении опущены методические погрешности измерений.)

Если показатели вариативности в повторных измерениях случайны (их сумма равна нулю и в разных попытках они не зависят друг от друга), то тогда из математической статистики следует:

σt 2ист2+ σе2 ,

(3)

2

2

где σt2 — дисперсия результатов измерений; σист2 — межклассовая

вариация (она рассматривается как свободная от ошибок); σе2 — внутриклассовая вариативность.

Коэффициент надежности (rt t )—это отношение ис-

24

тинной дисперсии к дисперсии, зарегистрированной в процессе измерений:

(4)

На практике можно использовать индекс надежности. Он

и рассматривается как тео-

рассчитывается по формуле

ретический кеэффициент корреляции измеренных результатов теста- с истинными.

Еще один критерий — стандартная ошибка надежно-

сти. Она рассчитывается по ризует среднее квадратическое отклонение измеренных результатов теста от линии регрессии. В свою очередь эта линия отражает меру теоретической зависимости между измеренными и истинными результатами. На рис. 5 представлен пример использования стандартной ошибки надежности, по которой можно узнать, каково среднее стандартное

отклонение

результатов

от-

Рис. 5. Определение стандартной ошиб-

дельных спортсменов

от

их

собственных

средних

величин.

ки надежности

Например, если стандартная ошибка надежности равна ±3 см, это значит, что в 68% случаев индивидуальные результаты повторных измерений отклоняются на ±3 см от того среднего результата, который каждый из них показал.

3.4.2.Определение надежности в практической работе

Взначительном большинстве случаев комплексный контроль проводится с помощью тестов, надежность которых была заранее определена специалистами в области, спортивной метрологии. Однако имеющиеся в справочниках значения надежности тестов не всегда могут быть обобщены для всех случаев тренерской работы, так как были получены в определенных условиях у конкретной группы людей. Так, например, надежность такого сравнительно простого теста, как бег на 30 м, различна у квалифицированных спринтеров, баскетболистов, гимнастов, школьников-физкультур- ников и т. д.

Кроме того, у тренера иногда возникает идея проверить подготовленность спортсменов с помощью созданного им самим теста или теста, в который внесены какие-либо изменения. Такие приме-

25

ры довольно часты в спортивных единоборствах и играх, где система комплексного контроля еще окончательно не сложилась. В этом случае также необходима проверка надежности тестов.

Самый простой способ проверки — визуальное сравнение значений первой и второй попыток в тесте для каждого спортсмена. В среднем в группе обычно тренируются не более 20 спортсменов, и после тестирования такое сравнение результатов не занимает много времени. Если результаты повторных измерений совпадают, значит, использованный тест характеризуется высокой надежностью.

Однако такие ситуации встречаются сравнительно редко; кроме того, при визуальном сравнении получаем качественную оценку: тест «надежен» или «ненадежен». Обычно в контроле используется несколько тестов, и достоверность результатов каждого из них зависит от уровня надежности. Его количественную меру и нужно определять в виде коэффициента надежности.

Для этого можно использовать два метода.

Первый — д и с п е р с и о н н ы й анализ . Он позволяет не только рассчитать значение коэффициента надежности, но и установить влияние различных факторов на изменчивость результатов в тесте.

Рассмотрим следующий пример. У группы гимнастов в конце каждого тренировочного микроцикла измеряют достижения в комплексе тестов, характеризующих их координационные и силовые способности. Полученные результаты

будут варьировать:

 

1)

у каждого спортсмена

(внутрииндивидуальная изменчивость);

2)

между спортсменами

(межиндивидуальная изменчивость);

3)

в разные дни тестирования.

Дисперсионный анализ позволяет выявить и оценить каждый из этих факторов изменчивости. Техника такой работы ясна из следующего примера. Группе юных баскетболистов тренер предложил выполнить три раза по десять штрафных бросков. Цель этого теста — определение точности заданий. Необходимо узнать, надежен он или нет. Сделаем это по данным табл. 3.

26

Видно, что надежность этого теста при трех попытках невысока, Если число попыток увеличить до 6, то надежность теста увеличится так:

Второй метод определения надежности тестов значительно проще, но может использоваться только в случае двух попыток и отсутствии тренда (т. е. постоянного, от попытки к попытке, повышения или понижения результатов теста). Здесь можно рассчитывать обычный коэффициент корреляции (при этом оценивается надежность не двух, а одной попытки).

Для примера, представленного в табл. 4, коэффициент корреляции между первой и второй попытками равен 0,43; между второй и третьей — 0,48. Оценка надежности в зависимости от величины

ее коэффициента представлена в табл. 5.

Тесты, надежность которых меньше указанных в таблице значений, использовать не рекомендуется.

3.4.3. Методы повышения надежности тестов

Контроль с помощью малонадежных тестов приводит к ошибкам в оценке состояния спортсменов. Если эти ошибочные данные используются как основа для планирования нагрузок, то и оно будет ошибочным. Поэтому необходимо стремиться повысить надежность информативных тестов для оценки каких-либо сторон подготовленности спортсменов. Для этого необходимо устранить причины, которые вызывают увеличение вариативности измерений. В некоторых случаях, помимо выполнения требований, изложенных в разделе 3.1, полезно увеличить количество попыток в тесте и использовать больше экспертов (судей, оценщиков).

Надежность оценки контролируемых показателей повышается также и при применении большего количества эквивалентных тестов.

3.4.4. Стабильность тестов

Стабильность теста это такая разновидность надежности, которая проявляется в степени совпадения результатов тестирования, когда первое и последующие измерения разделены определенным временным интервалом. При этом повторное тестиро-

вание обычно называют ретестом.

Высокая стабильность теста свидетельствует о сохранении приобретенного в ходе тренировок технико-тактического мастерст-

28

ва, двигательных и психических качеств. Пример такой динамики показателей представлен на рис. 6. Из него видно, что МПК четырех сильнейших футболистов Голландии в соревновательном периоде (а именно оно в значительной степени определяет работоспособность спортсменов) поддерживается в течение двух лет на стабильном уровне.

Рис. 6. Динамика максимального потребления кислорода у сильнейших футболистов Голландии (n=4)

Стабильность теста прежде всего зависит от содержания тренировочного процесса: при исключении (или уменьшении), например, силовых упражнений результаты ретеста, как правило, уменьшаются. Кроме того, на стабильность влияют также: сложность теста и длительность временного интервала между тестом и ретестом.

Для количественной оценки стабильности используется дисперсионный анализ по той же схеме, что и в случае расчета обычной надежности.

3.4.5. Согласованность тестов

Согласованность тестов характеризуется независимостью результатов тестирования от личных качеств лица, проводящего или оценивающего тест. Если результаты спортсменов в тесте, который проводят разные специалисты (эксперты, судьи, оценщики), совпадают, то это свидетельствует о высокой степени согласованности теста. Это свойство теста зависит от совпадения методик тестирования у разных специалистов.

Когда создается новый тест, нужно обязательно проверить его на согласованность. Делается это так: разрабатывается унифицированная методика проведения теста, а потом два или более специалиста по очереди в стандартных условиях тестируют одних и тех же спортсменов.

29

В случае инструментальной регистрации (например, времени бега на 30 м с помощью фотоэлектронных устройств) не должно быть несовпадения результатов у разных специалистов. Но на самом деле оно бывает, и вовсе не потому, что один специалист хорошо владеет навыками измерений, а другой — плохо (такая ситуация вообще недопустима). Некоторые экспериментаторы более требовательны, умеют лучше мотивировать спортсменов, и это сказывается на результатах. Вот этот вклад «личных» качеств специалиста в результат теста и оценивается по коэффициенту согласованности. Он также рассчитывается с помощью дисперсионного анализа.

В случае качественной оценки результатов теста (особенно если тест — сложнокоординационное упражнение) отклонения их значений могут быть большими. Причина — невозможность строго стандартизировать процедуру оценки, разные возможности восприятия качественных особенностей движения у специалистов.

Специальные методы повышения согласованности оценок в таких случаях изложены в главе 5.

3.4.6. Эквивалентность тестов

Одно и то же двигательное качество (способность, сторону подготовленности) можно измерить с помощью нескольких тестов. Например, максимальную скорость — по результатам пробегания с ходу отрезков в 10, 20 или 30 м. Силовую выносливость — по числу подтягиваний на перекладине, отжиманий в упоре, количеству подъемов штанги в положении лежа на спине и т. д. Такие тесты называют э к в и в а л е н т н ы м и .

Эквивалентность тестов определяется следующим образом: спортсмены выполняют одну разновидность теста и затем, после небольшого отдыха, вторую и т. д.

Если результаты оценок совпадают (например, лучшие в подтягивании оказываются лучшими и в отжимании), то это свидетельствует об эквивалентности тестов. Коэффициент эквивалентности определяется с помощью корреляционного или дисперсионного анализа.

Применение эквивалентных тестов повышает надежность оценки контролируемых свойств моторики спортсменов. Поэтому если нужно провести углубленное обследование, то лучше применить несколько эквивалентных тестов. Такой комплекс называется гомогенным. Во всех остальных случаях лучше использовать гетерогенные комплексы: они состоят из неэквивалентных тестов.

Не существует универсальных гомогенных или гетерогенных комплексов. Так, например, для слабо подготовленных людей такой комплекс, как бег на 100 и 800 м, прыжок в длину с места, подтягивание на перекладине, будет гомогенным. Для спортсменов высокой квалификации он может оказаться гетерогенным.

30