- •3. Обработка эмпирических данных
- •Понятие о выборке и шкалах измерения Генеральная и выборочная совокупности
- •3.2. Статистические таблицы
- •Распределение (2х2)
- •3.3. Средние величины
- •3. 4. Понятие корреляции
- •3.5. Т-критерий Вилкоксона
- •Результаты методики Филлипса до и после проведения коррекционной работы
- •3.6. Факторный анализ
- •Корреляционная матрица
3.2. Статистические таблицы
Таблицы первичных эмпирических данных (ПЭД)
В математической статистике основным способом упорядоченного представления данных, полученных в результате исследования, является таблица. Любая таблица состоит из подлежащего и сказуемого.
Подлежащее содержит в себе порядковый номер, имя, фамилию испытуемого, названия методик, по которым он обследуется, и т.д. Само по себе подлежащее не имеет числового измерения и выполняет функцию обозначения той или иной переменной. Подлежащее может рассматриваться как простое, если его деление носит одноразовый характер, по одному критерию, и как комбинаторное, если деление осуществляется по нескольким критериям. Левая и верхняя шапки таблицы выполняют функцию подлежащего.
Сказуемое является числовой характеристикой и относится к подлежащему, определяет его. Числовой материал, находящийся в таблице, выполняет функцию сказуемого.
Виды таблиц
Вычислительные, с помощью которых производят расчеты, обрабатывают данные и – в итоге – на их основе делают количественные выводы.
Аналитические, данные в которых представляются таким образом, чтобы на их основе можно было делать качественные выводы.
Классификация статистических таблиц
1. Таблицы первичных эмпирических данных (ПЭД)
Задача таблиц ПЭД состоит в том, чтобы все данные, полученные в ходе исследования, представить унифицировано, в одной таблице. На основе таблиц ПЭД строятся так называемые групповые таблицы или ряды распределений, в которых упорядочение осуществляется по одному признаку, и комбинаторные, или таблицы распределения.
2. Таблицы распределения
Таблица распределения – n-мерная таблица, где n – количество признаков, по которым проводится анализ.
Эмпирическая таблица распределения – такая таблица распределения, которая строится на основе таблицы первичных эмпирических данных.
Теоретическая таблица распределения – таблица распределения, построенная при условии, что распределение испытуемых носит случайный характер.
Определение различий между эмпирической и теоретической таблицами распределения
Различие между эмпирической и теоретической таблицами распределения определяется с помощью ХИ-квадрат- критерия (χ²) по формуле:
,(3.1)
где i – порядковый номер строки;
j – порядковый номер столбца;
n – число строк;
m – число столбцов таблицы (матрицы) распределения;
и – эмпирическая и теоретическая частоты наблюдаемого признака.
Показатель квадратом называется условно: он определяет, насколько эмпирическое распределение отклоняется от теоретического. Так как теоретическое распределение исходит из независимости признаков, то чем больше эмпирическое распределение отклоняется от теоретического (случайного), тем больше значение; и наоборот, чем больше, тем больше эмпирическое распределение отклоняется от теоретического. Поэтому показательявляется оценкой неслучайности распределения.
Ниже будут рассмотрены таблицы размерности (1х2), (2х2), (2х3) и проведены расчеты ХИ-квадрат критерия с целью установления статистической значимости различия между эмпирической и теоретической таблицами распределения. Следует отметить, что ХИ-квадрат критерий работает на номинальных шкалах, и в качестве значений изучаемых признаков рассматриваются частоты распределения.
Распределение (1х2)
Таблица распределения размерности один на два записывается как (1х2) и представляется в виде:
Таблица 3.1
|
j | |
i |
|
|
где число строк i=1, а число столбцов j=2.
Для расчета предварительно проверяется требование Юла и Кендалла, относящееся к теоретическим таблицам распределения.
Требование Юла и Кендалла: каждая теоретическая частота должна быть не меньше 5.
Для распределения (1х2) способ определения теоретических частот не задан, поэтому требование Юла и Кендалла соответствует неравенству:
. (3.2)
Формула расчета для распределения (1х2) является частным случаем формулы (1) и записывается в виде:
, (3.3)
где и— эмпирические частоты распределения, выраженные числом.
Статистическая значимость различия между иустанавливается путем сравнения с меньшим значением и установления уровня значимостир по таблице:
Таблица 3. 2
|
2.71 |
3.84 |
5.41 |
6.64 |
10.83 |
p(%) |
10 |
5 |
2 |
1 |
0.1 |
Статистическое различие считается достоверным, если уровень значимости р≤0,05; если р=0,1, то говорят о наличии тенденции к статистической значимости, и если р>0,1, то статистическое различие (статистическая значимость) не имеет места.