- •Тема 1. Предмет и метод статитстики.
- •Тема 2. Статистическое наблюдение
- •Виды сн
- •Тема 3. Сводка и группировка статистических данных. Статистические таблицы
- •Тема 4. Статистические показатели
- •Тема 5. Анализ рядов распределения
- •5.3 Что называется модой в статистике?
- •Тема 6. Выборочный метод
- •Тема 7. Статистическая проверка гипотез
- •Тема 8. Анализ таблиц взаимной сопряженности
- •Тема 9. Статистические методы анализа корреляционных связей
- •Тема 10. Анализ интенсивности динамики
- •Тема 11. Анализ тенденций развития
- •Тема 12. Индексы
- •Тема 13. Графический метод
Тема 8. Анализ таблиц взаимной сопряженности
Разделы темы:
Условия использования таблиц взаимной сопряженности (непараметрические методы).
Оценка тесноты связи и порядок расчета коэффициентов Фехнера, Спирмена, Кендела.
Оценка тесноты связи между альтернативными признаками.
ЧТО ПРДЕДСТАВЛЯЕТ СОБОЙ ТАБЛИЦА ВЗВАИМНОЙ СОПРЯЖЕННОСТИ ПРИЗНАКОВ?
Таблица взаимной сопряженности признаков
- табличное представление совместного распределения двух качественных признаков, т.е. величин частот или частостей наблюдений, обладающих одновременно S –м значением одного и t –м значением другого признака (S = 1, ….., m1, t = 1, ......., m2).
8.2 В КАКИХ СЛУЧАЯХ ИСПОЛЬЗУЮТСЯ ТАБЛИЦЫ СОПРЯЖЕННОСТИ (НЕПАРАМЕТРИЧЕСКИЕ МЕТОДЫ)
П
Условия использования таблиц сопряженности
ри определении интенсивности связи между качественными признаками.При изучении степени тесноты связи между количественными признаками, форма распределения которых отличается от нормальной.
ЧТО ПОЛОЖЕНО В ОСНОВУ НЕПАРАМЕТРИЧЕСКИХ МЕТОДОВ?
-
Условия использования таблиц сопряженности
Для выявления связи между признаками, ранги индивидуальных значений факторного признака располагают в порядке возрастания, и если ранги результативного признака обнаруживают тенденцию к увеличению, можно предполагать наличие прямой связи. Если с увеличением рангов факторного признака ранги результативного признака уменьшаются, то это свидетельствует о наличии обратной связи.
КАКИЕ ИСПОЛЬЗУЮТСЯ КОЭФФИЦИЕНТЫ ДЛЯ УСТАНОВЛЕНИЯ ТЕСНОТЫ СВЯЗИ КАЧЕСТВЕННЫХ ПРИЗНАКОВ?
-
Коэффициент Фехнера (Кф)
(коэффициент корреляции знаков)
Определяется по формуле:
где С – число случаев совпадения знаков отклонений от средней;
Н – число случаев несовпадения этих знаков.
При Кф = 0 – связь отсутствует, чем ближе Кф к единице, тем связь является более тесной.
-
Коэффициент Спирмена (Кс) (коэффициент
корреляции рангов)
; 6
где d – разность между рангами по Х и У;
Х – число единиц в ряду.
Пример 8.1
Необходимо установить наличие связи между уровнем механизации труда и трудоемкостью изготовления единицы продукции.
Таблица 8.1
Исходные данные к расчету коэффициентов Фехнера и Спирмена
№ завода |
Уровень автома-тизации, % |
Трудо-емкость, чел-мин |
Знак отклонения |
Совп-адение,Несовп. |
Ранги |
d |
d2 |
||
От Х |
От У |
По Х |
По У |
||||||
1 2 3 4 5 6 7 8 9 10 |
60 61 62 63 64 65 66 67 68 69 |
14 12 13 15 14 12 10 13 8 7 |
- - - - - + + + + + |
+ + + + + + - + - - |
Н Н Н Н Н С Н С Н Н |
10 9 8 7 6 5 4 3 2 1 |
2,5 6,5 4,5 1,0 2,5 6,5 8,0 4,5 9,0 10 |
7,5 2,5 3,5 6,0 3,5 -1,5 -4 -1,5 -7 -9 |
56,25 6,25 12,25 36,0 12,25 2,25 16 2,25 49 81 |
= 64,5; = 11,8
- коэффициент корреляции рангов (Спирмена)
Вывод: Доказана обратная связь между уровнями механизации труда и трудоемкостью изготовления единицы продукции.
Коэффициент корреляции рангов Кендела
- определяется по формуле:
где S = P + Q
При определении слагаемого Р нужно установить, сколько чисел, находящихся справа от каждого из элементов последовательности рангов переменной У , имеют величину ранга, превышающую ранг рассматриваемого элемента.
Слагаемое Q характеризует степень несоответствия последовательности рангов переменной Х . Для его определения подсчитывают число чисел, находящихся справа от каждого, из членов последовательности рангов переменной У , имеющих ранг меньше, чем эта единица. Величины берутся со знаком минус.
Пример 8.2
По данным примера 8.1 рассчитаем коэффициент Кендела
Р = (0 + 0 + 3 + 0 + 0 + 1 + 3 + 1 + 0) = 8
Q = (- 9 – 8 – 3 – 6 – 4 – 1 – 0 – 1 – 1) = - 33
S = (8 - 33) = - 25
8.5 КАК ОПРЕДЕЛЯЕТСЯ СУЩЕСТВЕННОСТЬ КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ КЕНДЕЛА?
Проверка существенности коэффициента
Кендела
- осуществляется при уровне значимости а по формуле:
где ta - коэффициент, определяемый по таблице нормального распределения для выбранного уровня значимости а при больших n.
КАК ОПРЕДЕЛЯЕТСЯ ТЕСНОТА СВЯЗИ МЕЖДУ НЕСКОЛЬКИМИ ПРИЗНАКАМИ?
-
Коэффициент конкордации
ККК
где m – число факторов;
n – число ранжируемых единиц;
S – сумма квадратов отклонений рангов.
8.7 В КАКИХ СЛУЧАЯХ И КАК РАССЧИТЫВАЕТСЯ КОЭФФИЦИЕНТ АССОЦИАЦИИ И КОНТИНГЕНЦИИ?
-
Коэффициент ассоциации и коэффициент
контингенции
Для расчета коэффициентов строится четырехклеточная корреляционная таблица:
а |
b |
a+b |
c |
d |
c+d |
a+c |
b+d |
a+b+c+d |
Расчет коэффициента ассоциации (А) проводится по формуле:
Если А ≥ 0,5 связь подтверждается.
Коэффициент контингенции (ККон):
Если ККон ≥ 0,3, то это свидетельствует о наличии связи между качественными признаками.
8.8 КАК РАССЧИТЫВАЮТСЯ КОЭФФИЦИЕНТЫ ВЗАИМНОЙ СОПРЯЖЕННОСТИ К.ПИРСОНА И А.А ЧУПРОВА
-
Коэффициент взаимной сопряженности
К.Пирсона
-
Коэффициент взаимной сопряженности
А.А.Чупрова
где х2 – критерий «хи-квадрат»;
п – общее число наблюдений;
К1 – число групп по результативному признаку;
К2 – число групп по факторному признаку.
Критерий «хи-квадрат» (
)
- используется для установления тесноты связи между качественными показателями с большим числом градаций.
где - соответственно эмпирические и теоретические частоты в і-ой строке j-го столбца;
К1, К2 – соответственно число групп в строках и столбцах таблиц.
Пример 8.3
По данным, представленным в таблице, рассчитать коэффициенты сопряженности.
Таблица 8.2
Зависимость качества продукции от уровня механизации
Степень годности |
Уровень механизации |
Итого |
||
Частично механизировано |
Механизировано |
Автоматизировано |
||
Соответствует стандарту |
7(7,1) |
8(9,4) |
10(8,5) |
25 |
Исправимый |
3(3,4) |
7(4,5) |
1(4,1) |
12 |
Неисправимый |
5(4,5) |
5(6) |
7(5,5) |
16 |
ИТОГО |
15 |
20 |
18 |
53 |
|
|
|
|
|
|
|
|
|
Число степеней свободы: К = (3-1).(3-1) = 4
При уровне значимости 0,05 х2 при К = 4 составляет 9,5, т.е. < , следовательно можно предположить, что в данной совокупности зависимости качества продукции от уровня механизации производственных процессов не наблюдается.
Вывод: Зависимость между случайными признаками существует, но степень тесноты связи невелика.