- •Тема 1 Предмет и метод статистики
- •2. Метод статистики
- •3. Основные категории статистики
- •4. Современная организация статистики в рф.
- •Тема 2 Статистические показатели.
- •2. Классификация статистических показателей.
- •3. Понятие о системах статистических показателей.
- •Тема 3 Представление статистических данных: таблицы и графики.
- •2. Статистические графики.
- •Тема 4 Статистическое наблюдение.
- •2. Программно – методологическое обеспечение статистического наблюдения.
- •3. Формы, виды и способы наблюдения.
- •4. Ошибки статистического наблюдения.
- •Тема 5 Сводка и группировка материалов статистического наблюдения.
- •2. Понятие, задачи и виды группировок.
- •3. Принципы выбора группировочного признака и определение интервала группировки.
- •Получаем следующее соотношение:
- •4. Многомерные группировки (классификации).
- •Тема 6 Средние величины и показатели вариации.
- •2. Виды средних и способы их вычисления.
- •3. Показатели вариации.
- •Тема 7 Выборочное наблюдение.
- •2. Ошибки выборки.
- •3. Распространение выборочных результатов на генеральную совокупность.
- •4. Определение необходимой численности выборки.
- •Тема 8 Ряды динамики.
- •2. Показатели анализа рядов динамики.
- •3. Методы анализа основной тенденции развития в рядах динамики.
- •4. Методы изучения сезонных колебаний.
- •Тема 9 Индексы
- •2. Индивидуальные и общие индексы.
- •3. Индексы средних величин.
- •4. Индексный метод анализа факторов динамики.
- •Тема 10 Статистическое изучение взаимосвязей.
- •2. Статистические методы моделирования связи.
- •3. Показатели тесноты связи.
- •4. Непараметрические методы оценки связи.
3. Показатели тесноты связи.
Теснота корреляционной связи может быть измерена эмпирическим корреляционным отношением э, когда2(межгрупповая дисперсия) характеризует отклонение групповых средних результативного признака от общей средней:.
Говоря о корреляционном отношении как о показателе измерения тесноты зависимости, следует отличать от эмпирического корреляционного отношения – теоретическое.
Теоретическое корреляционное отношение представляет собой относительную величину, получающуюся в результате сравнения среднего квадратического отклонения выравненных значений результативного признака, т. е. рассчитанных по уравнению регрессии, со средним квадратическим отношением эмпирических (фактических) значений результативного признака:
= ,
где 2=;=Тогда=.
Изменение значения объясняется влиянием факторного признака.
В основе расчета корреляционного отношения лежит правило сложения дисперсий , где- отражает вариациюyза счет всех остальных факторов, кромеx, т. е. является остаточной дисперсией:
.
Тогда формула теоретического корреляционного отношения примет вид:
или.
Подкоренное выражение корреляционного отношения представляет собой коэффициент детерминации.
Корреляционное отношение может находиться в пределах от 0 до 1, т. е.
(0 1) Чем ближе корреляционное отношение к 1, тем связь между признаками теснее.
Теоретическое корреляционное отношение применяется для измерения тесноты связи при линейной и криволинейной зависимостях между результативным и факторным признаком.
Кроме того, при линейной форме уравнения применяется другой показатель тесноты связи – линейный коэффициент корреляции:
гдеn– число наблюдений.
Для практических вычислений при малом числе наблюдений (n20-30) линейный коэффициент корреляции удобнее исчислять по следующей формуле:
Он принимает значение в интервале : -1 r1. Отрицательные значения указывают на обратную связь, положительные - на прямую. Приr= 0 линейная связь отсутствует. Чем ближе коэффициент корреляции по абсолютной величине к единице, тем теснее связь между признаками. И, наконец, приr=1 связь – функциональная.
Множественный коэффициент корреляции вычисляется при наличии линейной связи между результативными и несколькими факторными признаками, а также между каждой парой факторных признаков.
Множественный коэффициент корреляции вычисляется по формуле:
, где- дисперсия теоретических значений результативного признака, рассчитанная по уравнению множественной регрессии;- общая дисперсия результативного признака.
В случае оценки тесноты связи между результативным и двумя факторными признаками множественный коэффициент корреляции можно определить по формуле:
,
где r – парные коэффициенты корреляции между признаками., которые могут быть рассчитаны по следующим формулам:
;
;
.
4. Непараметрические методы оценки связи.
Методы корреляционного и регрессионного анализа не универсальны: их можно применять, если все изучаемые признаки являются количественными. Между тем в статистике приходиться сталкиваться с задачами измерения связи между качественными признаками. Такие методы измерения связи называются непараметрические.
Для исследования степени тесноты связи между качественными признаками, каждый из которых представлен в виде альтернативных признаков, может быть использован коэффициент ассоциации Д. Юла или коэффициент контингенции К. Пирсона. Расчетная таблица в этом случае состоит из четырех ячеек (таблица «четырех полей») и имеет следующий вид:
Признаки |
А (да) |
(нет) |
Итого |
B (да) |
a |
b |
а + b |
(нет) |
c |
d |
c+d |
Итого |
a + c |
b + d |
n |
Коэффициент ассоциации вычисляется по формуле:
.
Коэффициент контингенции:
.
Если по каждому из взаимосвязанных признаков выделяется число групп более двух то для подобного таблиц теснота связи между качественными признаками может быть измерена с помощью коэффициентов взаимной сопряженности К. Пирсона и А. А. Чупрова.
Коэффициент взаимной сопряженности Пирсона вычисляется по формуле:
, где2– показатель средней квадратической сопряженности, который вычисляется по формуле:
, где,.
Коэффициент Чупрова:
, где К1, К2– число групп по каждому из признаков.
Для определения тесноты связи как между количественными, так и между качественными признаками, при условии, что значение этих признаков могут быть проранжированы по степени убывания или возрастания, используется коэффициент корреляции рангов Спирмена:
,
где d – разность рангов признаковxиy;
n- число наблюдаемых единиц.
В случае отсутствия связи = 0. При прямой связи коэффициент- положительная правильная дробь, при обратной – отрицательная.
Если объём исходной информации небольшой, то необходимо выполнить проверку существенности рангового коэффициента, т. е. сверить с таблицей предельных значений. Расчетное значение должно быть больше предельного.
Для определения тесноты связи между произвольным числом ранжированных признаков применяется коэффициент конкордации:
,
где m– количество факторов;
n- число наблюдений;
S- отклонение суммы квадратов рангов от средней квадратов рангов.
Рассмотрим пример:
В результате обследования студентов факультета получены следующие данные:
Успеваемость |
Количество студентов |
Всего | |
Посещающих спортивные секции |
Не посещающих спортивные секции | ||
Удовлетворительная |
220 |
60 |
280 |
Неудовлетворительная |
10 |
30 |
40 |
Итого |
230 |
90 |
320 |
Определите коэффициент ассоциации и контингенции между успеваемостью и посещаемостью спортивных секций.
Коэффициент ассоциации:
Коэффициент контингенции:
.
Полученные коэффициенты подтверждают наличие существенной связи между исследуемыми признаками. Однако коэффициент контингенции всегда меньше коэффициента ассоциации и дает более корректную оценку тесноту связи.