- •Три этапа развития статистики
- •Основные этапы развития статистики
- •2. Предмет и задачи статистики
- •3.Основные понятия теории статистики
- •Сбор информации;
- •1.Организационные и методологические вопросы статистического наблюдения
- •2. Ошибки статистического наблюдения
- •Классификация ошибок статистического наблюдения
- •3. Организационные формы, виды и способы статистического наблюдения
- •1. Сводка и группировка (понятие и основные виды)
- •2.Ряды распределения: атрибутивные и вариационные
- •3.Статистические таблицы и графики, требования к составлению таблиц
- •Макет таблицы
- •4. Классификация как особый вид группировки. Роль классификаций в статистике
- •2. Классификация относительных показателей
- •Классификация относительных показателей
- •3. Понятие «средняя величина» и основные виды средних величин в статистике Понятие «средняя величина»
- •Различные виды средних величин и способы их расчета
- •В табл. 4.2 те же обозначения, что и в табл. 4.1.
- •Вспомогательная таблица для расчета простой и взвешенной средней арифметической
- •Исходные данные и вспомогательные расчеты для определения средней гармонической
- •1. Понятие вариации и основные виды показателей вариации
- •Вспомогательная таблица для расчета показателей вариации
- •На основе исходных данных вначале подсчитываются средние величины, а затем находятся отклонения от средних. Рекомендуется в расчетах показателей вариации пользоваться формулой средней взвешенной.
- •2.Свойства средней арифметической и дисперсии
- •Свойства дисперсии
- •(Свойство минимальности).
- •3. Изучение структурных характеристик вариационного ряда
- •2. Показатели концентрации и дифференциации
- •3. Показатели структурных сдвигов
- •Лекция №7. Методология организации выборочных наблюдений5.
- •1.Задачи выборочного наблюдения и различные способы формирования выборки
- •Способы отбора единиц из генеральной совокупности
- •2. Понятие «ошибка выборки» и способы ее расчета
- •3. Расчет оптимальной численности выборки
- •Лекция №8. Методы и показатели оценки тесноты статистических взаимосвязей.
- •1.Понятие «статистическая взаимосвязь»
- •2. Классификация методов оценки тесноты статистических связей
- •3. Аналитические показатели оценки тесноты взаимосвязей между количественно измеримыми признаками
- •Вспомогательная таблица для расчета рангового коэффициента корреляции Спирмена
- •4.Способы оценки тесноты взаимосвязей между качественными признаками
- •Лекция №9. Статистическое изучение динамики социально -экономических процессов и явлений.
- •2. Аналитические показатели динамики
- •Аналитические показатели динамики
- •3. Сглаживание (выравнивание) динамических рядов: механическое и аналитическое сглаживание
- •Лекция №10. Построение уравнений тренда и уравнений парной линейной регрессии
- •1. Сущность метода наименьших квадратов
- •2. Построение уравнений регрессии
- •Расчет параметров парной линейной регрессии
- •3. Построение уравнений тренда
- •Вспомогательная таблица для расчета параметров уравнений линейного и квадратического тренда
- •4. Расчет корреляционного отношения на основе уравнения регрессии
- •Способы отбора факторных переменных.
- •Исходные данные для построения уравнений регрессии
- •После подсчета сумм в нижней строке таблицы, находим линейный коэффициент корреляции:
- •Матрица коэффициентов парной корреляции
- •Использование метода наименьших квадратов для построения нелинейных уравнений регрессии
- •Нелинейные относительно оцениваемых параметров
- •1. Понятие «статистический индекс»
- •2.Различные виды статистических индексов и способы их расчета
- •Различные виды агрегатных индексов
- •Вспомогательная таблица для расчета агрегатных индексов по формулам Ласпейреса и Пааше
- •3. Сущность индексного метода в статистике
- •Примеры решения задач индексным методом.
- •1. Понятие «прогноз» и виды прогнозов
- •2. Сущность статистических методов прогнозирования и требования к исходной статистической информации
- •3.Прогнозирование на основе уравнений тренда
- •1.Кластерный анализ
- •Дискриминантный анализ
- •3.Факторный анализ (метод главных компонент)
Вспомогательная таблица для расчета рангового коэффициента корреляции Спирмена
№ п/п |
x |
y |
px (ранг x) |
py (ранг y) |
di= pxi- pyi (разность рангов) |
di2 |
… |
|
|
|
|
|
|
Σ |
– |
– |
– |
– |
– |
- |
Значения рангового коэффициента корреляции также расположены между «–1» и 1, как и линейного коэффициента корреляции, но обычно ранговый коэффициент измеряет тесноту связи более «грубо» (приближенно), чем линейный.
Сам по себе ранговый коэффициент Спирмена называют еще коэффициентом корреляции рангов, потому что формулу для его расчета можно вывести из обычной формулы для линейного коэффициента корреляции. Предположим, что мы проранжировали признаки X и Y, а потом рассчитали коэффициент корреляции между их рангами по формуле:
где pxi - ранг i-той единицы совокупности по переменной x;
pyi - ранг i-той единицы совокупности по переменной y;
- средний ранг по переменной x; - средний ранг по переменной y.
Известно, что сумма квадратов отклонений чисел натурального ряда от их средней величины равна (n3-n)/12. Так как ранги представляют собой ряд натуральных чисел, то = (n3-n)/12 и =(n3-n)/12 т.е. в знаменателе формулы стоит величина (n3-n)/12.
Преобразуя формулу рангового коэффициента корреляции, получаем:
= = + - 2 = 2×((n3-n)/12)- 2 =(n3-n)/6−2
Отсюда получаем, что = ((n3-n)/6− ): 2
И, следовательно,
Помимо коэффициента Спирмена в статистике используют также коэффициент корреляции рангов Кендэлла (τ), который рассчитывается по формуле:
Где n – число наблюдений, а S – сумма разностей между числом последовательностей и числом инверсий по второму признаку. Чтобы рассчитать этот коэффициент, выполняют несколько последовательных этапов:
Значения X ранжируются в порядке возрастания или убывания;
Значения Y располагаются в порядке, соответствующем значениям X;
Для каждого ранга Y определяется число следующих за ним значений рангов, превышающих его величину. Сумма всех этих чисел (обозначается через P) определяется как мера соответствия последовательностей рангов по X и Y и учитывается со знаком (+);
Для каждого ранга Y определяется число следующих за ним значений рангов, меньших его величины. Сумма этих чисел обозначается через Q и учитывается со знаком (-);
Находится сумма баллов по всем членам ряда S = P-Q;
Полученная сумма соотносится с максимально возможной, которая равна n(n-1)/2 в случае если в обоих рядах ранги следуют строго последовательно от 1 до n.
4.Способы оценки тесноты взаимосвязей между качественными признаками
Для оценки тесноты связи между двумя качественными признаками, которые нельзя даже проранжировать, используют другие методы. Пусть имеется два качественных признака x и y, которые нельзя измерить количественно, но можно определить, обладает ли данная статистическая единица данным признаком или нет. Условно можно считать, что каждый признак принимает только два возможных значения: 0 – если статистическая единица не обладает данным признаком; 1 – если статистическая единица обладает данным признаком.
Для измерения связи между такими признаками вначале строится так называемая таблица сопряженности, которая имеет форму, приведенную ниже:
Таблица 8.4
Таблица сопряженности между двумя альтернативными признаками
y x |
0 |
1 |
Σ |
0 |
S(0,0) |
S(0,1) |
S(0,0)+ S(0,1) |
1 |
S(1,0) |
S(1,1) |
S(1,0)+ S(1,1) |
Σ |
S(0,0)+ S(1,0) |
S(0,1)+ S(1,1) |
S |
S = S(0,0) + S(0,1) + S(1,0) + S(1,1).
В этой таблице S – это общее число статистических единиц;
S(0,0) – это число статистических единиц, для которых х=0; у=0;
S(0,1) – это число статистических единиц, для которых х=0; у=1;
S(1,0) – это число статистических единиц, для которых х=1; у=0;
S(1,1) – это число статистических единиц, для которых х=1; у = 1.
Обозначим S(0,0) = a; S(0,1) = b; S(1,0); S(1,1).
На основе этой таблицы далее рассчитываются различные показатели.
Среди показателей, используемых для оценки тесноты связей качественных признаков, наиболее известны:
Коэффициент ассоциации:
Коэффициент контингенции:
Кроме того, в статистике разработаны и другие непараметрические методы оценки тесноты статистических взаимосвязей.
Коэффициент конкордации, например, используется не только для оценки связи между двумя факторами, но и между большим числом факторов, принимающих несколько различных значений..
Формула для расчета этого коэффициента имеет вид:
где m – количество факторов, n – число наблюдений (то есть известных значений каждого фактора), а S – сумма квадратов отклонений суммы рангов по m факторам от их средней арифметической.