- •Три этапа развития статистики
- •Основные этапы развития статистики
- •2. Предмет и задачи статистики
- •3.Основные понятия теории статистики
- •Сбор информации;
- •1.Организационные и методологические вопросы статистического наблюдения
- •2. Ошибки статистического наблюдения
- •Классификация ошибок статистического наблюдения
- •3. Организационные формы, виды и способы статистического наблюдения
- •1. Сводка и группировка (понятие и основные виды)
- •2.Ряды распределения: атрибутивные и вариационные
- •3.Статистические таблицы и графики, требования к составлению таблиц
- •Макет таблицы
- •4. Классификация как особый вид группировки. Роль классификаций в статистике
- •2. Классификация относительных показателей
- •Классификация относительных показателей
- •3. Понятие «средняя величина» и основные виды средних величин в статистике Понятие «средняя величина»
- •Различные виды средних величин и способы их расчета
- •В табл. 4.2 те же обозначения, что и в табл. 4.1.
- •Вспомогательная таблица для расчета простой и взвешенной средней арифметической
- •Исходные данные и вспомогательные расчеты для определения средней гармонической
- •1. Понятие вариации и основные виды показателей вариации
- •Вспомогательная таблица для расчета показателей вариации
- •На основе исходных данных вначале подсчитываются средние величины, а затем находятся отклонения от средних. Рекомендуется в расчетах показателей вариации пользоваться формулой средней взвешенной.
- •2.Свойства средней арифметической и дисперсии
- •Свойства дисперсии
- •(Свойство минимальности).
- •3. Изучение структурных характеристик вариационного ряда
- •2. Показатели концентрации и дифференциации
- •3. Показатели структурных сдвигов
- •Лекция №7. Методология организации выборочных наблюдений5.
- •1.Задачи выборочного наблюдения и различные способы формирования выборки
- •Способы отбора единиц из генеральной совокупности
- •2. Понятие «ошибка выборки» и способы ее расчета
- •3. Расчет оптимальной численности выборки
- •Лекция №8. Методы и показатели оценки тесноты статистических взаимосвязей.
- •1.Понятие «статистическая взаимосвязь»
- •2. Классификация методов оценки тесноты статистических связей
- •3. Аналитические показатели оценки тесноты взаимосвязей между количественно измеримыми признаками
- •Вспомогательная таблица для расчета рангового коэффициента корреляции Спирмена
- •4.Способы оценки тесноты взаимосвязей между качественными признаками
- •Лекция №9. Статистическое изучение динамики социально -экономических процессов и явлений.
- •2. Аналитические показатели динамики
- •Аналитические показатели динамики
- •3. Сглаживание (выравнивание) динамических рядов: механическое и аналитическое сглаживание
- •Лекция №10. Построение уравнений тренда и уравнений парной линейной регрессии
- •1. Сущность метода наименьших квадратов
- •2. Построение уравнений регрессии
- •Расчет параметров парной линейной регрессии
- •3. Построение уравнений тренда
- •Вспомогательная таблица для расчета параметров уравнений линейного и квадратического тренда
- •4. Расчет корреляционного отношения на основе уравнения регрессии
- •Способы отбора факторных переменных.
- •Исходные данные для построения уравнений регрессии
- •После подсчета сумм в нижней строке таблицы, находим линейный коэффициент корреляции:
- •Матрица коэффициентов парной корреляции
- •Использование метода наименьших квадратов для построения нелинейных уравнений регрессии
- •Нелинейные относительно оцениваемых параметров
- •1. Понятие «статистический индекс»
- •2.Различные виды статистических индексов и способы их расчета
- •Различные виды агрегатных индексов
- •Вспомогательная таблица для расчета агрегатных индексов по формулам Ласпейреса и Пааше
- •3. Сущность индексного метода в статистике
- •Примеры решения задач индексным методом.
- •1. Понятие «прогноз» и виды прогнозов
- •2. Сущность статистических методов прогнозирования и требования к исходной статистической информации
- •3.Прогнозирование на основе уравнений тренда
- •1.Кластерный анализ
- •Дискриминантный анализ
- •3.Факторный анализ (метод главных компонент)
3. Аналитические показатели оценки тесноты взаимосвязей между количественно измеримыми признаками
В статистике разработано много различных показателей, выражающих тесноту связей между явлениями и процессами, но каждый из них обладает своими преимуществами и недостатками. Наиболее распространенным из них является линейный коэффициент корреляции, но он показывает наличие тесноты связи только в случае, если зависимость между значениями показателей носит линейный характер. Если это не так, лучше пользоваться другими показателями. Показатель так называемого «корреляционного отношения» можно использовать в довольно широкой области, но предварительно необходимо построить уравнение регрессии, описывающее статистическую взаимосвязь между признаками X и Y, т.е. расчет этого показателя довольно сложен10.
Ранговый коэффициент корреляции может использоваться даже в том случае, если признаки нельзя выразить количественно, но можно проранжировать, то есть расположить по порядку. Существуют также особые способы измерения взаимосвязей между количественно не измеримыми признаками, которые мы рассмотрим ниже.
Линейный коэффициент корреляции рассчитывается по формуле:
В этой формуле и – средние значения признаков x и y, а и – соответственно средние квадратические отклонения. Из этой формулы легко выводятся другие формулы для расчета линейного коэффициента корреляции, например:
Или
Все эти формулы тождественны и дают один и тот же результат, но в разных случаях бывает удобнее пользоваться той или иной формулой. Первая и вторая формула наиболее удобны для запоминания, но расчет по последней формуле более прост.
Для расчета линейного коэффициента корреляции по последней из приведенных формул обычно строится вспомогательная таблица следующего вида (табл. 8.2).
Таблица 8.2
Вспомогательная таблица для расчета линейного коэффициента корреляции
x |
y |
|
|
|
|
|
… |
|
|
|
|
|
|
Σ |
|
|
|
|
|
|
В последней строке таблицы 8.2. рассчитываются суммы по столбцам.
Линейный коэффициент корреляции равен отношению суммы в последнем столбце таблицы к корню из произведения сумм в двух предшествующих столбцах.
Подчеркнем, что линейный коэффициент корреляции обладает следующим свойством: он всегда находится между –1 и 1, т.е. всегда –1 r 1.
Если при вычислениях вдруг обнаруживается, что коэффициент корреляции находится за пределами этих границ, значит, это просто ошибка в расчетах!
Чем ближе коэффициент корреляции к 1, тем более тесной является связь! При этом если r > 0, то связь прямая, а если r < 0, то связь обратная.
Если | r | ≥ 0,7, то связь считается более тесной, если | r | < 0,3, то связь отсутствует. Если 0,3 ≤ | r | ≤ 0,7, то наличие связи целесообразно проверить дополнительными методами.
Линейный коэффициент корреляции может не всегда показать наличие связи. В случае, если значения признаков нельзя измерить количественно, удобнее использовать ранговый коэффициент корреляции или специальные коэффициенты, используемые для оценки тесноты связи между качественными признаками. Если связь не является линейной, то в качестве критерия оценки тесноты связи удобнее всего использовать так называемое корреляционное отношение. Но для его расчета вначале необходимо построить так называемое уравнение регрессии11 (т.е. связи между признаками).
Линейный коэффициент корреляции и корреляционное отношение не являются универсальными показателями оценки тесноты связи. Их можно применять только в том случае, если изучаемые признаки можно измерить количественно.
При использовании этих методов нельзя обойтись без вычисления основных параметров распределения (средних величин, дисперсий). Поэтому методы, основанные на их использовании, получили название параметрических методов оценки тесноты статистической связи.
Между тем в статистической практике приходится сталкиваться с задачами измерения взаимосвязей между качественными признаками, к которым параметрические методы анализа в их обычном виде не применимы. Статистической наукой разработаны методы, которые позволяют оценить тесноту взаимосвязи между явлениями, не используя при этом количественные значения признака, а значит, не рассчитывая и параметры распределения. Такие методы получили название непараметрических.
Одним из таких методов является расчет так называемого рангового коэффициента корреляции. Он может использоваться как в тех случаях, когда признаки измеримы количественно, так и в тех случаях, когда их нельзя измерить количественно, но можно проранжировать, то есть расположить их значения в порядке возрастания. Например, предположим, что при оценке тесноты связи между ростом и весом некоторой группы людей мы по каким-то причинам не смогли достать измерительные приборы (весы, ростомер и т.п.). Но мы можем выстроить этих людей по росту, определив, кто из них выше, а кто ниже, и одновременно определить, кто из них больше весит, усадив их на качели. Таким образом, мы можем проранжировать их рост и вес. Ранг – это порядковый номер значений признака, расположенных по их возрастанию. Если нам известны количественные значения соответствующих признаков, то в расчетах рангового коэффициента корреляции они все равно не понадобятся – нужно только определить ранг соответствующего значения.
Предположим, что мы расположили значения признаков x и y порядку и перенумеровали их, то есть присвоили каждому соответствующий порядковый номер или ранг. (Необходимо отметить, что одинаковым значениям присваивается одинаковый ранг!)
Обозначим ранг значения признака как px а ранг значения признака y как py
Формула для расчета рангового коэффициента корреляции имеет вид:
В этой формуле di – это разность рангов значений признаков x и y, то есть di= pxi- pyi
Для расчета рангового коэффициента корреляции удобно построить вспомогательную таблицу (табл. 8.3).
Таблица 8.3