Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Шпоры по статистике.docx
Скачиваний:
3
Добавлен:
24.08.2019
Размер:
518.04 Кб
Скачать

45. Измерение тесноты связи по результатам аналитич. Группировки.

Группировка, выявляющая взаимосвязи между изучаемыми явлениями и их признаками, называется аналитич. группи­ровкой.

Аналитич. группировка позволяет исклю­чить влияние всех прочих факторов, сохранив лишь влияние того, по кот. производится группировка. Следствием выполнения аналитич. группировки явл. вывод о наличии и направлении связи между показателями. Логи­ч. продолжением явл. определение тесноты связи.

Для измерения тесноты связи м/д двумя признаками в случае линейной связи служит линейный коэф-т корреляции:

.

Линейный коэффициент корреляции может принимать любые значения в пределах от -1 до +1. Чем ближе коэффициент корреляции по абсолютной величине к 1, тем теснее связь между признаками. Знак при линейном коэффициенте корреляции указывает на направление связи — прямой зависимости соответствует знак плюс, а обратный зависимости — знак минус.

Сама по себе величина коэф-та корреляции не явл. доказательством наличия причинно-следственной связи между исследуемыми признаками, а явл. оценкой степени взаимной согласованности в изменениях признака.

Установлению причинно-след-ой связи должен предшествовать анализ качественной природы явления. Оценка степени тесноты связи с помощью коэфф. корреляции производится, как правило, на основе более или менее ограниченной информации об изучаемом явлении.

46. Показатель тесноты парной корреляционной связи.

Парная корреляция – это изучение корреляционной связи между двумя переменными.

Для измерения тесноты связи между двумя признаками в случае линейной связи служит линейный коэффициент корреляции (rxy), основанный на расчете нормированных отклонений (tx и ty).

,

Коэффициент корреляции представляет собой среднее произведение этих нормированных отклонений:

,

,

.

Линейный коэффициент корреляции может принимать любые значения в пределах от -1 до +1. Чем ближе коэффициент корреляции по абсолютной величине к 1, тем теснее связь между признаками. Знак при линейном коэффициенте корреляции указывает на направление связи — прямой зависимости соответствует знак плюс, а обратный зависимости — знак минус.

Квадрат коэффициента корреляции r2yx называется коэффициентом детерминации и показывает долю вариации результативного признака объясняемую вариацией факторного признака.

Сама по себе величина коэф-та корреляции не явл. доказательством наличия причинно-следственной связи между исследуемыми признаками, а явл. оценкой степени взаимной согласованности в изменениях признака.

47. Определение параметров уравнения парной регрессии.

Точно так же как средняя величина используется как обобщенная характеристика индивидуальных значений признака, так и линия может выступать в качестве характеристики предполагаемой линейной связи между двумя переменными.

Если установлено наличие зависимости между переменными, из которых одна является фактором, а другая — результатом, то эту зависимость стремятся представить в математическом виде:

.

Математически описание зависимости в среднем изменений переменной у от переменной х называется уравнением парной регрессии.

Наиболее часто используется линейное уравнение парной регрессии:

где – среднее значение результативного признака при определенном значении факторного признака; а – свободный член уравнения регрессии; b – коэффициент регрессии, который показывает, на сколько единиц в среднем изменится результативный признак при изменении факторного признака на единицу его измерения, является показателем силы связи.

Параметры уравнения парной регрессии находятся с помощью методов наименьших квадратов (МНК). Исходное условие МНК формулируется следующим образом:

.

Для отыскания значений параметров a и b, при которых функция принимает минимальное значение, приравниваем нулю первые частные производные функции:

После несложных преобразований получаем систему нормальных уравнений:

Решая систему уравнений относительно b, получим следующую формулу для определения этого параметра

или

,

,

.

Значение параметра a получим, разделив обе части на n:

.

Прямая линия описывается двумя значениями: наклоном b и сдвигом а. Наклон указывает на крутизну подъема, если b положителен, или снижения, если b отрицателен. Если сместиться по горизонтали на 1 единицу измерения x, то линия поднимется или снизится по вертикали на b единиц измерения y. Сдвиг – это просто значение y при x = 0. В случаях, когда нулевое значение лишено смысла, сдвиг следует рассматривать как техническую характеристику.

Нельзя рассчитывать на то, что все точки попадут на линию. Фактические данные можно представить как линию с добавлением случайности. Для каждой точки можно определить остаток, который указывает, на сколько эта точка оказывается выше или ниже линии. Остатки позволяют вносить коррективы, сравнивая фактические значения с теми значениями, которые можно ожидать для соответствующих значений х. Формула остатка имеет вид: