Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Теория по математике 2.doc
Скачиваний:
728
Добавлен:
04.06.2015
Размер:
1.97 Mб
Скачать
  1. Функциональная, статистическая и корреляционная зависимости. Различия между ними. Основные задачи теории корреляции.

Функциональная зависимость (связь), когда каждому значению одной переменной соответствует вполне определенное значение другой.

Функциональная зависимость может иметь место как между детерминированными (неслучайными) переменными, так и между случайными величинами.

Статистическая (или стохастическая, вероятностная) зависимость - каждому значению одной переменной соответствует определенное (условное) распределение другой переменной.

Т.е. когда каждому значению одной переменной соответствует не какое-то определенное, а множество возможных значений другой переменной.

Возникновение понятия статистической связи обусловливается тем, что зависимая переменная подвержена влиянию ряда неконтролируемых или неучтенных факторов, а также тем, что измерение значений переменных неизбежно сопровождается некоторыми случайными ошибками.

В силу неоднозначности статистической зависимости между Y и Х для исследователя, в частности, представляет интерес усредненная по х схема зависимости, т.е. закономерность в изменении среднего значения - условного математического ожидания (математического ожидания случайной переменнойY, вычисленного в предположении, что переменная Х приняла значение х) в зависимости от х.

Определение. Статистическая зависимость между 2мя переменными, при которой каждому значению 1 переменной соответствует определенное условное математическое ожидание (среднее значение) другой, называется корреляционной.

Иначе, корреляционной зависимостью между двумя переменными величинами называется функциональная зависимость между значениями одной из них и условным математическим ожиданием другой.

Корреляционная зависимость м.б. представлена в виде:

(1)

(2)

Предполагается, что и, т.е. если при изменении х или у условные математические ожиданияине изменяются, то говорят, что корреляционная зависимость между переменными Х иY отсутствует.

Сравнивая различные виды зависимости между Х и Y, можно сказать, что с изменением значений переменной Х при функциональной зависимости однозначно изменяется определенное значение переменной Y, при корреляционной - определенное среднее значение (условное математическое ожидание) Y, а при статистической - определенное (условное) распределение переменной Y. Т.о., из рассмотренных зависимостей наиболее общей выступает статистическая зависимость. Каждая корреляционная зависимость является статистической, но не каждая статистическая зависимость является корреляционной. Функциональная зависимость представляет частный случай корреляционной.

Уравнения (1) и (1) называются модельными уравнениями регрессии (или просто уравнениями регрессии) соответственно Y по Х и Х по Y, функции и-модельными функциями регрессии (или функциями регрессии), а их графики - модельными линиями регрессии (или линиями регрессии).

  1. Линейная парная регрессия. Система нормальных уравне­ний для определения параметров прямых регрессии. Выборочная ковариация. Формулы для расчета коэффициентов регрессии.

Данные о статистической зав-ти удобно задавать в виде корреляционной таблицы.

(В таблице через иобозначены середины соответствующих интервалов, аи- соответственно их частоты).

Изобразим полученную зав-ть графически точками координатной плоскости. Такое изображение статистической зав-ти наз-ся полем корреляции.

Для каждого значения (i = 1,2,...,l), т.е. для каждой строки корреляционной таблицы вычислим групповые средние

где - частоты пар (,) и;m - число интервалов по переменной Y.

Вычисленные групповые средние графически в виде ломаной, называемой эмпирической линией регрессии У по Х.

Аналогично для каждого значения (j = 1,2,...,m):

.

где ;l- число интервалов по переменной Х.

По виду ломаной можно предположить наличие линейной корреляционной зав-ти У по Х между двумя рассматриваемыми переменными, которая графически выражается тем точнее, чем больше объем выборки n:

Поэтому уравнение регрессии будем искать в виде:

.

Применим метод наименьших квадратов, согласно которому неизвестные параметры ивыбираются таким образом, чтобы сумма квадратов отклонений эмпирических групповых средних, от значений, найденных по уравнению регрессии, был минимальной:

Система нормальных уравнений для определения параметров линейной регрессии:

Или

.

где соответствующие средние определяются по формулам:

, ,.

.

Подставляя значение из первого уравнения системы в уравнение регрессии, получим:

, или .

Коэффициент в уравнении регрессии, называемыйвыборочным коэффициентом регрессии (или просто коэффициентом регрессии) Y по Х, будем обозначать символом . Теперьуравнение регрессии У по Х запишется так:

.

Коэффициент регрессии У по Х показывает, на сколько единиц в среднем изменяется переменная У при увеличении переменной Х на одну единицу.

Решая систему, найдем

где - выборочная дисперсия переменной Х:

μ - выборочный корреляционный момент или выборочная ковариация:

Рассуждая аналогично и полагая уравнение регрессии линейным, можно привести его к виду:

.

Где - выборочныйкоэффициент регрессии (или просто коэффициент регрессии) Х по Y, показывающий, на сколько единиц в среднем изменяется переменная Х при увеличении переменной У на одну единицу;

- выборочная дисперсия переменной У.