Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
тема1-4.doc
Скачиваний:
21
Добавлен:
24.11.2019
Размер:
1.56 Mб
Скачать

3 Выборочная ковариация. Выборочная дисперсия. Коэффициент корреляции

3.1 Выборочная ковариация

Для изложения идей и понятий регрессионного анализа необходимо ввести понятия ковариации и корреляции [5,15].

Различают выборочную и теоретическую ковариацию.

Выборочной ковариацией двух переменных х и у называется средняя величина произведения отклонений этих переменных от своих средних, т.е.

Или ,

где , - выборочные средние переменных х и у.

Выборочная ковариация является мерой взаимосвязи между двумя переменными.

Пусть данные наблюдений переменных х и у представлены в виде точечного графика - диаграммы рассеяния наблюдений (рисунок 3.1).

Точка на диаграмме является центром рассеяния переменных (центром тяжести совокупности точек, представляющих наблюдения).

Вертикальная и горизонтальная прямые, проведенные через точку разделяют диаграмм рассеяния на 4 области. Наблюдения в I и III областях дают положительный вклад ковариацию, а во II и IV областях - отрицательный.

Если положительные вклады преобладают над отрицательными, то ковариация будет положительной, в противном случае она будет отрицательной.

Рисунок 3.1

При положительной (прямой) связи с увеличением одной переменной другая переменная в среднем также увеличивается и наоборот при отрицательной связи.

Правила расчета ковариации.

1) .

2) Если , то .

3) , где а –const.

4) , где b-const.

5) .

Теоретической ковариацией случайных величин и называется математическое ожидание произведения отклонений этих величин от их средних значений, т.е,

,

где .

В записи символ означает, что рассматривается по генеральной совокупности.

Свойства теоретической ковариации:

  1. если случайные величины и независимы, то

Доказательство:

Правила вычисления теоретической ковариации точно такие же, как и для выборочной ковариации.

Пример 3.1. В некоторой бюрократической стране годовой доход каждого индивида у определяется по формуле: у = 10000+500s + 200t, где s – число лет обучения индивида; t – трудовой стаж(в годах); х – возраст индивида. Рассчитать cov (x, y ), cov (x, s), и cov (x, t) для выборки из пяти индивидов, описанной в таблице 3.1, и проверьте, что cov(x, y) = 500cov(x, s) + 200cov(x, t).

Таблица 3.1

индивид

Возраст (годы), х

Годы обучения, s

Трудовой стаж, t

Доход, у

1

18

11

1

15700

2

29

14

6

18200

3

33

12

8

17600

4

35

16

10

20000

5

45

12

5

17000

n=5

Объясните аналитически, почему так происходит.

Решение.

Вычислим средние значения: , , , .

Cov(x, y) = 4840

Cov(x, y) = 500 cov(x, s) +200 cov(x, t) = 500*4+200*14.2 = 4840

4840 = 4840.