Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
лаб_мат_статист_4.doc
Скачиваний:
13
Добавлен:
17.08.2019
Размер:
584.19 Кб
Скачать

Статистика в Excel

Глава 4. Корреляция и регрессия

Большинство изучаемых величин и характеристик как в естествознании, так и социальных науках, являются зависимыми. Совокупность изучаемых величин подвержена, как правило, воздействию случайных факторов. В связи с этим возникают, помимо привычной строгой функциональной зависимости переменных величин, так называемая статистическая зависимость и ее частный случай – корреляционная. Изучение и анализ корреляционных связей позволяют сделать важные выводы, необходимые в практических целях.

§4.1. Статистическая и корреляционная зависимости. Коэффициент корреляции. Корреляционный момент

Виды зависимостей переменных величин.

Функциональной называется зависимость между двумя переменными величинами, при которой значению одной переменной величины соответствует одно определенное значение другой.

Статистической называется зависимость случайных величин, при которой каждому значению одной их них соответствует закон распределения другой, то есть изменение одной из величин влечет изменение распределения другой.

Корреляционной называется статистическая зависимость случайных величин, при которой изменение одной из величин влечет изменение среднего значения другой.

Условные средние. Линии регрессии.

Условным средним называется среднее арифметическое наблюдаемых значений величины Y, вычисленное при условии, что величина Х приняла конкретное фиксированное значение х.

Условным средним называется среднее арифметическое наблюдаемых значений величины Х, вычисленное при условии, что величина Y приняла конкретное фиксированное значение у.

Уравнение, связывающее наблюдаемые значения величины Х и условную среднюю величины Y, называется уравнением регрессии Y на Х:

.

Уравнение, связывающее наблюдаемые значения величины Y и условную среднюю величины Х, называется уравнением регрессии Х на Y:

.

Линии на координатной плоскости, соответствующие уравнениям регрессии называются линиями регрессии.

Корреляционные зависимости могут выражаться уравнениями регрессии различных видов: линейной, параболической, гиперболической, показательной и т.д.

Корреляционный момент и коэффициент корреляции.

Мерой корреляционной зависимости двух случайных величин Х и Y служит корреляционный момент (или ковариация), который вычисляется по формуле:

, (4.1)

где средние значения (здесь и в дальнейшем предполагается, что каждая пара значений (хi,yi) наблюдалась по одному разу):

, , . (4.2)

Если случайные величины Х и Y независимы, то для них mxy=0.

Из определения корреляционного момента следует, что его размерность равна произведению размерностей изучаемых величин, Это означает, что значение корреляционного момента двух величин зависит от выбора единиц измерения этих величин. Поэтому для оценки связи величин вводится другая величина, независящая от размерности измеряемых величин и называемая коэффициентом корреляции.

Коэффициентом корреляции двух измеряемых величин Х и Y называется величина:

, (4.3)

где sх и sу – стандартные отклонения соответственно величин Х и Y.

Поскольку размерность корреляционного момента равна произведению размерностей величин Х и Y, а стандартные отклонения имеют размерности этих величин, то коэффициент корреляции является безразмерной величиной, и поэтому он не зависит от выбора единиц измерения изучаемых величин.

Свойства коэффициента корреляции:

1) Если две случайные величины Х и Y независимы, то их коэффициент корреляции равен нулю, т.е. r=0.

2) Модуль коэффициента корреляции не превышает единицы, т.е. |r|£1, что эквивалентно двойному неравенству: -1£r£1.

Коэффициент корреляции, вычисленный по данным выборки, называется выборочным и обозначается rв.

Вычисление в Excel корреляционных характеристик.

Ковариация (корреляционный момент) (4.1) вычисляется в Excel с помощью стандартной статистической функции КОВАР. Аргументом этой функции являются диапазоны ячеек, содержащие значения наблюдаемых величин и . Например, если значения содержатся в интервале А1:А10, а значения содержатся в интервале В1:В10, то ковариация этих величин вычисляется по формуле: =КОВАР(А1:А10; В1:В10).

Коэффициент корреляции (4.3) вычисляется в Excel одной из двух функций: КОРРЕЛ или ПИРСОН. Эти функции выдают одинаковый результат, если значения наблюдаемых величин записаны в виде чисел. Аргументы у этих функций точно такие же, как и у функции КОВАР, т.е. КОРРЕЛ(А1:А10;В1:В10) или ПИРСОН(А1:А10;В1:В10).

Иногда необходимо вычислять квадрат коэффициента корреляции, для этого имеется функция КВПИРСОН, выдающая значение r2. Аргументы у этой функции такие же, как и у трех предыдущих.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]