Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции по математической статистике.doc
Скачиваний:
250
Добавлен:
13.05.2015
Размер:
1.34 Mб
Скачать

§ 5. Регрессионный анализ. Условные средние. Выборочные уравнения регрессии.

При рассмотрении многомерных случайных величин рассматривались условные законы распределения и их числовые характеристики: математическое ожидание, дисперсия и различные моменты. Оценками этих величин служат их выборочные аналоги. Наиболее важными являются условные математические ожидания, вычисленные по выборке – условные средние.

Условное среднее – среднее арифметическое значений случайной величины Y, наблюдавшихся при фиксированном значении случайной величины X= x.

Условное среднее – среднее арифметическое значений случайной величины X, наблюдавшихся при фиксированном значении случайной величины Y = y.

Напомним определение уравнения регрессии:

условное математическое ожидание является функциейx.

Эта функция f (x)называется функцией регрессии Y на X, а ее график – линией регрессии.

Выборочный аналог этого уравнения,, называетсявыборочным уравнением регрессии Y на X, функциявыборочной функцией регрессии Y на X, ее график – выборочной линией регрессии Y на X.

Аналогично определяются выборочные характеристики и для регрессии X на Y.

§ 6. Корреляционная таблица. Выборочные линии регрессии.

Пусть в результате эксперимента для системы (Х,Y) получена выборка значений .

Если значения х и y повторяются, то их группируют

Здесь и – наблюдаемые значения X и Y, а – частота появления пары значений.

Чаще всего в этом случае данные организуют в виде корреляционной таблицы:

X

Y

….

….

Группируя данные по значениям или :

по данным корреляционной таблицы можно составить законы распределения составляющих (последняя строка и последний столбец таблицы) и их средние по выборки и.

и .

Для наглядности данные таблицы изображают графически. Каждую пару (xi,yj)изображают точкой в системе координат (ХОY). Частоту , с которой данная пара встречается в таблице, изображают соответствующим числом близко расположенных точек либо пишут числовозле одной точки. Построенное таким образом в системе координат изображение корреляционной таблицы называютполем корреляции. Также возможно изображать данные таблицы кругами, центр которых находится в точке (xi,yj), а диаметр (или площадь) пропорционален .

Точка в системе координат (ХОY) с координатами называетсяцентром рассеивания.

Можно также составить условные законы распределения, например Y при Х=или Х приY=.

….

…..

Зная условные законы распределения, можно найти условные средние:

и т.п.Построим в системе координат (ХОY) точки

и соединим их отрезками прямых. Полученную ломаную называют

выборочной линией регрессии Y на X.

Если распределения случайных величин X и (или) Y заданы интервальным вариационным рядом, то удобно перейти к вспомогательным переменным, значения которых совпадают с серединами интервалов.

Кроме того, если варианты(значения вариационного ряда) являются равноотстоящими, т.е., образуют арифметическую прогрессию с разностью h, бывает удобно перейти к условным вариантам:

,

где C ложный нуль (новое начало отсчета),

h шаг, т.е. разность между двумя соседними первоначальными вариантами (новая единица масштаба).

Если в качестве ложного нуля взята какая-то из вариант , то условные варианты- целые числа, что упрощает вычисления