4.Линейный регрессионный анализ.

Добавил:

guap4736_vkclub152685050 Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Национальный минерально-сырьевой университет «Горный»

Предмет:

Экономика

Файл:

РЕШЕНИИ ГЕОЛОГО-ГОРНО-ЭКОНОМИЧЕСКИХ ЗАДАЧ.pdf

Скачиваний:

Добавлен:

16.08.2019

Размер:

1.67 Mб

Скачать

☆

<<< < Предыдущая 1 23 / 103 4 5 6 7 8 9 10 > Следующая >>>

vk.com/club152685050 | vk.com/id446425943

2)Начальные относительно хо (условные),

3)Центральные.

1) Начальный момент при А=0

x	f
k
f		.
f

1а) Начальный момент нулевого порядка при к=0

	0	1.
	0

1б) Начальный момент первого порядка при к=1

		xf
		.
1		f

1в) Начальный момент второго порядка при к=2

	2
	x	f	2	.
	f			.
2	f
2

1г) Момент третьего порядка при к=3

	3	.
	3
3

1д) Момент четвёртого порядка при к=4

		.
	4
4

2) Начальный момент относительно хо при А=хо, где хо – произвольно выбранная величина из ряда распределения.

k	(x x0 )k f	.
	f

3) Центральный момент при А=х

	k	f
	(x x)
	f	.
k

минимуму функции f и находятся из уравнений частных производных

. Это необходимое условие, однако для положительной квадратической

А) Графический анализ простой линейной регрессии.

Простое линейное уравнение регрессии y=a+bx. Если между случайными величинами У и X существует корреляционная связь, то значение у = ý + ,

где ý – теоретическое значение у, полученное из уравнения ý = f(x),

– погрешность отклонения теоретического уравнения ý от фактических (экспериментальных) данных.

Уравнение зависимости средней величины ý от х, то есть ý = f(x) называют уравнением регрессии. Регрессионный анализ состоит из четырёх зтапов:

1)постановка задачи и установление причин связи.

2)ограничение объекта исследований, сбор статастической

информации.

vk.com/club152685050 | vk.com/id446425943

3) выбор уравнения связи на основе анализа и характера собранных данных.

4) расчёт числовых значений, характеристик корреляционной связи.

Если две переменные связаны таким образом, что изменение одной переменной соответствует систематическому изменению другой переменной, то для оценки и выбора уравнения связи между ними применяют регрессионный анализ в том случае, если эти переменные известны. В отличие от регрессионного анализа, корреляционный анализ применяют для анализа тесноты связи между X и У.

Рассмотрим нахождение прямой при регрессионном анализе:

Теоретическое уравнение регрессии.

Термин «простая регрессия» указывает на то, что величина одной переменной оценивается на основе знаний о другой переменной. В отличие от простой многофакторная регрессия применяется для оценки переменной на основе знания двух, трёх и более переменных. Рассмотрим графический анализ простой линейной регрессии.

Предположим, имеются результаты отборочных испытании по предварительному найму на работу и производительности труда.

№ п/п	Результаты отбора	Производительность
	(100 баллов), x	(20 баллов), y
1	88	17
2	85	16
3	72	13
4	93	18
5	70	11
6	74	14
7	78	15
8	93	19
9	82	16
10	92	20
11	79	14
12	84	15
13	71	12
14	77	13
15	87	19
16	87	17
17	72	10
18	77	12
19	82	14
20	76	13

vk.com/club152685050 | vk.com/id446425943

100

Нанеся точки на график, получим диаграмму (поле) рассеяния. Используем её для анализа результатов отборочных испытаний и производительности труда.

По диаграмме рассеяния проанализируем линию регрессии. В регрессионном анализе всегда указываются хотя бы две переменные. Систематическое изменение одной переменной связано с изменением другой.

Основная цель регрессионного анализа заключается в оценке величины одной переменной, если величина другой переменной известна. Для полной задачи важна оценка производительности труда.

Независимой переменной в регрессионном анализе называется величина, которая используется в качестве основы для анализа другой переменной. В данном случае – это результаты отборочных испытаний (по оси X).

Зависимой переменной называется оцениваемая величина (по оси У). В регрессионном анализе может быть только одна зависимая переменная и несколько независимых переменных.

Для простого регрессионного анализа зависимость можно представить в двухкоординатной системе (х и у), по оси X – независимая переменная, по оси У – зависимая. Наносим точки пересечения таким образом, чтобы на графике была представлена пара величин. График называют диаграммой рассеяния. Ее построение – это второй этап регрессионного анализа, поскольку первый – это выбор анализируемых величин и сбор данных выборки. Таким образом, регрессионный анализ применяется для статистического анализа. Связь между выборочными данными диаграммы линейная.

Для оценки величины переменной у на основе переменной х необходимо определить положение линии, которая наилучшим образом представляет связь между х и у на основе расположения точек диаграммы рассеяния. В нашем примере это анализ производительности. Линия, проведенная через точки рассеяния – линия регрессии. Одним из способов построения линии регрессии, основанном на визуальном опыте, является

vk.com/club152685050 | vk.com/id446425943

способ построения от руки. По нашей линии регрессии можно определить производительность труда. При нахождении уравнения линии регрессии

9
8				8
7
6		6
5
4		4
3
2	2
1
0
1	2	3	4	5
		y= a+bx

y= a-bx

часто применяют критерий наименьших квадратов. Наиболее подходящей является та линия, где сумма квадратов отклонений минимальна

	2
( y y)		min .

Математическое уравнение линии роста представляет закон роста в арифметической прогрессии:

у = а – bх.

Y = а + bх – приведённое уравнение с одним параметром является простейшим видом уравнения связи. Оно приемлемо для средних величин. Чтобы точнее выразить связь между х и у, вводится дополнительный коэффициент пропорциональности b, который указывает наклон линии регрессии.

– уравнение гиперболы,

– уравнение прямой,

vk.com/club152685050 | vk.com/id446425943

Б) Построение теоретической линии регрессии.

Процесс её нахождения заключается в выборе и обосновании типа кривой и расчётов параметров а, b, с и т.д. Процесс построения называют выравниванием, и запас кривых, предлагаемых мат. анализом, разнообразен. Чаще всего в экономических задачах используют семейство кривых, уравнения которые выражаются многочленами целых положительных степеней.

1) y a bx

2)		a	b
	y		x

3)			2
	y	a bx cx

– уравнение параболы,

где ý – ординаты теоретической линии регрессии.

Выбрав тип уравнения, необходимо найти параметры, от которых зависит это уравнение. Например, характер расположения точек в поле рассеяния показал, что теоретическая линия регрессии является прямой.

Диаграмма рассеяния позволяет представить производительность труда с помощью регрессионного анализа. В экономике с помощью регрессионного анализа предсказываются многие характеристики, влияющие на конечный продукт (с учётом ценообразования).

vk.com/club152685050 | vk.com/id446425943

В) Критерий наименьших кадратов для нахождения прямой линии.

Один из критериев, которые мы могли бы применить для подходящей линии регрессии на диаграмме рассеяния, основан на выборе линии, для которой сумма квадратов погрешностей будет минимальна.

	2	min .
( y y)		min .

Близость точек рассеяния к прямой измеряется ординатами отрезков. Отклонения этих точек могут быть положительными и отрицательными, но сумма квадратов отклонений теоретической прямой от экспериментальной всегда положительна и должна быть минимальна. Факт несовпадения всех точек рассеяния с положением линии регрессии указывает на существование расхождения между экспериментальными и теоретическими данными. Таким образом, можно сказать, что никакая другая линия регрессии, кроме той, которую нашли, не может дать меньшую сумму отклонений между экспериментальными и опытными данными. Следовательно, найдя теоретическое уравнение ý и линию регрессии, мы удовлетворяем требованию наименьших квадратов.

Это делается с помощью уравнения связи , используя формулы для y a bx

нахождения параметров а и b. Взяв теоретическое значение

ya bx

обозначив левую часть уравнения через f, получим функцию

f	( y a bx)	2

от неизвестных параметров а и b. Значения а и b будут удовлетворять

функции это является и достаточным условием для нахождения а и b.

Выведем из уравнений частных производных формулы параметров а и b:

	( y a bx) 0,
2

y na bx,

получим систему уравнений:

где x, y – среднеарифметические погрешности.

Подставив числовые значения,

Существует понятие	e	1	\| y
		n

найдем параметры а и b.

	\|
y	\|	100%	. Это коэффициент аппроксимации.
		100%	. Это коэффициент аппроксимации.
y

Если е < 33%, то модель приемлема для дальнейшего анализа; Если е > 33%, то берём гиперболу, параболу и т.д. Это даёт право для

анализа в различных ситуациях.

Вывод: по критерию коэффициента аппроксимации наиболее подходящей является та линия, для которых

vk.com/club152685050 | vk.com/id446425943

	2	min , и никакая другая линия регрессии для нашей задачи не
( y y)		min , и никакая другая линия регрессии для нашей задачи не

даёт минимум отклонений.

Г) Квадратическая ошибка оценки, проверка их типичности.

Применительно к совокупности, у которой число параметров исследования меньше 30 (n < 30), для проверки типичности параметров уравнения регрессии используется t-критерий Стьюдента. При этом вычисляется фактическое значение t-критерия:

t		a	n 2		.
	a

				Б


			( y y)
					2
Отсюда			n			.
			n
		( y y)
			2
	x		n	,
	x

где			– остаточная среднеквадратическая погрешность. Полученные ta

и tb сравнивают с критическим tk из таблицы Стьюдента с учётом принятого уровня значимости ( = 0,01 = 99% или = 0,05 = 95%). P = f = k1 = m – число параметров исследуемого уравнения (степень свободы). Например, если y = a + bx; m = 2, k2 = f2 = p2 = n – (m + 1), где n – количество исследуемых признаков.

ta < tk < tb.
Вывод: по проверенным на	типичность параметрам	уравнения
регрессии производится построение математической модели связи
			y a bx .
При этом параметры примененной	в анализе математической		функции

(линейная, гипербола, парабола) получают соответствующие количественные значения. Смысловое содержание полученных таким образом моделей состоит в том, что они характеризуют среднюю величину результативного признака Y y от факторного признака X.

Д) Криволинейная регрессия.

Довольно часто встречается криволинейная зависимость, когда между переменными устанавливается меняющееся соотношение. Интенсивность возрастания (убывания) зависит от уровня нахождения X. Криволинейная зависимость бывает разных видов. Например, рассмотрим зависимость между урожаем и осадками. С увеличением осадков при равных природных условиях интенсивное увеличение урожая, но до определенного предела. После критической точки осадки оказываются излишними, и урожайность катастрофически падает. Из примера видно, что вначале связь была положительной, а потом отрицательной. Критическая точка - оптимальный

<<< < Предыдущая 1 23 / 103 4 5 6 7 8 9 10 > Следующая >>>

Соседние файлы в предмете Экономика

#
06.09.20191.92 Mб0Открытие_ru_watermark.pdf
#
06.09.20194.02 Mб3ПЕРСПЕКТИВЫ РАЗВИТИЯ ГАЗОВОГО РЫНКА РОССИИ_watermark.pdf
#
15.08.20191.72 Mб1ПРЕДПРИЯТИЕ.pdf
#
10.08.2019202.62 Кб15Проектирование горных предприятий ответы.pdf
#
31.08.201973.89 Mб7Рекордные рублевые цены на сырье.pdf
#
16.08.20191.67 Mб0РЕШЕНИИ ГЕОЛОГО-ГОРНО-ЭКОНОМИЧЕСКИХ ЗАДАЧ.pdf
#
31.08.201924.87 Mб2рынок моды экономика.pdf
#
06.09.20193.91 Mб2Стратегия_KitFinance_IH2019_watermark.pdf
#
21.08.2019685.45 Кб1Сущность деятельности коммерческого банка.pdf
#
17.08.2019554.66 Кб2Управление персоналом.pdf
#
31.08.201920.82 Mб6финансовые потоки.pdf