Лабы / лень сортировать / 2015 г / Анализ СД на ПК
.pdf20,00
15,00
10,00
5,00
0,00
-5,00
0,0 |
1,0 |
2,0 |
3,0 |
4,0 |
5,0 |
6,0 |
Рисунок 6 – Диаграмма рассеяния случайных величин X и Y
Характер расположения точек на диаграмме рассеяния позволяет сделать предположение о логарифмической регрессионной зависимости вида
|
(x) = β0 + β1 ln x . |
(19) |
y |
Оценки параметров β0 и β1 найдём методом наименьших квадратов. Для этого составим функцию S (см. (3)), которая в случае логарифмической регрессии примет вид
n |
n |
n |
|
||
S(β0 ,β1) = ∑(yi − |
|
(xi ))2 |
= ∑ei2 |
= ∑[yi − (β0 + β1 ln xi )]2 . |
(20) |
y |
|||||
i=1 |
i=1 |
i=1 |
|
Для отыскания оценок параметров β0 и β1, минимизирующих функцию S(β0 , β1), составим и решим систему нормальных уравнений:
|
∂S(β0,β1) |
|
|
|
n |
|
n |
||
= 0; |
− 2∑[yi |
− (β0 + β1 ln xi )] = 0; |
∑[yi − (β0 + β1 ln xi )] = 0; |
||||||
|
∂β0 |
|
|||||||
|
|
|
|
i=1 |
|
i=1 |
|||
|
∂S(β β ) |
|
|
|
n |
|
n |
||
|
0, |
1` |
= 0, |
− 2∑[yi |
− (β0 + β1 ln xi )]ln xi |
= 0, ∑[yi − (β0 + β1 ln xi )]ln xi = 0, |
|||
|
∂β |
|
|||||||
|
1 |
|
|
|
i=1 |
|
i=1 |
||
|
|
|
|
|
|||||
|
|
|
|
|
n |
n |
|
||
|
|
|
|
|
∑yi −β0n −β1∑ln xi = 0; |
||||
|
|
|
|
|
i=1 |
i=1 |
(21) |
||
|
|
|
|
|
n |
n |
|||
|
|
|
|
|
|
n |
|||
|
|
|
|
|
∑yi ln xi −β0 ∑ln xi −β1∑ln2 xi = 0. |
||||
|
|
|
|
|
|
|
i=1 |
i=1 |
|
|
|
|
|
|
i=1 |
Результаты вычислений сведём в таблицу 5.
60
Таблица 5 – Результаты промежуточных вычислений
N |
xi |
yi |
lnxi |
ln2xi |
yi lnxi |
|
y |
(xi) = β0 +β1 ln xi |
1 |
1,0 |
7,34 |
0,0000 |
0,0000 |
0,000 |
|
6,383 |
|
2 |
1,5 |
11,46 |
0,4055 |
0,1644 |
4,648 |
|
9,148 |
|
3 |
4,0 |
15,35 |
1,3863 |
1,9218 |
21,286 |
|
15,835 |
|
4 |
2,5 |
16,02 |
0,9163 |
0,8396 |
14,678 |
|
12,631 |
|
5 |
1,0 |
3,50 |
0,0000 |
0,0000 |
0,000 |
|
6,383 |
|
6 |
0,5 |
4,95 |
–0,6931 |
0,4805 |
–3,433 |
|
1,657 |
|
7 |
3,0 |
13,43 |
1,0986 |
1,2069 |
14,749 |
|
13,874 |
|
8 |
2,0 |
7,31 |
0,6931 |
0,4805 |
5,065 |
|
11,109 |
|
9 |
0,5 |
–0,87 |
–0,6931 |
0,4805 |
0,600 |
|
1,657 |
|
10 |
5,0 |
17,54 |
1,6094 |
2,5903 |
28,224 |
|
17,357 |
|
|
|
|
|
|
|
|
|
|
Σ |
|
96,04 |
4,7230 |
8,1644 |
85,815 |
|
|
|
|
|
После подстановки значений система уравнений (21) примет вид: |
||||||||
|
|
96,04 − β0 |
10 − β1 |
4,723 = 0; |
|
10β0 + 4,723β1 = 96,04; |
||||
|
|
|
− β |
0 4,723−β1 8,1644 = 0, |
|
+ 8,1644β1 = 85,815. |
||||
|
|
85,815 |
|
4,723β0 |
||||||
|
|
Выразив β0 из первого уравнения и подставив во второе, получим: |
||||||||
β |
0 |
= 96,04 − 4,723β1 = 9,604 − 0,4723β ; |
|
|
48,8688 |
|
||||
|
|
10 |
|
|
1 |
откуда |
β1 = |
|
= 6,8183 ; |
|
|
|
|
|
|
|
5,9337 |
||||
4,723(9,604 − 0,4723β ) + 8,1644β = 85,815, |
|
|
||||||||
|
|
|
||||||||
|
|
|
|
1 |
1 |
|
|
|
|
|
|
|
|
|
β0 = 9,604 − 0,4723 6,8183 = 6,3833 . |
|
|
||||
|
|
Таким образом, оценки параметров уравнения регрессии |
ˆ |
|||||||
|
|
β0 = 6,3833 ; |
ˆ1 6,8183 .
β =
На рисунке 7 представлена диаграмма рассеяния значений случайных величин X и Y с нанесённой линией регрессии.
20,00 |
|
|
|
|
|
|
15,00 |
|
|
|
|
|
|
10,00 |
|
|
|
|
|
|
5,00 |
|
|
|
|
|
|
0,00 |
|
|
|
|
|
|
-5,00 |
|
|
|
|
|
|
0,0 |
1,0 |
2,0 |
3,0 |
4,0 |
5,0 |
6,0 |
Рисунок 7 – Диаграмма рассеяния случайных |
||||||
величин X и Y с нанесённой линией регрессии |
61
Оценим качество описания зависимости между величиной инвестиций Х и прибыли Y полученным уравнением регрессии с помощью коэффициента детерминации (10),
|
|
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
∑( |
|
(xi ) − |
|
)2 |
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
ˆ2 |
|
y |
y |
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
= |
i=1 |
, |
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
R |
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
∑(yi − |
|
)2 |
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
y |
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
i=1 |
|
|
|
|
|
||||||
где |
|
|
(xi ) = β0 + β1 ln xi |
– значение величины |
прибыли, предсказываемое |
|||||||||||||||||
y |
||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
уравнением регрессии, соответствующее значе- |
|||||||||||||
|
|
|
|
|
|
|
|
|
нию xi инвестиции (см. таблицу 5); |
|
|
|||||||||||
|
|
|
|
|
|
|
1 |
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
= |
∑ yi |
– среднее значение величины прибыли; |
|
|
||||||||||||
|
|
|
y |
|
|
|||||||||||||||||
|
|
|
|
|
|
|
|
|||||||||||||||
|
|
|
|
|
|
|
n i=1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ˆ 2 |
= |
|
(6,383− 9,604)2 + (9,148 − 9,604)2 +L+ (17,357 − 9,604) |
2 |
= |
275,8568 |
= |
|||||||||||||||
R |
|
|
|
|
||||||||||||||||||
|
(7,34 − 9,604)2 + (11,46 − 9,604)2 +L+ (17,54 − 9,604)2 |
|
334,081 |
|||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
= 0,8257. |
|
|
|
|
|
|
|
|
Расчётное значение коэффициента детерминации Rˆ 2 = 0,8257 указывает на удовлетворительность описания зависимости между величиной инвестиций Х и прибыли Y, выбранным уравнением регрессии. Проверим, однако, значимость оценки коэффициента детерминации с помощью статистики Фишера
ˆ |
|
10 − 2 |
|
||
F = 0,8257 |
|
= 37,9 . |
|
||
(2 −1)(1− 0,8257) |
|
||||
Критическое значение |
статистики |
Фишера для |
степеней свободы |
||
ν1 = 2 – 1= 1 и ν2 = 10 – 2 = 8 |
и уровня |
значимости |
α = 0,05 составляет |
F0,05;1;8 = 5,317 . Поскольку расчётное значение статистики Фишера больше
критического ( Fˆ = 37,9 > 5,317 = F0,05;1;8 ), то вычисленный коэффициент детерминации значимо отличается от нуля, и выбранное уравнение регрессионной зависимости между величинами инвестиций и прибыли может быть использовано в экономических исследованиях (в частности, для предсказания величины прибыли).
62
ПОРЯДОК ВЫПОЛНЕНИЯ РАБОТЫ
1 Изучить теоретические сведения.
2 Получить у преподавателя выборки значений двух исследуемых случайных величин.
3 Создать в ППП STATGRAPHICS файл с выборками исследуемых случайных величин (см. приложение А, п. 2).
4 По заданной двумерной выборке построить диаграмму рассеяния с помощью ППП STATGRAPHICS (приложение А, п. 10).
5 По виду корреляционного поля сделать предположение о форме регрессионной зависимости между исследуемыми случайными величинами.
6 Найти параметры предполагаемого уравнения регрессии вручную методом наименьших квадратов.
7 Оценить качество описания зависимости между исследуемыми случайными величинами и выбранным уравнением регрессии с помощью коэффициента корреляции (в случае линейной зависимости), или с помощью коэффициента детерминации (в случае нелинейной зависимости).
8 Выполнить регрессионный и корреляционный анализ в ППП
STATGRAPHICS с помощью процедуры «Multiple Regression» (см. приложение А, п. 8). Сделать распечатку результатов анализа и уравнения регрессии (приложение А, п. 5).
9 Сравнить результаты ручного расчета и компьютерного анализа.
10 Проверить значимость полученного значения коэффициента корреляции (или детерминации) для ручного и компьютерного расчета.
11 Сформулировать общие выводы о зависимости между исследуемыми случайными величинами.
КОНТРОЛЬНЫЕ ВОПРОСЫ
1 Какая зависимость называется функциональной? Какая зависимость называется статистической? Привести примеры.
2 Какие случайные величины называются независимыми? Привести примеры.
3 Для чего необходим анализ зависимостей между случайными величинами?
4 Что изучает регрессионный и корреляционный анализ?
5 Какая зависимость называется регрессионной?
6 Для чего применяется метод наименьших квадратов?
7 Сформулируйте идею аппроксимации опытных точек на диаграмме рассеяния методом наименьших квадратов.
8 Что характеризует коэффициент корреляции? На что указывают его возможные значения?
9 Что характеризует коэффициент детерминации? На что указывают его возможные значения?
10 Укажите назначение проверки значимости оценки коэффициента корреляции (детерминации).
63
ПРИЛОЖЕНИЕ А (справочное)
Работа с пакетом STATGRAPHICS Plus for Windows
1 Запуск пакета STATGRAPHICS Plus
1.1Нажать кнопку «Start» («Пуск»).
1.2В разделе «Программы» выбрать «STATGRAPHICS Plus».
1.3. В разделе «STATGRAPHICS Plus» выбрать «Sgwin». Откроется рабочее окно пакета STATGRAPHICS (рисунок А.1).
Главное меню Основная панель элементов
Окно исходных данных
Окно статистического отчета
Рисунок А.1 – Рабочее окно пакета STATGRAPHICS
2 Создание файла выборок значений исследуемых величин
2.1Для ввода значений элементов выборок развернуть окно исходных данных «untitled» (см. рисунок А.1).
2.2В столбцах открывшегося окна (рисунок А.2) ввести значения элементов одной или нескольких выборок.
2.3Для изменения имени и формата значений элементов выборки, принятых по умолчанию, выделить столбец-выборку нажатием левой клавиши мыши на заголовке колонки. Затем нажать правую клавишу мыши и в появившемся всплывающем меню выбрать пункт «Modify Column». В появившемся окне «Modify Column» (см. рисунок А.2) задать новые желаемые значения.
64
Новое имя выборки
Тип
элементов
выборки
Рисунок А.2 – Ввод исходных данных
2.4 Для записи файла данных на диск, в главном меню выбрать пункт «File»→«Save As…»→«Save Data File As…». В стандартном диалоговом окне Windows указать каталог и имя создаваемого файла данных. Созданный файл данных получит расширение «sf3» или «sf».
2.5 Пакет STATGRAPHICS позволяет наряду с файлом данных сохранять настройки и результаты анализа данных в файле проекта исследования. Для этого необходимо выбрать в главном меню пункт «File»→«Save As…»→«Save StatFolio As…». В стандартном диалоговом окне Windows указать каталог и имя создаваемого файла проекта. Созданный файл будет иметь расширение «sfp».
3 Использование существующего файла данных
3.1Для открытия и использования существующего файла данных в главном меню выбрать раздел «File»→«Open»→«Open Data File…».
3.2В стандартном диалоговом окне Windows указать каталог и имя существующего файла данных. При этом данные автоматически будут помещены в окно исходных данных (см. рисунок А.1).
3.3Если наряду с исходными данными был сохранен файл проекта статистического исследования (файл «sfp»), то вместо пункта
«File»→«Open»→«Open Data File…» следует выбрать пункт «File»→
65
→ «Open»→ «Open StatFolio…». Файл исходных данных будет открыт при этом автоматически.
4 Вычисление оценок числовых характеристик и построение гистограммы (столбцовой диаграммы) исследуемой случайной величины
4.1Создать новый или открыть существующий файл исходных данных (элементов выборки исследуемой величины).
4.2В главном меню выбрать раздел «Describe»→«Numeric Data»→«OneVariable Analysis» (одномерный анализ).
4.3В появившемся окне «One-Variable Analysis» (рисунок А.3) выбрать (из списка) для исследования одну из доступных выборок, указав ее имя в поле «Data». Нажать кнопку «OK».
Список |
Имя исследуемой |
|
выборки |
||
доступных |
||
|
||
выборок |
|
Рисунок А.3 – Окно указания исследуемой выборки (выбора переменной)
4.4В появившемся окне результатов одномерного анализа (рисунок А.4) нажать кнопку выбора таблиц. В появившемся окне «Tabular Options» выбрать пункт «Summary Statistics» (основные статистики), выделение других пунктов отменить. Нажать кнопку «OK».
4.5В окне результатов одномерного анализа (см. рисунок А.4) нажать кнопку выбора графиков. В появившемся окне «Graphical Options» выбрать пункт «Frequency Histogram» (частотная гистограмма/столбцовая диаграмма), выделение других пунктов отменить. Нажать кнопку «OK». Окно результатов одномерного анализа примет вид, соответствующий рисунку А.5.
4.6Для определения оценок числовых характеристик следует на панели «Summary Statistics» нажать правую кнопку мыши и во всплывающем меню выбрать пункт «Pane Options».
4.7В появившемся окне (рисунок А.6) следует указать интересующие исследователя числовые характеристики. Для оценки всех основных числовых характеристик нажать кнопку «All». Выбор завершить нажатием кнопки «OK», после чего на панели «Summary Statistics» окна результатов одномерного анализа (см. рисунок А.5) «One-Variable Analysis» появятся значения
66
оценок указанных числовых характеристик. Перевод англоязычных статистических терминов представлен в таблице А.1.
Выбор Выбор графиков таблиц
Выбор
переменной
Панель
«Summary
Statistics»
Рисунок А.4 – Одномерный анализ данных
Панель
«Histogram»
Панель
«Summary
Statistics»
Рисунок А.5 – Окно результатов одномерного анализа
67
Рисунок А.6 – Окно выбора оцениваемых числовых характеристик
Таблица А.1 – Перевод англоязычных терминов одномерного статистического анализа
Count |
Объем выборки |
Average |
Математическое ожидание |
Median |
Медиана |
Mode |
Мода |
Geometric mean |
Геометрическое среднее |
Variance |
Дисперсия |
Std. Deviation |
Среднеквадратическое (стандартное) отклонение |
|
|
Std. Error |
Стандартная ошибка |
Minimum |
Минимальное значение выборки |
Maximum |
Максимальное значение выборки |
Range |
Размах выборки |
Lower quartile |
Нижний квартиль |
Upper quartile |
Верхний квартиль |
Interquar. range |
Межквартильный размах выборки |
Skewness |
Коэффициент асимметрии |
Std. skewness |
Стандартизованный коэффициент асимметрии |
Kurtosis |
Коэффициент эксцесса |
Std. kurtosis |
Стандартизованный коэффициент эксцесса |
Coeff. of Variation |
Коэффициент вариации |
Sum |
Сумма элементов выборки |
4.8 Для изменения параметров частотной гистограммы (столбцовой диаграммы) на панели «Histogram» окна «One-Variable Analysis» следует нажать правую кнопку мыши и во всплывающем меню выбрать пункт «Pane Options». В появившемся окне параметров гистограммы «Frequency Plot Options» (рисунок А.7) следует указать необходимое количество интервалов/столбцов (в поле «Number of Classes»), левую границу первого интервала (в поле «Lower Limit») и правую границу последнего интервала (в поле
68
«Upper Limit»). Выбор завершить нажатием кнопки «OK», после чего на панели «Histogram» окна результатов одномерного анализа (см. рисунок А.5) появится обновленная гистограмма (столбцовая диаграмма).
Рисунок А.7 – Окно выбора параметров гистограммы (столбцовой диаграммы)
5 Печать результатов статистического анализа
5.1Для установки принтера следует выбрать в главном меню STATGRAPHICS пункт «File»→«Print Setup…» и подключить желаемый принтер.
5.2Для распечатки результатов анализа необходимо нажать правую кнопку мыши на соответствующей панели или окне статистического анализа
иво всплывающем меню выбрать пункт «Print».
5.3В появившемся диалоговом окне следует убедиться в успешном подключении нужного принтера и нажать кнопку «OK».
6 Определение доверительного интервала для математического ожидания и среднеквадратического отклонения случайной величины
6.1Для определения доверительного интервала (интервальной оценки) для математического ожидания и среднеквадратического отклонения исследуемой случайной величины необходимо выполнить действия из подп. 4.1–
4.3приложения А.
6.2В появившемся окне результатов одномерного анализа «OneVariable Analysis» (см. рисунок А.4) нажать кнопку выбора таблиц. В появившемся окне «Tabular Options» выбрать пункт «Confidence Intervals» (доверительные интервалы), выделение других пунктов отменить. Нажать кнопку «OK».
6.3В окне результатов одномерного анализа «One-Variable Analysis» (см. рисунок А.4) нажать кнопку выбора графиков. В появившемся окне «Graphical Options» отменить все выделения. Нажать кнопку «OK». Окно
69