- •Введение
- •Основные этапы эконометрического исследования:
- •Основные типы моделей:
- •Тема 1. Основные понятия теории вероятностей
- •1.1. Вероятностный эксперимент, событие, вероятность.
- •1.2. Случайные величины
- •1.3. Числовые характеристики св
- •Свойства математического ожидания:
- •Свойства дисперсии:
- •1.4. Законы распределений св
- •1. Закон равномерного распределения вероятностей
- •2. Нормальный закон распределения
- •3. Распределение
- •4. Распределение Стьюдента(t – распределение)
- •5. Распределение Фишера (f – распределение)
- •( Число степеней свободы)
- •Тема 2. Базовые понятия статистики.
- •2.1. Выборка и генеральная совокупность
- •2.2. Способы представления и обработки экономических данных
- •2.3. Статистические оценки параметров распределения
- •2.4. Статистическая проверка гипотез
- •Тема 3. Соотношения между экономическими переменными. Линейная связь. Корреляция
- •3.1. Коэффициент линейной корреляции
- •3.2. Оценка значимости (достоверности) коэффициента корреляции
- •Тема 4. Парная линейная регрессия. Метод наименьших квадратов
- •Тема 5. Оценка качества полученного уравнения (верификация)
- •5.1. Оценка общего качества уравнения регрессии
- •5.2. Оценка существенности параметров линейной регрессии и всего уравнения в целом
- •5.2.1. Анализ статистической значимости коэффициентов линейной регрессии
- •5.2.2. Анализ статистической значимости уравнения в целом. Распределение Фишера в регрессионном анализе
- •5.3. Проверка предпосылок, лежащих в основе мнк
- •5.3.1. Проверка первой предпосылки мнк
- •5.3.2. Проверка второй предпосылки мнк
- •5.3.3. Автокорреляция ошибок. Статистика Дарбина-Уотсона
- •Методы устранения автокорреляции. Авторегрессионное преобразование
- •5.3.4. Проверка гомоскедастичности дисперсии ошибок
- •Обобщенный метод наименьших квадратов (омнк)
- •Тема 6. Множественная корреляция и линейная регрессия
- •6.1. Спецификация модели. Отбор факторов при построении уравнения множественной регрессии
- •6.2. Метод наименьших квадратов (мнк)
- •6.3. Анализ качества эмпирического уравнения множественной линейной регрессии
- •Тема 7. Прогнозирование
- •7.1. Оценка прогнозных качеств модели
- •7.2. Интервалы прогноза по линейному уравнению регрессии
- •Тема 8. Нелинейные модели регрессии. Простейшие методы линеаризации
- •Тема 9. Фиктивные переменные в регрессионных моделях
- •Тема 10. Системы эконометрических уравнений
- •10.1. Общее понятие о системах уравнений, используемых в эконометрике
- •10.2. Структурная и приведенная формы модели
- •10.3. Проблема идентификации
- •Косвенный метод наименьших квадратов (кмнк);
- •Двухшаговый метод наименьших квадратов (дмнк);
- •Тема 11. Временные ряды в эконометрических исследованиях в.1. Выявление структуры временного ряда
2.4. Статистическая проверка гипотез
Статистической называют гипотезу о виде закона распределения или о параметрах известного распределения. В первом случае гипотеза непараметрическая, во втором – параметрическая.
Гипотеза Н0, подлежащая проверке, называется нулевой (основной). Наряду с нулевой рассматривают гипотезуН1, которая будет приниматься, если отклоняется Н0. Такая гипотеза называется альтернативной (конкурирующей). Например, если проверяется гипотеза о равенстве параметра Θ некоторому значению Θ0, т.е. Н0: Θ= Θ0, то в качестве альтернативной могут рассматриваться следующие гипотезы:
; ;;.
Выбор альтернативной гипотезы определяется конкретной формулировкой задачи.
Гипотезу называют простой, если она содержит одно конкретное предположение. Гипотезу называют сложной, если она состоит из конечного или бесконечного числа простых гипотез (;;).
Сущность проверки статистической гипотезы заключается в том, чтобы установить, согласуются или нет данные наблюдений и выдвинутая гипотеза. Эта задача решается с помощью специальных методов математической статистики – методов статической проверки гипотез.
При проверке гипотезы выборочные данные могут противоречить гипотезе Но. Тогда она отклоняется. Если же статистические данные согласуются с выдвинутой гипотезой, то она не отклоняется. В последнем случае часто говорят, что нулевая гипотеза принимается (такая формулировка не совсем точна, однако она широко распространена). Статистическая проверка гипотез на основании выборочных данных неизбежно связана с риском принятия ложного решения. При этом возможны ошибки двух родов.
Ошибка первого рода состоит в том, что будет отвергнута правильная нулевая гипотеза.
Ошибка второго рода состоит в том, что будет принята нулевая гипотеза, в то время как в действительности верна альтернативная гипотеза.
Возможные результаты статистических выводов представлены следующей таблицей:
Результаты про верки гипотезы |
Возможные состояния гипотезы | |
|
| |
верна Но |
верна Н1 | |
Гипотеза Но отклоняется |
Ошибка первого рода |
Правильный вывод |
Гипотеза Но не отклоняется |
Правильный вывод |
Ошибка второго рода |
Последствия указанных ошибок неравнозначны. Первая приводит к более осторожному, консервативному решению, вторая - к неоправданному риску. Что лучше или хуже - зависит от конкретной постановки задачи и содержания нулевой гипотезы. Например, если Но состоит в признании продукции предприятия качественной и допущена ошибка первого рода, то будет забракована годная продукция. Допустив ошибку второго рода, мы отправим потребителю брак. Очевидно, последствия второй ошибки более серьезны с точки зрения имиджа фирмы и ее долгосрочных перспектив.
Исключить ошибки первого и второго рода невозможно в силу ограниченности выборки. Поэтому стремятся минимизировать потери от этих ошибок. Отметим, что одновременное уменьшение вероятностей данных ошибок невозможно, так как задачи их уменьшения являются конкурирующими, и снижение вероятности допустить одну из них влечет за собой увеличение вероятности допустить другую. В большинстве случаев единственный способ уменьшения вероятности ошибок состоит в увеличении объема выборки.
Вероятность совершить ошибку первого рода принято обозначать буквой α, и ее называют уровнем значимости. Вероятность совершить ошибку второго рода обозначают β. Тогда вероятность не совершить ошибку второго рода (1 - β) называется мощностью критерия.
Обычно значения α задают заранее, «круглыми» числами (например, 0,1; 0,05; 0,01 и т.п.), а затем стремятся построить критерий наибольшей мощности. Таким образом, если α = 0,05, то это означает, что исследователь не хочет совершить ошибку первого рода более чем в 5 случаях из 100.
Проверку статистической гипотезы осуществляют на основании данных выборки. Для этого используют специально подобранную СВ (статистику, критерий), точное или приближенное значение которой известно. Эту величину обозначают:
U (или Z) - если она имеет стандартизированное нормальное распределение;
T - если она распределена по закону Стьюдента;
- если она распределена по закону ;
F - если она имеет распределение Фишера.
В целях общности будем обозначать такую СВ через К.
Таким образом, статистическим критерием называют СВ К, которая служит для проверки нулевой гипотезы. После выбора определенного критерия множество всех его возможных значений разбивают на два непересекающихся подмножества: одно из них содержит значения критерия, при которых нулевая гипотеза отклоняется, другое - при которых она не отклоняется.
Совокупность значений критерия, при которых нулевую гипотезу отклоняют, называют критической областью. Совокупность значений критерия, при которых нулевую гипотезу не отклоняют, называют областью принятия гипотезы.
Основной принцип проверки статистических гипотез можно сформулировать так: если наблюдаемое значение критерия К (вычисленное по выборке) принадлежит критической области, то нулевую гипотезу отклоняют. Если же наблюдаемое значение критерия К принадлежит области принятия гипотезы, то нулевую гипотезу не отклоняют (принимают).
Точки, разделяющие критическую область и область принятия гипотезы, называют критическими.
Перейдем к определению критических точек, а следовательно, и критической области.
В основу этого определения положен принцип практической невозможности маловероятных событий (принцип практической уверенности): если вероятность события А в данном испытании очень мала, то при однократном выполнении испытания можно быть уверенным в том, что событие А не произойдёт, и в практической деятельности вести себя так, как будто событие А вообще невозможно. Этот принцип не может быть доказан математически, но подтверждается всем практическим опытом человеческой деятельности. Например, отправляясь в путешествие самолётом, мы не рассчитываем погибнуть в авиационной катастрофе, хотя некоторая (весьма малая) вероятность такого события существует. Заметим, что принцип сформулирован лишь «при однократном выполнении испытания». При многократном повторении испытаний мы уже не можем считать маловероятное событие А практически невозможным.
Пусть для проверки нулевой гипотезы Но служит критерий К. Тогда вероятность того, что СВ К попадет в произвольный интервал ),можно найти по формуле: , а.
3ададим вероятность α настолько малой (0,05; 0,01), чтобы попадание СВ К за пределы интервала можно было бы считать маловероятным событием. Тогда, исходя из принципа практической невозможности маловероятных событий, можно считать, что если Но справедлива, то при ее проверке с помощью критерия К по данным одной выборки наблюдаемое значение К должно наверняка попасть в интервал . Если же наблюдаемое значение К попадает за пределы указанного интервала, то произойдет маловероятное, практически невозможное событие. Это дает основание считать, что с вероятностью 1 - α нулевая гипотеза Н0 несправедлива.
Точки являются критическими.
Область принятия гипотезы |
Критическая область называется двусторонней критической областью. Она определяется в случае, когда альтернативная гипотеза имеет вид: .
|
Кроме двусторонней, рассматривают также односторонние критические области - правостороннюю и левостороннюю.
|
Правосторонней называют критическую область, определяемую из соотношения . Она используется в случае, когда альтернативная гипотеза имеет вид: .
|
|
Левосторонней называют критическую область , определяемую из соотношения . Она используется в случае, когда альтернативная гипотеза имеет вид: .
|
Общая схема проверки гипотез:
1. Формулировка проверяемой (нулевой - Но) и альтернативной (Н1) гипотез.
Выбор соответствующего уровня значимости α.
Определение объема выборки п.
Выбор критерия К для проверки Н0.
Определение критической области и области принятия гипотезы.
Вычисление наблюдаемого значения критерия Кнабл.
Принятие статистического решения.