Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Самарский национальный исследовательский университет им. ак. С.П. Королёва (бывш. СГАУ, СамГУ)

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

ниче неменяю всё есть.docx

Скачиваний:

Добавлен:

22.09.2019

Размер:

665.08 Кб

Скачать

☆

<<< < Предыдущая 1 23 / 93 4 5 6 7 8 9 > Следующая >>>

Критерий Стьюдента (t-критерий)

Критерий позволяет найти вероятность того, что оба средних значения в выборке относятся к одной и той же совокупности. Данный критерий наиболее часто используется для проверки гипотезы: «Средние двух выборок относятся к одной и той же совокупности».

При использовании критерия можно выделить два случая. В первом случае его применяют для проверки гипотезы о равенстве генеральных средних двух независимых, несвязанных выборок (так называемый двухвыборочный t-критерий). В этом случае есть контрольная группа и экспериментальная (опытная) группа, количество испытуемых в группах может быть различно.

Во втором случае, когда одна и та же группа объектов порождает числовой материал для проверки гипотез о средних, используется так называемый парный t-критерий. Выборки при этом называют зависимыми, связанными.

А) случай независимых выборок

Статистика критерия для случая несвязанных, независимых выборок равна:

(1)

где , — средние арифметические в экспериментальной и контрольной группах,

- стандартная ошибка разности средних арифметических. Находится из формулы:

, (2)

где n₁ и n₂ соответственно величины первой и второй выборки.

Если n₁=n₂, то стандартная ошибка разности средних арифметических будет считаться по формуле:

(3)

где n величина выборки.

Подсчет числа степеней свободы осуществляется по формуле:

k = n₁ + n₂ – 2. (4)

При численном равенстве выборок k = 2n - 2.

Далее необходимо сравнить полученное значение t_эмп с теоретическим значением t—распределения Стьюдента (см. приложение к учебникам статистики). Если t_эмп<t_крит, то гипотеза H₀ принимается, в противном случае нулевая гипотеза отвергается и принимается альтернативная гипотеза.

Случай связанных (парных) выборок

В случае связанных выборок с равным числом измерений в каждой можно использовать более простую формулу t-критерия Стьюдента.

Вычисление значения t осуществляется по формуле:

(5)

где — разности между соответствующими значениями переменной X и переменной У, а d - среднее этих разностей;

Sd вычисляется по следующей формуле:

(6)

Число степеней свободы k определяется по формуле k=n-1. Рассмотрим пример использования t-критерия Стьюдента для связных и, очевидно, равных по численности выборок.

Если t_эмп<t_крит, то нулевая гипотеза принимается, в противном случае принимается альтернативная.

8. Множественная регрессия

Множественная регрессия

Обобщением линейной регрессионной модели с двумя переменными является многомерная регрессионная модель (или модель множественной регрессии). Пусть n раз измерены значения факторов x₁ , x₂ , ..., x_k и соответствующие значения переменной y; предполагается, что

y_i = b _o + b ₁x_i1 + ... + b _kx_ik+  _i , i = 1, ..., n, (12)

(второй индекс у х относится к номеру фактора, а первый - к номеру наблюдения); предполагается также, что

M _i= 0, M = ²,

M( _i_j) = 0, i не равно j, (12a)

т.е.  _i- некоррелированные случайные величины. Соотношения (12) удобно записывать в матричной форме:

Y = X +  , (13)

где Y = (y₁, ..., y_k)^T - вектор-столбец значений зависимой переменной, Т - символ транспонирования,  = ( ₀,  ₁, ...,  _k)^T- вектор-столбец (размерности k) неизвестных коэффициентов регрессии,  = ( ₁ , ...,  _n)^T - вектор случайных отклонений,

-матрица n x (k + 1); в i - й строке (1, x_i1, ...,x_ik) находятся значения независимых переменных в i-м наблюдении первая переменная - константа, равная 1.

Оценка коэффициентов регрессии. Построим оценку для вектора  так, чтобы вектор оценок = Х зависимой переменной минимально (в смысле квадрата нормы разности) отличался от вектора Y заданных значений:

по .

Решением является (если ранг матрицы Х равен k +1) оценка

= (X^TX)^-1 X^TY (14)

Нетрудно проверить, что она несмещенная. Ковариационная (дисперсионная) матрица равна

D = ( - b ) ( - b )^T = s ² (X^TX)- ¹ = s ² Z , (15)

где обозначено Z = (X^TX)- ¹.

Справедлива

теорема Гаусса - Маркова. В условиях (12а) оценка (14) является наилучшей (в смысле минимума дисперсии) оценкой в классе линейных несмещенных оценок.

Оценка дисперсии  ²ошибок. Обозначим

e = Y - = Y - Х = [I - X (X^TX)- ¹ X^T] Y = BY (16)

вектор остатков (или невязок); B = I - X (X^TX)- ¹ X^T - матрица; можно проверить, что B² = B. Для остаточной суммы квадратов справедливо соотношение

M = M (n - k -1)  ² ,

откуда следует, что несмещенной оценкой для  ² является

s² = . (17)

Если предположить, что  _iв (12) нормально распределены, то справедливы следующие свойства оценок:

1) (n - k - 1) имеет распределение хи квадрат с n-k-1 степенями свободы;

2) оценки и s²независимы.

Как и в случае простой регрессии, справедливо соотношение:

или

T_ss = E_ss+ R_ss , (18)

в векторном виде:

где = . Поделив обе части на полную вариацию игреков

T_ss = , получим коэффициент детерминации

R² = (19)

Коэффициент R²показывает качество подгонки регрессионной модели к наблюдённым значениям y_i. Если R² = 0, то регрессия Y на x₁ , ..., x_k не улучшает качество предсказания y_i по сравнению с тривиальным предсказанием . Другой крайний случай R² = 1 означает точную подгонку: все e_i = 0, т.е. все точки наблюдений лежат на регрессионной плоскости. Однако, значение R²возрастает с ростом числа переменных (регрессоров) в регрессии, что не означает улучшения качества предсказания, и потому вводится скорректированный (adjusted) коэффициент детерминации

(20)

Его использование более корректно для сравнения регрессий при изменении числа переменных (регрессоров).

Доверительные интервалы для коэффициентов регрессии. Стандартной ошибкой оценки является величина , оценка для которой

s_j = , j = 0, 1, ..., k, (21)

где z_jj - диагональный элемент матрицы Z. Если ошибки  _iраспределены нормально, то, в силу свойств 1) и 2), приведенных выше, статистика

(22)

распределена по закону Стьюдента с (n - k - 1) степенями свободы, и потому неравенство

<= t_p s_j , (23)

где t_p - квантиль уровня (1 + P_Д) / 2 этого распределения, задает доверительный интервал для  _j с уровнем доверияР_Д.

Проверка гипотезы о нулевых значениях коэффициентов регрессии. Для проверки гипотезы Н₀ об отсутствии какой бы то ни было линейной связи между y и совокупностью факторов, Н₀:  ₁ =  ₂= ... =  _k = 0, т.е. об одновременном равенстве нулю всех коэффициентов, кроме коэффициента  ₀при константе, используется статистика

F = = = , (24)

распределенная, если Н₀верна, по закону Фишера с k и n - k - 1 степенями свободы. Н₀ отклоняется, если

F > F (k, n - k - 1), (25)

где F - квантиль уровня 1 -  .

Отбор наиболее существенных объясняющих переменных. Различные регрессии (с различным набором переменных) можно сравнивать по скорректированному коэффициенту детерминации (20): принять тот вариант регрессии, для которого максимален

11. Сезонные колебания

Первая гармоника:

Вторая гармоника: ,

где параметры гармоники равны: ,

, а₁=-219,65, а₂=31,67;

, b1=-87,36, b₂=34,64.

Задание: показать процесс выравнивания сезонных колебаний по ряду Фурье на условных месячных данных о численности персонала фирмы, связанной с переработкой сельскохозяйственной продукции.

<<< < Предыдущая 1 23 / 93 4 5 6 7 8 9 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
07.06.201535.84 Кб82НейропсихологияЛ3.doc
#
07.06.201570.66 Кб76НейропсихологияЛ4.doc
#
28.03.20165.12 Mб45Немов Р.С. Психологический словарь.pdf
#
04.05.201982.94 Кб2Неопределенность и риск.doc
#
07.05.2019130.56 Кб2неформалы курсач.doc
#
22.09.2019665.08 Кб10ниче неменяю всё есть.docx
#
16.03.2015254.2 Кб23Новая методичка по программированию ПМФ 2011.pdf
#
16.03.2015246.39 Кб24Новая методичка по программированию ПМФ 2012.pdf
#
11.11.20192.18 Mб5НОВАЯ_М_у_ЭКОНОМЕТРИКА_лаб практ_ГОД_2013.doc
#
16.03.20151.11 Mб390Новые_лекции_СИИ.doc
#
26.10.2018286.72 Кб6новый курсач.doc