Зависимость между признаками, измеренными в номинальной или порядковой шкалах

Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Международный государственный экологический университет им. А. Д. Сахарова

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

otvety_stat_metody.docx

Скачиваний:

Добавлен:

24.09.2019

Размер:

1.8 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 1415 / 2315 16 17 18 19 20 21 22 23 > Следующая >>>

Зависимость между признаками, измеренными в номинальной или порядковой шкалах

Часто возникает задача проверки независимости двух признаков, измеренных в номинальной или порядковой шкалах.

Пусть у каких-то объектов измеряются два признака X и Y с числом уровней r и s соответственно. Результаты таких наблюдений удобно представлять в виде таблицы, называемой таблицей сопряженности признаков.

В таблице u_i(i = 1, ..., r) и v_j(j= 1, ..., s) – значения, принимаемые признаками, величина n_ij – число объектов из общего числа объектов, у которых признак X принял значение u_i, а признак Y – значение v_j

В ведем следующие случайные величины:

– количество объектов, у которых встретилось значение u_i

– количество объектов, у которых встретилось значение v_j

Кроме того, имеют место очевидные равенства

Пусть далее

Дискретные случайные величины X и Y независимы тогда и только тогда, когда

для всех пар i, j

Поэтому гипотезу о независимости дискретных случайных величин X и Y можно записать так:

В качестве альтернативной, как правило, используют гипотезу

С удить о справедливости гипотезы H₀ следует на основании выборочных частот n_ij таблицы сопряженности. В соответствии с законом больших чисел при n→∞ относительные частоты близки к соответствующим вероятностям:

Для проверки гипотезы H₀ используется статистика

которая при справедливости гипотезы имеет распределение χ² с rs − (r + s − 1) степенями свободы.

Критерий независимости χ² отклоняет гипотезу H₀ с уровнем значимости α, если:

Регрессионный анализ. Основные понятия регрессионного анализа

Для математического описания статистических связей между изучаемыми переменными величинами следует решить следующие задачи:

подобрать класс функций, в котором целесообразно искать наилучшую (в определенном смысле) аппроксимацию интересующей зависимости;
найти оценки неизвестных значений параметров, входящих в уравнения искомой зависимости;
установить адекватность полученного уравнения искомой зависимости;
выявить наиболее информативные входные переменные.

Совокупность перечисленных задач и составляет предмет исследований регрессионного анализа.

Функцией регрессии (или регрессией) называется зависимость математического ожидания одной случайной величины от значения, принимаемого другой случайной величиной, образующей с первой двумерную систему случайных величин.

П усть имеется система случайных величин (X,Y), то функция регрессии Y на X

а функция регрессии X на Y

Функции регрессии f(x) и φ(y), не являются взаимно обратимыми, если только зависимость между X и Y не является функциональной.

В случае n-мерного вектора с координатами X₁, X₂,…, X_n можно рассматривать условное математическое ожидание для любой компоненты. Например, для X₁

называется регрессией X₁ на X₂, …, X_n.

Для полного определения функции регрессии необходимо знать условное распределение выходной переменной при фиксированных значениях входной переменной.

Поскольку в реальной ситуации такой информацией не располагают, то обычно ограничиваются поиском подходящей аппроксимирующей функции f_a(x) для f(x), основываясь на статистических данных вида (x_i, y_i), i = 1,…, n. Эти данные являются результатом n независимых наблюдений y₁,…, y_n случайной величины Y при значениях входной переменной x₁,…, x_n, при этом в регрессионном анализе предполагается, что значения входной переменной задаются точно.

Проблема выбора наилучшей аппроксимирующей функции f_a(x), являясь основной в регрессионном анализе, и не имеет формализованных процедур для своего решения. Иногда выбор определяется на основе анализа экспериментальных данных, чаще из теоретических соображений.

Если предполагается, что функция регрессии является достаточно гладкой, то аппроксимирующая ее функция f_a(x) может быть представлена в виде линейной комбинации некоторого набора линейно независимых базисных функций ψ_k(x), k = 0, 1,…, m−1, т. е. в виде

где m – число неизвестных параметров θ_k (в общем случае величина неизвестная, уточняемая в ходе построения модели).

Такая функция является линейной по параметрам, поэтому в рассматриваемом случае говорят о модели функции регрессии, линейной по параметрам.

Тогда задача отыскания наилучшей аппроксимации для линии регрессии f(x) сводится к нахождению таких значений параметров, при которых f_a(x;θ) наиболее адекватна имеющимся данным. Одним из методов позволяющем решить эту задачу является метод наименьших квадратов.

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 1415 / 2315 16 17 18 19 20 21 22 23 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
18.09.2019289.79 Кб7MVI-pochva.doc
#
16.11.2019971.26 Кб9obrabotka.doc
#
25.09.201996.86 Кб5otvety_k_testam_moya_redaktsia_pochti_vse.docx
#
21.09.201959.42 Кб5Otvety_OOP.docx
#
19.09.2019259.46 Кб62otvety_po_Operatsionnym_sistemam.docx
#
24.09.20191.8 Mб37otvety_stat_metody.docx
#
25.11.201989.6 Кб4Rak_zheludka_3.doc
#
15.02.20162.01 Mб101referat_informatika_Shuriberko.docx
#
23.09.20194.85 Mб7shp1-7_TsEL_E_33.docx
#
23.09.20191.45 Mб15ShPOR1_16_na_1.docx
#
03.08.2019161.19 Кб126shpory_himia.docx

Зависимость между признаками, измеренными в номинальной или порядковой шкалах

Регрессионный анализ. Основные понятия регрессионного анализа