Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Балтийский государственный технический университет "ВОЕНМЕХ" им. Д.Ф. Устинова

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

TV11_1_2.doc

Скачиваний:

Добавлен:

12.07.2019

Размер:

2.01 Mб

Скачать

☆

<<< < Предыдущая 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 2627 / 3027 28 29 30 > Следующая >>>

5 Элементы математической статистики

5.1 Выборка и выборочные законы распределения

Задачами математической статистики являются оценка законов распре-

деления, числовых характеристик и параметров случайных величин, провер-

ка статистических гипотез, анализ зависимостей между входными и выход-

ными параметрами, прогнозирование, планирование эксперимента и т.д.

Эти и другие статистические выводы относительно свойств полной со-

вокупности данных (генеральной совокупности ) делают на основе специ-

альным образом отобранной части данных

x₁, x₂, . . . , x_n,

называемой выборкой объема n .

Выборка должна обладать следующими свойствами.

1. Необходимо, чтобы выборка была репрезентативной , т. е. имела до-

статочно большой объем и полно, однородно, равномерно и равноверо-

ятно по отношению к другим возможным выборкам представляла всю

генеральную совокупность.

2. Выборка должна быть рандомизированной, т. е. полученной случай-

ным образом в одинаковых условиях и в виде последовательности по-

вторных независимых реализаций случайной величины X .

3. В рамках статистической модели, привлекаемой для анализа данных, вы-

борка должна рассматриваться как реализация n -мерного случайного

вектора (X₁, X₂, . . . , X_n) (выборочного вектора ) с независимыми и

одинаково распределенными компонентами.

До опыта статистический анализ проводится на основе выборочного

вектора X₁, X₂, . . . , X_nдля чего используется аппарат теории вероятностей.

После опыта рассматривается неслучайный вектор (выборка) x₁, x₂, . . . , x_n,

который является числовой реализацией случайного вектора X₁, X₂, . . . , X_n.

В математической статистике принято, как правило, использовать ма-

лые буквы и для выборочного вектора, и для выборки.

Если все элементы выборки расположить в порядке неубывания

x₍₁₎≤ x₍₂₎≤ . . . ≤ x₍n)^,

то получим вариационный ряд , элементы которого называют порядковы-

ми статистиками . Наименьшее значение в выборке называют первой

порядковой статистикой x₍₁₎, а наибольшее значение называют n -ой

порядковой статистикой x₍n) . Разность между наибольшим и наимень-

шим значениями называют размахом выборки , обозначают буквой w∗ и

вычисляют по формуле w∗₌x₍n) − x₍₁₎.

Если в выборке имеется достаточно много одинаковых элементов, то

используют статистический ряд.

Статистическим рядом называют систему пар чисел

(z_i, n_i), i = 1, 2, . . . , k,

где z_i различные элементы выборки, расположенные в порядке возраста-

ния, n_i частота элемента в выборке, т. е. число повторений элемента. Обыч-

но статистический ряд представляют в виде таблицы , где первая строка

содержит элементы z_i, а вторая их частоты. Если в выборке нет одинако-

вых элементов, то статистический и вариационный ряды совпадают. По вари-

ационному или статистическому ряду строится эмпирическая (выборочная)

функция распределения F_n∗₍x) , которая является оценкой функции распре-

деления F_X(x) случайной величины X , сформировавшей данную выборку.

Из определения выборки следует, что каждое выборочное значение име-

ет вероятность 1/n . Поэтому, если в выборке нет одинаковых элементов,

то рассматривают дискретную случайную величину X_n∗ , которая принимает

значения x₍₁₎, x₍₂₎, . . . , x₍n)^,причем каждое значение имеет вероятность 1/n .

Обозначим n(x) число элементов вариационного ряда меньших аргумента

x . Тогда эмпирическая функция распределения вычисляется по формуле

F_n∗₍x) = n(x)/n, x ∈ R

и равна функции распределения случайной величины X_n∗_.

Если в выборке имеются одинаковые элементы, то эмпирическую функ-

цию распределения удобно строить по статистическому ряду по формуле

F_n∗₍z) = ∑_ni^/n,z ∈ R.

z_i<z

Эмпирическая функция распределения изменяется от нуля до едини-

цы, непрерывна слева, является кусочно постоянной функцией, имеющей во

всех значениях статистического ряда скачки, равные относительной часто-

те данного элемента в выборке. Значение и ценность эмпирической функции

распределения для решения задач математической статистики определяется

следующей теоремой, которая следует из теоремы Бернулли.

Теорема (Гливенко). Эмпирическая функция распределения F_n∗₍x)

при неограниченном увеличении объема выборки сходится по вероятности

при любом значении x ∈ R к теоретической функции распределения гене-

ральной совокупности F_X(x) .

Таким образом, при большом объеме выборки эмпирическая функция

распределения F_n∗₍x) является достаточно точным приближением для неиз-

вестной заранее теоретической функции распределения F_X(x) .

Пример. Рассмотрим выборку объемом в 10 наблюдений

3, 7, 10, 5, 5, 7, 2, 7, 2, 4,

которая была сформирована для анализа затрат времени водителями на ав-

тозаправочной станции в течение суток.

Решение. Для того чтобы выборка была репрезентативной и рандоми-

зированной сутки были разбиты на десять равных частей по 144 минуты, а

время ожидания выбиралось случайно в каждом из диапазонов.

Упорядочив выборку по неубыванию, получим вариационный ряд

2 ≤ 2 ≤ 3 ≤ 4 ≤ 5 ≤ 5 ≤ 7 ≤ 7 ≤ 7 ≤ 10.

Размах выборки равен w∗₌x(10) − x₍₁₎= 10 − 2 = 8 .

Статистический ряд выборки представляется в виде таблицы

z_i2 3 4 5 7 10

n_i2 1 1 2 3 1

В данном примере эмпирическая функция распределения имеет вид





,



x ≤ 2,



0, 2, 2 < x ≤ 3,



 0, 3, 3 < x ≤ 4,



F₁₀∗₍x) =





0, 4, 4 < x ≤ 5,

 0, 6, 5 < x ≤ 7,



₀, 9, 7 < x ≤ 10,



₁,

x > 10.

Если выборка имеет большой объем и содержит много различных эле-

ментов, то выборку разбивают на группы и представляют данные в виде

группированного или интервального статистического ряда.

100

Для этого отрезок [a; b] , содержащий выборку, обычно разбивают на

равные непересекающиеся полуинтервалы [a; x₁), [x₁; x₂), . . . , [x_s−1 ; b] общим

числом s и длиной h . Длину интервала h часто рекомендуют вычислять

ориентируясь на формулу Стерджеса

h =

x_max− x_min

1 + log₂n

x_max− x_min

1 + 3, 322 lg n

В практических приложениях обычно сначала выбирают число интервалов s

равным целому числу близкому к значению 1 + 3, 322 lg n . Далее назначают

левую и правую границы отрезка [a; b] , стараясь максимально приблизиться

к значениям x_min(слева) и x_max(справа). Наконец, находят длину интервала

h по формуле h = (b − a)/s .

Далее вычисляют: середины интервалов z_i, частоты m_i ко-

личество элементов выборки, попавших в интервалы t_i, относительные

частоты m_i/n , накопленные частоты ∑i_j=1^mj общее количество

элементов в первых i интервалах, накопленные относительные часто-

ты ∑i_j=1⁼m_j/n . Полученные результаты сводят в таблицу частот

группированной выборки .

Для наглядного представления выборки по табличным значениям стро-

ят гистограмму относительных частот, полигон относительных частот и ку-

мулятивную кривую. Гистограммой относительных частот f_n(x) на-

зывают кусочно-постоянную функцию, принимающую на каждом из интер-

валов t_iзначения относительной частоты, отнесенные к длине каждого ин-

тервала. Гистограмму обычно изображают в виде ступенчатой фигуры.

Если точки (z_i; m_i/n), i = 1, 2, . . . , s соединить отрезками прямых, то

получим сплайн-функцию f˜_n(x) , которую называют полигоном относи-

тельных частот . График этой функции есть кусочно-линейная кривая

с изломами в серединах интервалов. При увеличении объема выборки ги-

стограмма и полигон относительных частот приближаются к плотности или

полигону теоретического распределения случайной величины X .

Кумулятивной кривой F˜_n(x) называют сплайн-функцию первого

порядка с узлами в следующих точках:

z_i,

∑^mj

j=1

, i = 1, 2, . . . , s.

Кумулятивная кривая возрастает и имеет вид кусочно-линейной функ-

ции с изломами в серединах интервалов группирования.

При большом объеме выборки эмпирическая функция распределения

101

и кумулятивная кривая являются хорошими приближениями для теоретиче-

ской функции распределения F_X(x) случайной величины X .

<<< < Предыдущая 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 2627 / 3027 28 29 30 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
11.11.2019151.88 Кб2Tema_3.docx
#
26.03.2015273.92 Кб11Test_ETO-otvety_165-191.doc
#
26.03.201535.84 Кб12The gentleman hacker.doc
#
26.03.201515.94 Mб11Time USA – 19 January 2015.pdf
#
16.09.20191.65 Mб65TSS-lekz.doc
#
12.07.20192.01 Mб24TV11_1_2.doc
#
13.08.20191.32 Mб47uchebnoe posobie.doc
#
12.07.2019130.05 Кб11Variant (1).doc
#
27.11.201971.83 Кб4Veli_769_kaya_teore_769_ma_Ferma_769.docx
#
31.08.2019940.03 Кб3vkr (1).doc
#
15.09.201956.73 Кб2Voprosy_dlya_podgotovki_k_zachetu_po_kursu_Obsh...docx