Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Нижегородский Государственный Архитектурно-Строительный Университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

тервер.docx

Скачиваний:

Добавлен:

21.09.2019

Размер:

1.36 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 1011 / 1311 12 13 > Следующая >>>

Математичечская статистика

Лекция № 10

Выборочный метод

Для установления закономерностей, которым подчинены случайные события и случайные величины, теория вероятности, как и любая другая наука, обращается к опыту – наблюдениям, измерениям, экспериментам. Результаты наблюдений за случайными величинами объединяются в наборы статистических данных. Задачей математической статистики, раздела современной теории вероятностей, является разработка методов сбора и обработки статистических данных, а также их анализа с целью установления законов распределения наблюдаемых случайных величин [8,9].

1. Генеральная и выборочная совокупность данных

Генеральной совокупностью является набор всех мыслимых статистических данных при наблюдениях случайной величины:

х_Г= {х₁, х₂, х₃, …, х_N} = { х_i; i=1,N }.

Наблюдаемая случайная величина Х называется признаком или фактором выборки. Генеральная совокупность есть статистический аналог случайной величины, ее объем N обычно велик, поэтому из ее выбирается часть данных, называемая выборочной совокупностью или просто выборкой

х_В= {х₁, х₂, х₃, …, х_n} = { х_i; i=1,n }

х_Вх_Г , n  N.

Использование выборки для построения закономерностей которым подчинена наблюдаемая случайная величина позволяет избежать ее сплошного (массового) наблюдения, что часто бывает ресурсоемким процессом, а то и просто невозможным. Однако выборка должна удовлетворять следующим основным требованиям:

- выборка должна быть представительной, т.е. сохранять в себе пропорции генеральной совокупности,

- объем выборки должен быть небольшим, но достаточным для того, чтобы полученные результаты ее анализа обладали необходимой степенью надежности. Ниже приведены примеры генеральных и выборочных совокупностей.

Таблица 1

Генеральная совокупность	Выборочная совокупность
Данные переписи населения страны по разным признакам.	Данные опроса случайных прохожих по тем же признакам.
Времена работы электроламп, выпущенных заводом.	Лабораторные данные о времени работы испытанных электроламп.

Отметим, что в более строгом смысле, выборку можно представить как многомерную случайную величину Х_В= {Х₁,Х₂, Х₃, …,Х_n} = {Х_i; i=1,n }, у которой все компоненты Х_iраспределены одинаково и по закону распределения наблюдаемой случайной величины. В этом смысле выборочные значения х_В есть одна из реализаций величины Х_В.

2. Статистическое распределение выборки. Выборочный ряд, полигон, гистограмма и комулянта выборки.

Возможные значения элементов выборки х_В= { х_i; i=1,n } называются вариантами х_jвыборки, причем число вариант m меньше чем оббьем выборки n. Варианта может повторяться в выборке несколько раз, число повторения варианты х_j в выборке называется частотой варианты n_j. Причем n₁ + n₂ +… n_m = n.Величина w_j = n_j/n называется относительной частотой варианты х_j.

Упорядоченный по возрастанию набор вариант совместно с соответствующими им частотами называется вариационно-частотным рядом выборки:

V_xn= { х_j, n_j; j=1, m} ; V_xw= { х_j, w_j; j=1, m} .

Ломаная линия, соединяющая точки вариационно-частотного ряда, на плоскости (х, n) или (х, w) называется полигоном частот.

Пример 1. Пусть дана выборка полуденных температур мая своим вариационно-частотным рядом:

Таблица 2

х_j	0	2	3	7	8	12	14	16	19	23	25	27	30
n_j	1	1	1	1	5	6	2	2	5	2	1	3	1

На рис.10.1 приводится полигон частот рассматриваемой выборки.

Рис.10.1 Полигон частот

Вариационно-частотный ряд имеет существенный недостаток - ненаглядности полигона в случае малой повторяемости вариант, например, при наблюдении непрерывного признака его повторяемость в выборке маловероятна. Более общей формой описания выборки является гистограмма выборки. Для ее построения, разобьем интервал значений выборки R=х_max – x_min на m интервалов h_j= (х_j, х_j+1) длины h = R/m с границами х_j= x_min + h*( j-1). Число элементов выборки х_В, попадающих в интервал h_j, называется частотой n_j интервала, кроме того вводятся следующие величины:

w_j = n_j/ n ~ относительная частота интервала,

f_j = w_j/ h ~ плотность относительной частоты интервала.

Совокупность интервалов наблюдаемой в выборке случайной величины и соответствующих им частот называется гистограммой выборки.

H_xn = { h_j, n_j }, H_xw = { h_j, w_j }, H_xf = { h_j, f_j}, j=1, m.

Для частот гистограммы выполнены следующие условия нормировки:

, ,

Число интервалов гистограммы m должно быть оптимальным, чтобы с одной стороны была достаточной повторяемость интервалов, а с другой стороны не должны сглаживаться особенности выборочной статистики. Рекомендуется значение m  1+3,2*lg(n) . На плоскости (х, n) гистограмма представляется ступенчатой фигурой (рис.10.2).

Пример 2. Наблюдаемые значения полуденной температуры мая разбиты на 5 интервалов, соответствующая гистограмма задана таблицей:

Таблица 3

h_j	0-5	5-10	10-15	15-20	20-25	25-30
n_j	4	5	6	9	3	4

Рис. 10.2 Гистограмма частот

Выборочной или эмпирической функцией распределения называется функция , определяющая для каждого значения х относительную частоту события {X<x} в выборке, которая вычисляется через сумму соответствующих частот:

В нашем примере выборочная функция распределения (иногда называемая комулянтой) приводится на рис.10.3.

Рис. 10.3 Комулянта частот

При увеличении объема выборки относительная частота события приближается к вероятности этого события (теорема Бернулли), поэтому выборочная функция распределения является оценкой теоретической функции распределения для случайной величины Х.

для любого х и > 0 .

Это утверждение строго доказано и носит форму теоремы Гливенко [7].

Статистические оценки параметров распределения

Пусть распределение наблюдаемой случайной непрерывной величины Х (признак генеральной совокупности), задается функцией плотности вероятности , где  параметр или параметры распределения. Допустим, что вид функции известен или ограничен некоторым классом функций, а параметр неизвестен и должен быть оценен по выборке , где n – объем выборки.

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 1011 / 1311 12 13 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
08.04.201532.48 Кб11Теория организации_Закон Самосохранения.docx
#
08.04.201567.58 Кб126Теория справедливости С. Адамса.doc
#
20.11.201939.12 Кб5ТЕПЛОВЫЕ СЕТИ.docx
#
14.03.201637.95 Кб41Тепломассообмен.docx
#
08.04.20159.24 Mб34Теплофизика.doc
#
21.09.20191.36 Mб3тервер.docx
#
08.04.20151.14 Mб119Термех часть 2 кинематика и механика.pdf
#
08.04.201571.68 Кб78тест нарисуем свой характер Microsoft Word.doc
#
08.04.201527.65 Кб16тест по КПЗС Microsoft Office Word (2).doc
#
08.04.201556.83 Кб57тест по основам землепользования.doc
#
08.04.201590.11 Кб31Тестовые задания по микроэкономике.doc