Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Мат. стат. Лекция 3.doc
Скачиваний:
5
Добавлен:
27.11.2019
Размер:
475.65 Кб
Скачать
  1. Выборочные средние и дисперсии, их свойства.

На основании закона больших чисел можно утверждать, что если генеральная совокупность подчиняется определенному закону распределения, то и выборка из этой совокупности, если объем ее достаточно велик, будет подчиняться этому же закону. Утверждение будет тем точнее, чем больше объем выборки.

Всякую эмпирическую совокупность можно рассматривать как выборку большого объема из генеральной совокупности, подчиняющейся опреде-ленному теоретическому закону распределения. Следовательно, по характеру эмпирического распределения можно установить с определенной точностью и надежностью близкое ему теоретическое распределение. Зная закон, которому подчиняется данное распределение, можно использовать его для решения практических задач.

В ряде случаев тип закона можно установить заранее. Для этого необходимо проанализировать средствами теории вероятностей изучаемый процесс и подвести его, с некоторым приближением, к той или иной теоретической схеме. Например, основываясь на теореме Ляпунова, можно считать, что суммарная величина случайных погрешностей обработки при работе на настроенных станках при отсутствии действия какого-либо доминирующего фактора подчиняется закону нормального распределения. То же можно сказать о суммарной погрешности измерения, о средней высоте микронеровностей на обработанной поверхности и многих других технических величинах, подверженных колебаниям под действием большого количества случайных факторов.

В этих случаях, когда закон распределения заранее может быть установлен, задача сводится к нахождению неизвестных значений его параметров, т. е. к его параметризации. В случае нормального распределения задача сводится к установлению среднего арифметического значения изучаемой величины и ее среднего квадратического отклонения σ0.

Оценка параметров распределения генеральной совокупности может быть практически осуществлена только на основании данных выборки из этой совокупности.

Беря выборку из генеральной совокупности и вычисляя ее статистические характеристики и s, можно с некоторым приближением считать, что они по своим величинам будут близки к соответствующим параметрам генеральной совокупности и σ0, т. е. являться их оценками. Но для того чтобы эти оценки достаточно правильно и близко характеризовали параметры генеральной совокупности, необходимо, чтобы они удовлетворяли трем требованиям: были бы состоятельными, несмещенными и эффективными.

Оценка называется состоятельной, если вероятность отклонения ее от оцениваемого параметра на величину, меньшую как угодно малого положительного числа ε, стремится к единице при неограниченном увеличении числа п наблюдений, т. е.

при ε > 0 и n→ ∞,

где θ — некоторый параметр генеральной совокупности; θ' — оценка этого параметра.

Оценка называется несмещенной, т. е. в ней отсутствуют системати-ческие погрешности, если математическое ожидание этой оценки равно оцениваемому параметру

Мθ' = θ.

Если Мθ' > 0, то оценку называют положительно смещенной; если Мθ' < 0, то отрицательно смещенной.

Примером состоятельной и несмещенной оценки математического ожидания является средняя арифметическая. Примером состоятельной, но смещенной оценки теоретической дисперсии σ2 может служить эмпирическая дисперсия s2

,

где fi - частота значений xi; n - общее число наблюденных значений xi, ; m - число отдельных значений xi.

Для непрерывных случайных величин в качестве xi принимают середину интервалов, на которые разбивается наблюденный ряд значений x.

Из выражения для оценки s2 следует, что с увеличением n вероятность Р(| s2 - σ2 | < ε) → 1 и, следовательно, s2 является состоятельной оценкой, но математическое ожидание не равно σ2 и при конечном n дает преуменьшенное значение оцениваемого параметра σ2, поэтому, оценивая σ2 по s2, мы допускаем систематическую ошибку, равную , однако при больших n она пренебрежимо мала.

Для того чтобы получить несмещенную оценку теоретической дисперсии σ2 по эмпирическим данным, необходимо эмпирическую дисперсию s2 умножить на , т. е.

Практически эту поправку вносят при вычислении оценки дисперсии в тех случаях, когда n < 30.

Состоятельных несмещенных оценок может быть несколько. Например, для оценки центра рассеивания нормального распределения, наряду со средней арифметической , может быть взята медиана Ме. Медиана так же, как и , является несмещенной состоятельной оценкой центра группирования. Из двух состоятельных несмещенных оценок θ' и θ" для одного и того же параметра θ естественно отдать предпочтение той, у которой дисперсия меньше.

Такая оценка, у которой дисперсия будет наименьшей относительно θ, называется эффективной. Например, из двух оценок центра рассеивания нормального распределения эффективной оценкой является , а не Ме, так как дисперсия меньше дисперсии Ме. Сравнительная эффективность Ме при большой выборке приближенно равна

.

Практически это означает, что центр распределения генеральной совокупности определяется по медиане Ме с той же точностью при п наблюдениях, как при 0,6366 п наблюдениях по средней арифметической .

При решении задач, осуществляемых посредством выборочного метода, важное значение приобретают свойства выборочной средней и выборочной дисперсии, которые приведены ниже без доказательств.

Свойства выборочных средних и дисперсий.

1. Если объем выборки достаточно велик, то на основе закона больших чисел с вероятностью, как угодно близкой к достоверности, можно утверждать, что средняя арифметическая и дисперсия s2 выборки будут как угодно мало отличаться от генеральной средней и генеральной дисперсии , т. е. , если , где п — объем выборки.

2. Ошибка вычисления генеральной средней по средней выборки зависит от ее объема п и равна

. (1)

Ошибка вычисления среднего квадратического отклонения генеральной совокупности по среднему квадратическому отклонению выборки зависит от ее объема и равна

. (2)

3. Если случайная величина х в генеральной совокупности имеет нормальное распределение со средней и дисперсией , то и средние арифметические выборок из этой совокупности будут подчинены также нормальному распределению со средней и дисперсией , каков бы ни был объем выборок п, лишь бы число выборок было достаточно велико.

4. Когда дисперсия генеральной совокупности не известна, тогда для больших значений п с большей вероятностью малой ошибки можно дисперсию выборочных средних вычислять приближенно по равенству

(3)

где s2 — дисперсия большой выборки объема n, вычисляемая по формуле:

5. Приведенная выше связь дисперсии выборочных средних с дисперсией генеральной совокупности в виде соотношения

действительна для повторных выборок. Для бесповторных выборок эта связь выражается зависимостью

,

где п — объем выборки; N — объем генеральной совокупности.

Если N по сравнению с n очень велико, что практически всегда имеет место, то для бесповторных выборок можно пользоваться для вычисления формулой (3), при этом ошибка будет весьма ничтожной.

Из свойств выборочных средних и дисперсий следует, что точность вычислений средних арифметических и дисперсий или средних квадратических отклонений генеральной совокупности по данным выборки из нее зависит от объема выборки, причем точность возрастает с ростом объема выборки. Однако практически не всегда бывает возможным или легко осуществимым взятие больших выборок или проведение большого числа наблюдений. Часто на практике приходится ограничиваться взятием небольших выборок или ограничиваться малым числом наблюдений. В этих случаях важно сделать оценку точности и надежности приближенных равенств

,

где — среднее арифметическое значение случайной величины генеральной совокупности; — то же в выборке объема п из генеральной совокупности; σ0 — среднее квадратическое отклонение генеральной совокупности;

s — среднее квадратическое отклонение выборки.

  1. Оценка точности вычисления параметров генеральной

совокупности по данным выборки.

    1. Оценка точности вычисления генеральной средней

по данным выборки.

Обозначим точность приближенного равенства буквой ε. Тогда определение точности вычисления генеральной средней по данным выборки сведется к определению вероятности α, т. е. вероятности того, что истинное значение находится в пределах , где ε > 0, т. е.

.

Для определения вероятности а пользуются распределением величины t:

. (4)

Если генеральная совокупность имеет нормальное распределение, то величина t при любом п следует закону распределения Стьюдента, который имеет следующее выражение:

, (5)

где Sk(t) — дифференциальная функция распределения t;

— постоянный множитель, зависящий только от числа степеней свободы k = п — 1. Символом Г(k) здесь обозначена гамма-функция (интеграл Эйлера):

.

Из выражения (5) следует, что распределение Стьюдента зависит только от переменной t и параметра k = п — 1. Поэтому когда задана вероятность α, то можно найти такое положительное число tα которое будет зависеть только от α и n по равенству

. (6)

Учитывая, что , левую часть этого равенства можно преобразовать так:

.

Следовательно,

(7)

Полагая tασx = ε, получим

.

Таблица значений tα определяемых этим равенством, приведена в приложении 1 (см. в конце лекции). При помощи этой таблицы можно определить одно из трех значений: вероятность α, точность ε или объем выборки п, задаваясь предварительно значениями каких-либо двух из этих величин.

Пример 1. По выборке объема n = 15 найдено = 20,4 и s = 0,8. Определить истинное значение генеральной средней .

Генеральная средняя определяется доверительными границами

, где .

Зададимся надежностью α = 0,98. Тогда по таблице приложения 1 при k = п - 1 = 14 находим tа = 2,62. Поэтому

.

Следовательно,

(20,4—0,54) < < (20,4+0,54), т. е. 19,86 < < 20,94.

Пример 2. Установить, какой объем n выборки необходимо взять, чтобы определить по этой выборке генеральную среднюю с точностью и вероятностью α = 0,95.

Так как , то, следовательно, tα= 2. По таблице приложения 1 для α = 0,95 находим значение tα= 2, которому соответствует k = 60. Но k = п - 1, следовательно, п == 61.

Все изложенное об оценке точности и вероятности вычисления генеральной средней по выборочной средней является справедливым только для случаев, когда выборки берутся из генеральной совокупности, имеющей нормальное распределение случайной величины х или когда распределение х в генеральной совокупности не очень сильно отличается от нормального. Если же распределение х в генеральной совокупности сильно отличается от нормального, то в этом случае вероятность α и точность ε приближенного равенства можно определить только для больших выборок с помощью формул (9) и (10), но полученные значения α и ε не будут точными, а будут носить лишь приближенный характер.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]