Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
лубушка 2.doc
Скачиваний:
2
Добавлен:
14.09.2019
Размер:
138.75 Кб
Скачать

 

Лабораторная работа №2

 

Статистическое оценивание параметров

 

         1. Понятие оценки. Одна из главных целей, которые ставит перед собой исследователь, приступая к статистической обработке исходных данных, заключается в том, чтобы представить множество обрабатываемых данных в виде сравнительно небольшого числа сводных характеристик, построенных на основании этих данных. При этом потеря информации для принятия существенных решений должна быть минимальной.

         Распределение случайной величины  характеризуется целым рядом параметров. Сюда относятся числовые характеристики   (математическое ожидание, дисперсия, среднеквадратическое отклонение, мода, медиана и т.д.) Эти параметры называются параметрами генеральной совокупности. Они могут быть найдены из закона распределения. Однако при решении многих практических задач нет необходимости характеризовать случайную величину исчерпывающим образом, а достаточно указать только отдельные числовые характеристики, которые определяют существенные черты распределения. Используя выборку наблюдений случайной величины, можно вычислить приближенные значения каждого  из параметров, называемые в статистике числовыми оценками параметров или просто оценками.

         Сформулируем задачу оценки параметров в общем виде. Пусть случайная величина  подчинена закону распределения  , аналитическое выражение которое известно. Функция распределения  определяется параметром , численное значение которого неизвестно. Исследовать все элементы генеральной совокупности для вычисления параметра   не представляется возможным, поэтому о параметре пытаются судить по выборкам из генеральной совокупности.

         Пусть произведено n выборок, каждая из которых состоит из k независимых наблюдений xij ( i - номер выборки, j - номер элемента в выборке ), т.е.

 

         1-я выборка состоит из элементов (  

         2-я   -”-        -”-           -”-         -”-    (

         .......................................................................................

         i-я   -”-        -”-           -”-         -”-     (

         .......................................................................................

         n-я   -”-        -”-           -”-         -”-   (    и  т.д.

 

         Но так как выборки случайны, тогда можно обозначить через  случайную величину, принимающую значения ( , через  - случайную величину, принимающую значения   (  и т.д. Тогда последовательность случайных величин  ( независимых ) распределена по закону .

         Всякую однозначно определенную функцию результатов наблюдений над случайной величиной , с помощью которой судят о значении параметра , называют оценкой параметра . Если оценку параметра  обозначить через , то можно записать, что    = f ( ).

Очевидно, что  - оценка является случайной величиной, поскольку она зависит от . Поэтому закон распределения  зависит от закона распределения случайной величины   и от числа наблюдений n . Так, например, для пуассоновской случайной величины необходимо оценить параметр , определяющий это распределение. Если случайная величина , то по выборкам необходимо оценить 1 = а и 2 =  , т.к. они полностью определяют нормальное распределение . На практике поступают следующим образом:

         1) х1 - первый элемент выборки и его используют как оценку ;

         2) эту оценку можно получить, как =(хmax - xmin)/2  -  среднее арифметическое максимального и минимального элементов выборки;

         3) М0 - в качестве оценки можно взять моду, которая при нормальном распределении равна среднему значению а;

         4) Ме - медиану, которая при нормальном распределении также равна среднему значению а;

         5)  - среднее арифметическое.

 Выбор оценки, позволяющей получить хорошее приближение оцениваемого параметра, - основная задача теории оценивания. Для того чтобы установить, какая из оценок лучше, надо знать основные свойства (виды) оценок.

 

2. Основные свойства точечных оценок.

    Для того чтобы оценка  имела практическую ценность, она должна обладать следующими свойствами.

         1. Оценка  параметра  называется несмещенной, если ее математическое ожидание равно оцениваемому параметру   , т.е.

                                                               М =  .                                                  (1)

        Если равенство (1) не выполняется, то оценка  может либо завышать значение   (М >  ), либо занижать его (М <  ) . Естественно в качестве приближенного неизвестного параметра брать несмещенные оценки для того, чтобы не делать систематической ошибки в сторону завышения или занижения.

         2. Оценка   параметра  называется состоятельной, если она подчиняется закону больших чисел, т.е. сходится по вероятности к оцениваемому параметру при неограниченном возрастании числа опытов (наблюдений)  и следовательно выполняется следующее равенство :

                                                                                       (2)

где  > 0 сколько угодно малое число.

         Для выполнения (2) достаточно, чтобы дисперсия оценки стремилась к нулю при , т.е.

                                                                                                          (3)

И, кроме того, чтобы оценка была несмещенной. От формулы (2) легко перейти к (3) , если воспользоваться неравенством Чебышева.

Итак, состоятельность оценки означает, что при достаточно большом количестве опытов и со сколько угодно большой  достоверностью отклонение оценки от истинного значения параметра меньше любой наперед заданной величины. Этим оправдано увеличение объема выборки.

         3. Несмещенная оценка , которая имеет наименьшую  дисперсию среди всех возможных несмещенных оценок параметра , вычисленных по выборкам одного и того же объема , называется эффективной оценкой.

         Так как  - случайная величина, значение которой изменяется от выборки к выборке, то меру ее рассеивания около математического ожидания  будем характеризовать дисперсией D . Пусть  и  - две несмещенные оценки параметра , т.е. M =  и M =  ,  соответственно D  и D и, если

D  < D , то в качестве оценки принимают .

          На практике при оценке параметров не всегда удается удовлетворить одновременно требованиям 1, 2, 3, но выбору оценки всегда должно предшествовать ее критическое рассмотрение со всех точек зрения. При выборке практических методов обработки опытных данных необходимо руководствоваться сформулированными свойствами оценок.

 

3. Понятие доверительного интервала. Доверительная вероятность.

 

        Оценки, которыми мы до сих пор занимались, называются точечными, так как полученные оценки выражались одним числом. Однако, в ряде задач требуется не только найти для оцениваемого параметра  подходящее числовое значение, но оценить его точность и надежность. Такого рода задачи очень важны  при малом числе наблюдений, так как конечная оценка  в значительной мере является случайной и приближенная замена на  может привести к серьезным ошибкам.

         Задачу интервального оценивания в самом общем виде можно сформулировать так: по данным выборки построить числовой  интервал, относительно которого с   заранее выбранной вероятностью можно сказать, что внутри этого интервала находится оцениваемый параметр.

         Для определения точности оценки  в математической статистике пользуются доверительными интервалами, а для определения надежности - доверительными вероятностями. Раскроем сущность этих понятий.

         Доверительным интервалом для параметра  называется такой интервал, относительно которого можно с заранее выбранной вероятностью  = 1 -  , близкой к единице, утверждать, что он содержит неизвестное значение параметра . Пусть  - несмещенная оценка параметра  . Требуется оценить возможную при этом ошибку. Найдем теперь такое значение  > 0 , чтобы

                                                                                                         (4)

         где  - заданная вероятность ( например,  = 0.99 ).

Представим (4) в виде

                                                                                         (5)

Равенство (5) означает, что неизвестное значение параметра  с вероятностью  попадает в интервал , где  а   Заметим, что здесь  не случайная величина, а интервал  является случайной величиной.

 

Рис. 1

 

          - называют доверительной вероятностью, а значение  - уровнем значимости. Нижняя и верхняя граница доверительного интервала   и  определяется по результатам наблюдений. В связи с этим говорят, что доверительный интервал накрывает оцениваемый параметр с вероятностью = 1 -  или 100 (1 -  ) % случаев. Выбор   определяется конкретными условиями решаемой проблемы.

 

         4. Построение доверительного интервала для математического ожидания при известной дисперсии. 

            Пусть  распределено по нормальному закону с параметрами ( a;  ), причем  - известно, а параметр а =  - оцениваемый параметр. Требуется оценить неизвестное математическое ожидание. Наилучшей оценкой М = а  в смысле несмещенности, состоятельности и эффективности, как следует из теории, является выборочное среднее  . Можно показать, что  распределено нормально с параметрами  М = а ,  ; нормированное отклонение  .

распределено нормально с параметрами   N ( 0; 1 ), поэтому вероятность любого отклонения  может быть вычислена по формуле

                                                                                  (6)

         Задавая определенную вероятность  = 1 -  = 2Ф(z) по таблице значений можно определить значение из соотношения . Для оценки  а  преобразуем формулу (6)

                                 

или

                                

откуда получим

                               

         Таким образом, с вероятностью ( надежностью )  = 1 -  = 2Ф (z) - 1 можно утверждать, что интервал

                                        

является доверительным для оценки  а .

З а м е ч а н и е 1. Обозначим .    Тогда:

         1) при фиксированном значении  с возрастанием  n  величина  уменьшается, следовательно, точность интервального оценивания увеличивается;

         2) увеличение надежности оценки  = 1 -  ведет к увеличению функции Ф(z), так как она возрастающая, и  , поэтому, при фиксированном объеме выборки n , величина   также возрастает, что ведет к увеличению доверительного интервала, и, следовательно, уменьшению точности оценки;

         3) так как  - случайная величина, возможные значения которой меняются от выборки к выборке, то концы доверительного интервала

 ( - ;   +  ) также являются случайными величинами , меняющимися от выборки к выборке.

 

 

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]