Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Количественные методы анализа хозяйственной деятельности - Ричард Томас

.pdf
Скачиваний:
317
Добавлен:
24.05.2014
Размер:
7.39 Mб
Скачать

о с н о вы ТЕОРИИ ВЕРОЯТНОСТИ

8 3

390 412 ,_390-400_ ^ с ' ^ " ' ^ ° ° ^^ _ 412 - 400 _ пп

Рис. 2 . 20. Вес упаковки между 390 и 412 г

Пример 2

В клинике Св. Иосифа используются различные методы оценки при отборе управленческого персонала. Так, на основе результатов, полученных за после­ дние пять лет при использовании свыше 3000 различных тестов в разных реги­ онах страны, был специально разработан оценочный тест. Его результаты пред­ ставляют собой нормальное распределение со средним количеством баллов 55 и среднеквадратическим отклонением 14.

При наличии списка из 20 предварительно отобранных кандидатов оце­ ним, сколько из них получат по результатам данного теста количество баллов:

(О более 70 и (ii) между 40 и 60.

(О На рис. 2.21 представлена вероятность получения более 70 баллов. Зна­ чение Z рассчитано и показано там же. По таблицам нормального распределе­ ния находим, что вероятность получения более 70 баллов составляет 0.1423. Следовательно, ожидаемое количество кандидатов, которые получат более 70 баллов, равно 0.1423 х 20 = 2.846, т. е. приблизительно трем.

70-55 , „^ z= и. =1.07

Рис. 2 . 2 1 . Количество баллов более 70

(и) На рис 2.22 представлен искомый участок между 40 и 60, а также расчет двух значений искомых z. По таблице нормального распределения нахо-

84

ГЛАВА 2

лим, что выделенный участок равен 0.4983. Таким образом, ожидаемое количе­ ство кандидатов, получащих между 40 и 60 баллами, равно 0.4983 х 20 = 9.966, или приблизительно десяти кандидатам.

 

 

 

 

40

60

 

Z = -

40

- 5 ^

. = 55

Ж , I 60-55 _,

 

14

=-1.07

' 1 4

0.36

 

 

 

••"•

 

Рис. 2.22. Количество баллов между 40 и 60

Следует отметить, что в данном примере сделано допущение, что количе­ ство ба..1Лов, набранных в ходе оценочного тестирования, есть «непрерывная» переменная, т. е. она может равняться любому значению в пределах заданного диапазона. Иначе говоря, количество баллов необязательно офаничено целыми числами, т. е. это может быть любое значение, например 52.6 или 49.861. В противоположность этому, если количество баллов считается «дискретным», т е может быть только целым числом, то для использования нормального рас­ пределения при оценке вероятностей необходимо внести «поправку на не­ прерывность» Например, вероятность получения 40 баллов определяется путем нахождения участка под нормальной кривой между 39.5 и 40.5. Аналогично, вероятность количества баллов между 40 и 50 находится на участке между 39.5

и50 5.

2.14.Упражнения: нормальное распределение

1 (Е) Имеется нормальное распределение со средней арифметической, равной 40, и среднеквадратическим отклонением, равным 10. Найдите участок под норма^тьной кривой:

а)

более 45;

 

б)

менее 30;

 

в)

между 42 и 52;

г)

менее 48;

 

л)

между 28

и 55.

2 (I) Установлено, что почасовые ставки фуппы квалифицированных ра­ ботников из всех отраслей экономики США представляют собой нормальное распределение со средним значением 12 долл. СШ.Л в час и среднеквадратичес­ ким отк,1онение.м в 2 долл. США в час.

(О Найдите вероятность того, что произвольно взятый квалифицирован­ ный работник имеет почасовую ставку:

а) свыше 16 долл. США; б) свыше 10 долл. США; в) менее 12 долл. США;

о с н о в ы ТЕОРИИ ВЕРОЯТНОСТИ

8 5

г) между 10 и 14 долл. США; д) между 7 и 11 долл. США.

(ii)Какова вероятность того, что такой работник получает в пределах од­ ного среднеквадратического отклонения средней арифметической?

(iii)При наличии фуппы из 50 таких работников сколько из них, по

вашему мнению, получают свыше 15 долл. США в час?

3. (1) Установлено, что количество пациентов, поступающих еженедельно на лечение в клинику Св. Иосифа, представляет собой нормальное распределе­ ние со средней арифметической в 400 пациентов и среднеквадратическим от- ю'юнением в 90 пациентов.

(i) Найдите вероятность того, что в данную неделю количество пациентов, поступающих в клинику:

а) более 500 человек; б) .менее 250 человек; в) 350 — 450 человек; г) 400 - 480 человек; д) 420 — 520 человек.

(ii) В течение данного года (52 недели) каково количество недель, на которые придется более 550 поступлений клиентов?

2.15. Доверительные пределы

Рассмотрим задачу определения количества коек, необходимого в специа­ лизированном отделении клиники Св. Иосифа. Общее количество ежедневно необходимых коек представляет собой нормальное распределение со средней арифметической в 60 и среднеквадратическим отклонением в 10. Руководство

.хочет быть в достаточной степени уверено, что имеется необходимое число коек для удовлетворения ежедневных потребностей. Фактически руководство установило, что количество имеющихся коек должно быть достаточным, по крайней мере, на 99 дней из каждых 100.

Задача состоит в том, чтобы определить, сколько коек должно иметься в отделении для выполнения данного условия. На рис. 2.23 представлено распре­ деление ежедневно необходимого количества коек. Как уже сказано, задача состоит в том, чтобы найти такое значение х, при котором участок за этим значением составляет максимум 1%, что и показано на диафамме. Следуя ме­ тодике, описанной в предыдущем разделе, попробуем рассчитать z'-

_ X - J.I _ X - 6 0

^~"Т '""То""'

Итак, значение х неизвестно. Однако значение z, которое соответствует шлейфовому участку в 1% (= 0.01), можно взять из таблицы нормального рас­ пределения. Ближайшее значение z равно 2.33, что соответствует участку в 0.0099. Таким образом, получаем уравнение:

.V-60

10 =2.33

Перестановкой получаем: х — 60 = 2.33 х 10, т. е. х — 60 = 23.3. Итак, X = 23.3 + 60 - 83.3.

Таким образом, если в отделении имеется 84 койки, то вероятность того, что в нем не смогут разместить всех поступающих пациентов, состав­ ляет менее !%.

86

ГЛАВА 2

И = 60

Рис. 2.23. Нормальное распределение, при котором 1% значений больше X

Данный метод можно приспособить для вычисления доверительных преде­ лов. Такие пределы обозначают диапазон значений, который содержит задан­ ную пропорцию от общего количества значений вокруг среднего арифметичес­ кого. Например, 95%-ные доверительные пределы в нормальном распределении можно получить по формуле ц + 1.9ст. Эти пределы, показанные на рис. 2.24, определяют два значения, между которыми помещаются центральные 95% зна­ чений распределения. Таким образом, щлейфовые участки, соответственно сле­ ва и справа от данных значений, составляют только 2.5% от общей площади каждый. Для такого шлейфового участка значение z из таблицы равно 1.96. Следовательно, значение г— (х— |i)/a = 1.96. Таким образом, имеем д: — ц = = 1.96а и отсюда х = ц + 1.96ст. Аналогично получаем нижний предел, который равен (I — 1.96а.

Например, 95%о доверительные пределы для веса упаковок с шоколадом производства компании «Даунбрукс», где средний вес составляет 400 г, а среднеквадратическое отклонение — 20 г, равны ц + 1.9а = 400 + 1.96 х 20 = 400 + 39.2, или от 360.8 до 439.2 г. Итак, мы можем быть на 95% уверены, что вес упаковки с шоколадом находится в пределах от 360.8 до 439.2 г.

Среднеквадратическое

отклонение = а

ц - 1.96а

ц -I- 1.96<j

Средняя арифметическая = ц

Рис. 2.24. 95%-ные доверительные пределы

Данный подход лежит в основе ряда методов контроля качества, исполь­ зуемых в промышленности и производстве. Доверительные пределы служат ори­ ентиром в том, что касается ожидаемого диапазона для конкретных перемен­ ных. Любое значение, оказавшееся в ходе исследования за пределами этого

о с н о в ы ТЕОРИИ ВЕРОЯТНОСТИ

8 7

ожидаемого диапазона, можно считать подозрительным, и за этим может пос­ ледовать более тщательная проверка общего «качества» продукции.

Кроме 95%-ных пределов, иногда при некоторых обстоятельствах исполь­ зуются и дру1ие доверительные пределы, например'

99%-ные доверительные пределы ц + 2.58ст;

99 8%-ные доверительные пределы: ц + 3.09(т Так, например, 99%-ные доверительные пределы для веса упаковки шоко­

лада (сходный пример мы уже рассматривали) составляют ц + 2.58а = 400 +

± 2 58 X 20 = 400 ± 51.6, т е от 348.4 до 451 6.

Следовательно, мы можем быть на 99% уверены, что вес упаковки с щоколадом будет в диапазоне от 348.4 до 451.6 г.

Оставляем вам возможность рассчитать 99.8%-ные доверительные пределы для данного распределения.

Использование альтернативных доверительных пределов важно при реше­ нии задач, требующих большей или меньшей степени точности. Например, избыточный или недостаточный вес упаковки с шоколадом не столь важен, сколь отклонения в весе основных химических компонентов лекарственного препарата Таким образом, различные доверительные пределы используются в соответствии с важностью рассматриваемой переменной.

Т Определение. Доверительные пределы определяют верхнее и нижнее значе­ ния, между которыми помещается центральная пропорция от совокупности На­ пример, 95%-ные доверительные пределы определяют границы, в пределах которых находится 95% всех возможных значений

2.16. Значимость и выборка

Во многих случаях выборка из совокупности производится с тем, чтобы сделать выводы относительно этой совокупности Это часто происходит тогда, когда совокупность слишком большая, чтобы включать в обследование все ее элементы Возьмем, например, вопрос контроля качества в компании «Даунбрукс», ежегодно производяихей миллионы батончиков «Биг-Байт». Невозмож­ но проверить каждое изделие, и поэтому проводится регулярная выборочная проверка группы изделий. Даже в случае с меньшими по размеру совокупнос­ тями необходимо выборочное обследование, как, например, в ситуациях, ког­ да это связано с уничтожением обследуемого продукта. Например, одна из проверок качества изделий компании «Даунбрукс» состоит в их обследовании после завершения расфасовки. При этом упаковка вскрывается, и проверяется количество изделий, а также их качество. Очевидно, что такой проверке нельзя подвергнуть все изделия, иначе придется вскрывать все, что расфасовано

Надежность выборок в отношении точности определения признаков сово­ купности зависит от ряда факторов. Это обеспечение «произвольности» выбо­ рок с тем, чтобы они были репрезентативны относительно всей совокупности, а также их достаточно большого объема с тем, чтобы попытаться избежать «урохтивых» результатов.

Часто рассматривается такая важная характеристика, как выборочная сред­ няя Производится выборка из совокупности, и находится ее средняя арифме­ тическая Полученный результат позволяет сделать выводы по всей совокупно­ сти В цетом, если совокупность имеет среднюю арифметическую ц, то выбо­ рочная средняя может быть относительно близка к этому значению И действи-

8 8

ГЛАВА 2

тельно, если взять много выборок, то средняя арифметическая выборочных средних будет равна ц. Полезно рассмотреть распределение этих выборочных средних при решении практических задач, например, связанных с контролем качества. Выборочные средние окажутся разбросанными вокруг значения ц. Можно ли спрогнозировать разброс этих средних? Известно, что если совокуп­ ность имеет среднеквадратическое отклонение а, то распределение выборочных

средних будет иметь среднеквадратическое отклонение о/л/л , где п — объем выборки.

Т Определение. Если выборки объемом п взяты из совокупности со средней арифметической ц и среднеквадратическим отклонением а, то распределение вы­ борочных средних имеет среднюю арифметическую ц и среднеквадратическое от­ клонение a/Jn . А

Пример 1

Рассмотрим совокупность упаковок с шоколадом весом 400 г производства компании «Даунбрукс». Вся продукция имеет среднюю арифметическую 400 г и среднеквадратическое отклонение 20 г. Каждый час из произведенной продук­ ции отбираются и взвешиваются по 25 упаковок, а затем фиксируется выбороч­ ное среднее. Эту информацию можно использовать для определения распреде­ ления этих выборочных средних. Мы знаем среднее совокупности ц = 400 и среднеквадратическое отклонение совокупности а = 20, а также объем выборок п = 25.

Эти данные позволяют нам определить вероятные значения выборочных средних. Распределение выборочных средних определяется следуюшим образом.

Среднее выборочных средних ц = 400 г. Среднеквадратическое отклонение выборочных средних:

а

_

20

20

^

^ ^

^ 5

= 4 г.

Таким образом, данная информация позволяет нам определить вероят­ ность того, что выборочные средние нахохштся в пределах заданных диапазонов. Например, вероятность того, что выборочная средняя превышает 405 г, пока­ зана вьщеленным участком под кривой на рис. 2.25.

Обратите внимание, что среднеквадратическое отклонение, используемое при вычислении z, есть среднеквадратическое отклонение выборочных средних

a/Jn-

 

 

Z=

405 - 400

, ^^

-^

= 1.25.

По таблице нормального распределения находим, что вьщеленный участок равен 0.10565. Таким образом, существует вероятность в 10.565% того, что вы­ борочная средняя превышает 405 г. На основании той же самой информации мы можем рассчитать ожидаемую вариацию для выборочных средних. Например, при условии нормального распределения 95%-ные доверительные пределы для выборочных средних рассчитываются следующим образом:

о с н о в ы ТЕОРИИ ВЕРОЯТНОСТИ

89

400 ± 1.96 X 4 = 400 + 7.84, т. е. от 392.16 до 407.84 г.

Среднеквадра-

тическое отклонение = -pz = 4

4п

405 Средняя арифметическая

ц=400

Рис. 2.25. Распределение выборочных средних

Таким образом, мы можем быть на 95% уверены, что любая выборка из 25 упаковок на этом производстве будет иметь среднюю арифметическую от 392.16 до 407.84 г. Это дает основу для определения значимости выборочной средней. Если полученная средняя находится вне ожидаемого диапазона, тогда она на­ зывается «значимой». Значение вне диапазона достаточно маловероятно, и по­ этому оно может подсказать нам, что на производстве возникла проблема.

Например, если установлено, что выборка из 25 упаковок имеет среднюю арифметическую, равную 410 г, то, похоже, вес упаковок значительно превы­ шает заданный вес. Поэтому мы должны еще раз проверить производственный процесс и скорректировать его там, где это необходимо.

Пример 2

Известно, что дневная выработка трюфелей «Труфл» представляет собой нормальное распределение со средней арифметической 2500 изделий и среднеквадратическим отклонением 300 изделий в день. После запуска новой установ­ ки на производстве в течение 50 дней проводилось выборочное обследование, в ходе которого была зафиксирована среднедневная выработка в 2600 изделий Начальник производственного отдела считает, что это свидетельство того, что запуск новой установки привел к увеличению выработки. Чтобы проверить дан­ ное утверждение, рассмотрим распределение выборочных средних и попробуем установить, насколько сильно изменилось новое значение среднего.

Первоначальная совокупность имеет среднюю, равную ц = 2500, и среднеквацратическое отклонение а = 300. Если из этой совокупности взять выборки из 50 значений, то распределение выборочных средних будет иметь среднее

ц= 2500 и среднеквадратическое отклонение а/л/« = 300/V50 =300/7.07 = 42 43.

Далее, для данной совокупности 95%-ные доверительные пределы значений выборочных средних определяются по формуле: 2500 + 1.96 х 42.43 = 2500 + + 83.16 = от 2416.8 до 2583.2 изделия.

Таким образом, для старой установки любая выборка продукции в течение 50 дней, скорее всего, имеет среднюю в данном диапазоне.

9 0

ГЛАВА 2

Отсюда следует, что выборочная средняя вне этого диапазона маловероят­ на То есть арифметическая средняя, равная 2600, значима, что указывает на маловероятность ее достижения на старом оборудовании. Следовательно, сово­ купность показателей дневной выработки изменилась. Это подтверждает заявле­ ние начальника производственного отдела о том, что при использовании ново­ го оборудования выработка стала другой.

2.17. Проверка гипотезы

Процесс, описанный в предыдущем разделе, подвел нас к рассмотрению вопроса о проверке гипотезы. Во многих практических ситуациях мы делаем допущения относительно совокупности, которые, возможно, требуют объек­ тивной проверки. Такие допущения называют «гипотезами», и они могут быть подтверж.1ены или, наоборот, развенчаны с помощью соответствующих крите­ риев проверки гипотезы, в которых задействованы понятия вероятности. В этом разделе мы рассмотрим допущения, включающие понятие средней арифмети­ ческой совокупности, и представим критерии, которые можно использовать при рассмотрении таких допущений.

Пример 1 (при известном среднеквадратическом отклонении)

Вкомпании «Даунбрукс» полагают, что средний вес определенного щоколадного изделия составляет 400 г. Известно, что среднеквадратическое отклоне­ ние при этом равно 20 г. На линии выборочно обследовали 100 изделий и установили, что среднее арифметическое составляет 402 г. Проверим, опровер­ гает ли данное обследование предположение о средней совокупности.

Вданном примере мы имеем:

в

выборке: среднее х = 402, объем выборки п =

100;

в

совокупности: среднеквадратическое отклонение

сг = 20.

Исходное допущение (называемое нулевой гипотезой) состоит в том, что средняя совокупности (ц) составляет 400 г. Если это утверждение ложно, тогда альтернативное допущение состоит в том, что средняя не равна 400 г.

Процесс формулирования нулевой гипотезы и альтернативной гипотезы можно представить следующим образом:

Но: ц = 400 (нулевая гипотеза);

Н,: ц ;t 400 (альтернативная гипотеза).

Если нулевая гипотеза верна, то совокупность имеет среднюю ц = 400 и среднеквадратическое отклонение о = 20. Если взять выборки из 100 изделий, то распределение выборочных средних (как показано в предыдущем разделе)

будет иметь среднюю ц = 400 и среднеквадратическое отклонение а/>/л =

= 20/VlOO =20/10= 2.

Гипотеза проверяется путем рассмотрения того, является ли полученная выборочная средняя «значимой», иначе говоря, находится ли это значение вне доверительных пределов. Вместо вычисления доверительных пределов и сравне­ ния их с полученным значением мы можем пойти по другому пути. Необходимо только провести расчеты по следующей формуле:

о с н о в ы ТЕОРИИ ВЕРОЯТНОСТИ

9 1

Это значение затем можно сравнить с таким критическим значением, как 1.96, если мы берем 95%-ные доверительные пределы.

Таким образом, в данном примере

, ^ х - ц ^ 402-400^ 2 cy/^[^~ 20/л/100 "20/10"

Итак, значение z (= 1) меньше 1.96 и поэтому «не значимо» при 95%-ных доверительных пределах. (В том, что касается предыдущего раздела, это означа­ ет, что выборочная средняя находится внутри 95%-ных доверительных преде­ лов.) Следовательно, мы можем принять нулевую гипотезу, т. е. мы принимаем Но. Отсюда следует, что данная выборка не заставила нас усомниться в допуще­ нии того, что средний вес изделия составляет 400 г. Таким образом, мы не можем воспользоваться фактами, полученным в ходе данного выборочного об­ следования, чтобы доказать, что параметры производства не выдерживаются.

Пример 2 (среднеквадратическое отклонение неизвестно)

Когда мы пользуемся критериями проверки гипотезы на практике, средне­ квадратическое отклонение совокупности нам, как правило, не известно.

Обычно среднеквадратическое отклонение рассчитывается на основе выбо­ рочного значения. Среднеквадратическое отклонение совокупности обычно обо­ значается как ст, а среднеквадратическое отклонение выборки — как s.

Формула для Z, используемая для проверки гипотез по больщим выбор­ кам, может быть дополнена среднеквадратическим отклонением выборки, как это показано ниже:

_ X - ц _ X - \х

п - 1

Эта преобразованная формула, включающая среднеквадратическое откло­ нение выборки {s), получена путем определения «наилучшего» значения среднеквадратического отклонения совокупности (а), что мы сейчас и опишем. Дисперсия совокупности будет, скорее всего, несколько больше дисперсии выборки, и поэтому «наилучшее» значение получается по следующей формуле:

2 « 2

п - 1

Путем перестановки получаем

пп-\

инаконец, после извлечения квадратного корня получаем

9 2

ГЛАВА 2

л/л л/« - 1

Таким образом, мы приходим к формуле, представленной вначале. Значение z затем можно сравнить с 1.96 при 5%-ном уровне значимости, т. е.

при 95%-ных доверительных пределах, или же с другими значениями, например

2.58при 1%-ном уровне значимости, т. е. при 99%-ных доверительных пределах. Рассмотрим следующий пример: предполагается, что среднедневной доход

компании от реализации составляет 2000 долл. США. В течение 20 дней выбо­ рочной проверки средний доход от реализации составил 1800 долл. США в день со среднеквадратическим отклонением 300 долл. США в день. Проверьте допу­ щение с помощью соответствующих критериев оценки гипотезы.

Имеем:

нулевая гипотеза HQ: |I = 2000; альтернативная гипотеза Н,: ц т^ 2000.

Мы можем проверить это на основе выборки, объем которой п = 20, выборочное среднее х = 1800 и среднеквадратическое отклонение s = 300.

Имея эти значения, рассчитаем z по формуле

_ х - ц

^1800-2000 _

-200

_

-200

^-200 _

' "

^ V ^ / ^ ^

~ ЗОО/л/20^ " ЗОО/л/i? ~ 300/4.359 " 68.82 "

Значение

z — 2.91 больще

1.96

и

поэтому

значимо

при 5%-ном уровне

значимости. (Обратите внимание, что в данном случае при определении значи­ мости результата знак не играет роли.)

Это говорит о том, что нулевая гипотеза скорее ложна. Поэтому мы отбрасы­ ваем нулевую гипотезу и принимаем альтернативную. На основании выборки мы заключаем, что средняя совокупности вряд ли равна 2000 долл. США. Другими словами, среднедневной доход в этой компании, вероятно, не равен 2000 долл. США.

С помощью такого рода критериев оценки гипотез мы можем исследовать характеристики совокупности на основании выборочных данных.

2.18.Упражнения:

доверительные пределы и значимость

1. (Е) Имеется нормальная совокупность со средним, равным 240, и сред­ неквадратическим отклонением, равным 60.

(i)Найдите 95%-ные доверительные пределы для значений в данной сово­ купности.

(ii)Если из данной совокупности взять выборку из 100 единиц, то каковы 95%-ные доверительные пределы для выборочного среднего?

2.(1) Стоимость заказов, поступающих на предприятие, обычно представ­ ляет собой нормальное распределение со средней стоимостью 20 000 ф. ст. и среднеквадратическим отклонением в 5000 ф. ст. Имеется портфель в 100 заказов. Найдите, какова вероятность того, что средний заказ (выборочная средняя) и.меет стоимость свыще 21 000 ф. ст.

3.(I) Количество заказов, поступающих на предприятие, обычно представ­ ляет собой нормальное распределение со средним количеством 120 заказов в неделю и среднеквадратическим отклонением 42 заказа в неделю.

Соседние файлы в предмете Экономика