Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Статистика.docx
Скачиваний:
28
Добавлен:
19.04.2015
Размер:
583.94 Кб
Скачать

Часть 2. Математическая статистика

Тема 1: выборочный метод

Термин «выборочные исследования» применяют, когда невозможно или экономически нецелесообразно изучить все единицы представляющей интерес совокупности. Приходится знакомиться с частью совокупности – с выборкой, а затем с помощью статистических методов и моделей переносить выводы с выборки на всю совокупность.

Пусть требуется изучить совокупность однородных объектов относительно некоторого количественного или качественного признака, характеризующего эти объекты. Обозначим количество всех подлежащих обследованию объектов N (). Допустим, что каждому объектуi для изучаемого признака X соответствует наблюдаемое значение . Совокупность всех возможных значений подлежащих обследованию объектов называетсягенеральной совокупностью, а Nобъёмом генеральной совокупности. Генеральная совокупность может быть конечной или бесконечной. Совокупность случайно отобранных (реально наблюдаемых) объектов называется выборочной совокупностью или просто выборкой, а её объём обозначается n. Выборка должна обладать следующими свойствами:

  • каждый элемент выбран случайно;

  • все имеют одинаковую вероятность попасть в выборку;

  • n должно быть настолько велико, насколько это позволяет решать задачу с требуемым качеством (выборка должна быть репрезентативной, представительной).

Принято считать, что при n>60 выборка большая, или репрезентативная, а при n<60 – малая. Такое деление выборки на

большую и малую условно. Разные авторы используют разное пограничное n, делящее выборки на большие и малые, которое зависит от решаемой задачи. В зависимости от способа отбора объектов выборки подразделяют на повторные и бесповторные.

Повторной называют выборку, при которой отобранный объект (перед отбором следующего) возвращается в генеральную совокупность.

Бесповторной называют выборку, при которой отобранный объект в генеральную совокупность не возвращается.

На практике применяются различные способы отбора, которые принципиально можно подразделить на два вида:

  1. отбор, не требующий расчленения генеральной совокупности на части: а) простой случайный бесповторный отбор; б) простой случайный повторный отбор;

  2. отбор, при котором генеральная совокупность разбивается на части: а) типический отбор; б) механический отбор; в) серийный отбор.

Простым случайным называют такой отбор, при котором объекты извлекают по одному из всей генеральной совокупности (лотерея, с помощью таблицы случайных чисел). Типическим называют отбор, при котором объекты отбираются не из всей генеральной совокупности, а из каждой её «типической» части. Механическим называют отбор, при котором генеральную совокупность «механически» делят на столько групп, сколько объектов должно войти в выборку, а из каждой группы отбирают один объект. Серийным называют отбор, при котором объекты отбирают из генеральной совокупности не по одному, а «сериями», которые подвергаются сплошному обследованию. Часто применяется ком-бинированный отбор, при котором сочетаются указанные способы.

Расположение выборочных наблюдённых значений изучаемого признака X в порядке неубывания называется ранжированием. Значение X, соответствующее отдельной группе сгруппированного ряда наблюдаемых данных, называется вариантой, а изменение этого значения – варьированием. Численность отдельной группы сгруппированного ряда наблюдаемых данных называется частотой и обозначается , отношениеназываетсяотносительной частотой и обозначается .

Дискретным вариационным рядом распределения называется ранжированная совокупность вариант с соот-ветствующими им частотами или относительными частотами.

Если наблюдаемый случайный признак представляет собой реализацию непрерывной случайной величины или дискретной случайной величины с большим количеством возможных значений, то для построения вариационного ряда используют интервальный ряд распределения. В этом случае весь возможный интервал варьирования разбивают на конечное число частичных интервалов и подсчитывают частоту попадания значений величины в каждый частичный интервал.

Интервальным вариационным рядом называется упорядоченная последовательность интервалов варьирования случайного признака с соответствующими частотами или относительными частотами попаданий в каждый из них.

Пример 14.1 В супермаркете фиксировали, сколько покупателей обслуживали в кассе за один час. Наблюдения в течение 30 часов

дали следующие результаты:

70, 75, 100, 120, 75, 60, 100, 120, 70, 60, 65, 100, 65, 100, 70, 75, 60, 100, 100, 120, 70, 75, 70, 120, 65, 70, 75, 70, 100, 100.

Обработайте результаты наблюдений и постройте вариационный ряд.

Решение: Число покупателей, обслуживаемых в кассе за час, представляет собой реализацию дискретной случайной величины, обозначим её X. Полученные данные являются выборкой из 30 наблюдений. Составим ранжированный ряд распределения:

60, 60, 60, 65, 65, 65, 70, 70, 70, 70, 70, 70, 70, 75, 75, 75, 75, 75, 100, 100, 100, 100, 100, 100, 100, 100, 120, 120, 120, 120.

Получено 6 групп, т.е 6 различных значений случайной величины. Для каждой группы подсчитаем частоту значений варианты и соответствующую относительную частоту.:

60

65

70

75

100

120

3

3

7

5

8

4

3/30

3/30

7/30

5/30

8/30

4/30

Полученная таблица и есть вариационный ряд.

Выборочной функцией распределения или эмпирической называется функция , задающая для каждого значенияx относительную частоту события Xx.

Свойство статистической устойчивости частоты, обоснованное теоремой Бернулли, оправдывает целесообразность использования функции при большихn в качестве приближённого значения неизвестной теоретической функции распределения .

Функции иобладают одинаковыми свойствами.

Наблюдаемые данные, представленные в виде вариационного

ряда, можно изобразить графически, используя либо график функции , либо полигон или гистограмму относительных частот.

Полигоном относительных частот называют ломанную, отрезки которой соединяют точки ,, …,.

Гистограммой относительных частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длины , а высоты равны отношению. Площадь гистограммы относительных частот равна сумме всех относительных частот, т.е. единице.