Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Лекция №13 _2013г_ Осн-е понятия мат.ст-ки

.pdf
Скачиваний:
22
Добавлен:
22.03.2015
Размер:
298.48 Кб
Скачать

1

«Утверждаю»

Заведующий кафедрой «Управление качеством и техническое регулирование» ВлГУ

________Ю.А. Орлов «__»_______2013 г.

Л Е К Ц И Я

по дисциплине «Теория вероятностей, математическая статистика» для бакалавров направления 221400.62 «Управление качеством»

Раздел № 3 . Основы математической статистики Занятие № 3.1. Основные понятия математической статистики Вид занятия: лекция (13)

Литература: 1). Гмурман В.Е. Теория вероятностей и математическая статистика: Учеб.пособие для вузов.- 12-е изд.,стер.-М.: Изд-во Юрайт;ИД Юрайт,2012-479 с. (187-196). 2.) Вентцель Е.С. Теория вероятностей . Учебник М.: ACADEMIA, 2003- 572с.(127-155). 3) Теория вероятностей и математическая статистика для экономистов: Уч.пособие/А.М. Карлов. – М.: КНОРУС, 2011. -264 с. (203 -242) 4.) А.И.Герасимович , Я.И.Матвеева Математическая статистика. Мн. , «Вышэщ.школа», 1978-200 с. (5-12).

Владимир 2013

2

ПЛАН

проведения занятия

№ п/п

 

Учебные вопросы занятия

Время,

 

 

 

 

мин.

 

I.

Вводная часть: Объявление темы, темы занятия.

2-3

 

 

Постановка учебных целей занятия.

 

 

II

Основная часть.

75

 

 

1.

Предмет и задачи математической статистики.

 

 

 

 

Генеральная и выборочная совокупности.

 

 

 

2.

Статистический ряд. Статистический закон

 

 

 

 

распределения случайной величины.

 

 

 

3.

Эмпирическая функция распределения . Гра-

 

 

 

 

фическое представление статистических рядов.

 

 

111

Заключительная часть

2-3

 

 

 

 

 

 

Подведение итогов занятия. Выдача задания на са-

 

 

 

мостоятельную работу.

 

 

 

 

 

 

 

3

Материал основной части лекции.

1. Предмет и задачи математической статистики. Генеральная и выборочная совокупности.

1.1 Предмет и задачи математической статистики

Теория вероятностей и математическая статистика занимаются количественным и качественным анализом закономерностей случайных массовых явлений. При изучении курса теории вероятностей предполагалось, что вероятности наступления отдельных событий известны. Считались известными законы рас-

пределения случайных величин или их числовые характеристики.

Как правило, на практике вероятности наступления событий, законы распределения случайных величин или параметры этих законов распределения неизвестны. Для их определения (оценивания) необходимо производить экспери-

мент, специальные испытания.

Математическая статистика разрабатывает методы математической обработки результатов (экспериментов) испытаний с целью получения сведений о вероятностях наступления отдельных событий, о законах распределения случайных величин или параметрах этих законов.

При обработке результатов эксперимента статистическими методами основные понятия теории вероятностей вероятность наступления случайного собы-

тия, законы распределения случайных величин, параметры законов распределения случайных величин и т. д. выступают как некоторые математические модели

реальных закономерностей.

Таким образом, теория вероятностей разрабатывает математические мо-

дели, необходимые для описания реальных закономерностей случайных массо- вых явлений, формирует систему взглядов на статистическую обработку результатов эксперимента.

Основой статистических методов являются экспериментальные данные,

часто называемые статистическими данными.

Статистическими данными называют сведения об различных объектах материального мира и сфер жизнедеятельности человека (в том числе и экономике), обладающих теми или иными признаками и полученные экспериментальным путём. Например, статистическими данными являются: данные о финансовой и экономической деятельности всевозможных предприятий и организаций, данные о банковской системе государства, данные о налогах и сборах и т.д и т.п.

Все перечисленные данные и другие статистические данные являются числовыми характеристиками массовых случайных явлений, поэтому предметом математической статистики являются случайные явления, а ее основной задачей — количественный и качественный анализы этих явлений.

Различные авторы учебной литературы по математической статистике выделяют различное количество и содержание основных (типичных) задач математической статистики 2-е (В.Е. Гмурман), 3-и (Е.С. Вентцель), 6-ть (А.Г. Герасимович) и более.

4

Так, например, В.Е.Гмурман, выделяя две основные задачи математической статистики, к первой из них относит – указание способов сбора и группировки статистических сведений, полученных в результате наблюдений или в результате специально поставленных экспериментов, а ко второй разработка методов анализа статистических данных в зависимости от целей исследования.

Е.С.Вентцель, к типичным задачам математической статистики, часто встречаемых на практике, относит, к первой – задача определения закона распределения случайной величины (или системы случайных величин) по статистическим данным; к второй – задача проверки правдоподобия выдвинутых гипотез о принадлежности имеющихся статистических данных к тому или иному теоретическому закону распределения; и к третьей задаче – задача нахождения неизвестных параметров статистического материала.

А.Г. Герасимович считает, что основные задачи математической статистики состоят в разработке методов:

1)организации и планирования статистических наблюдений;

2)сбора статистических данных;

3)«свертки информации», т. е. методов группировки и сокращения стати-

стических данных с целью сведения большого числа таких данных к небольшому числу параметров, которые в сжатом виде характеризуют всю исследуемую совокупность;

4)анализа статистических данных;

5)принятия решений, рекомендаций и выводов на основе анализа статистических данных;

6)прогнозирования случайных явлений.

Анализ точек зрения по вопросу основных задач математической статистики,

указанных, например, авторов, позволяет сделать вывод о том, что все эти точки зрения верны и обоснованы, пожалуй, лишь одни авторы смотрят на эти задачи более широко (или шире), а другие более конкретно и специализированно к тому профилю которым они занимаются.

В практике статистических наблюдений различных объектов в настоящее время человечество использует 2 метода наблюдений: 1-й - сплошной, предусмат-

ривающий проведение обследований (изучение) всех однородных объектов совокупности относительно некоторого качественного или количественного признака, характеризующего эти объекты; 2-й – выборочный, предусматривающий про-

ведение обследований (изучение) лишь части (ограниченного количества) однородных объектов из всей совокупности.

1-й - сплошной метод на практике, применяют сравнительно редко, что часто

обусловлено при его применении либо большими финансовыми, материальными и временными затратами, либо связано с уничтожением объектов статистического наблюдения. Поэтому одним из основных методов статистического наблю-

дения, является 2-й выборочный метод.

Рассмотрим основные понятия этого метода.

M (εi )= 0.
f (ti ) = const = a,

5

1.2 Генеральная и выборочная совокупности

Пусть для исследования закономерностей случайного объекта (процесса, явления, материального объекта и других) произведено «n» опытов, в результате

которых получен ряд наблюдений x1, x2 ,...xn , некоторого количественного или

качественного его признака. Например, количество электроэнергии, потреблённое ОАО «Автоприбор» за каждый день в прошедшем квартале. Требуется обра-

ботать этот ряд статистически.

Для любой статистической обработки надо вначале построить математиче-

скую модель ряда наблюдений, т. е. указать, какие величины случайны, какие не случайны, какие зависимы, какие независимы и т. д.

Для результатов наблюдений x1, x2 ,...xn

матические модели. Рассмотрим, например,

ряд наблюдений задаётся формулой:

xi = f (ti )+ εi

можно построить различные математематическую модель, в которой

(1.1)

где ti - значение некоторой детерминированной переменной, характеризующей i - й опыт (например, астрономическое время снятия показаний со счётчи-

ков электрической энергии во всех цехах, зданиях и сооружениях ОАО «Автоприбор»); f (ti ) - некоторая функция определённого вида, характеризующего i -

й опыт в момент времени ti ; εi - случайная величина, обычно называемая ошибкой i - го эксперимента (например, инструментальная ошибка счётчика элек-

трической энергии).

Относительно ошибок εi в модели ряда наблюдений, задаваемого формулой

(1.1) можно делать различные предположения. Допустим, мы будем исходить из

наиболее простых предположений относительно функции f (ti ) и ошибок εi . С этой целью положим в общей модели ряда наблюдений, задаваемого формулой

(1.1), значение причём систематическую ошибку M (εi ), при-

сутствовавшую при наблюдениях за показаниями электросчётчиков, примем равной нулю, т.е. Тогда, в этом частном случае, математическая модель

ряда наблюдений примет более простой вид:

 

 

 

xi = a + εi ,

(1.2)

 

 

 

 

где

x1, x2 ,...xn

- результаты

некоторой постоянной величины

наблюдения

(например, показания счётчиков электрической энергии на ОАО «Автоприбор»,

причем эти результаты организованы таким образом, что систематические ошибки достаточно малы и ими можно пренебречь, а колебания результатов измерений объясняются случайными ошибками εi . Далее, наложим на случайные

ошибки εi простейшие статистические предположения - ошибки εi независи-

6

мыми, а измерения выполненными в одинаковых стабильных условиях т.е. из-

мерения равноточные.

Если эти предположения выполнены, то исследуемое случайное явление, обла-

дающее количественным признаком Χ (количество электроэнергии, потреблённое ОАО «Автоприбор» за каждый день в прошедшем квартале), будем рассматривать как одномерную случайную величину X(CB X ).

Поставим задачу - оценить функцию распределения F(x) исследуемой СВ Х,

т.е. построить уточнённую вероятностную модель ряда наблюдений x1, x2 ,...xn

которая бы отражала в себе основные статистические особенности этого ряда.

Чаще всего, как говорилось ранее неоднократно, полагают, что ошибки измерения εi имеют нормальный закон распределения с параметрами – МОЖ (а) и

СКО (σ). Поэтому, при этом предположении плотность вероятности исследуемой СВ Х имеет вид:

(1.3)

Таким образом, построив нормальную модель ряда наблюдений, затем про-

изводят оценку параметров α и σ вероятностной модели ряда наблюдений. Наиболее точные сведения о случайной величине X можно получить, произво-

дя максимально возможное количество измерений этой случайной величины. Поэтому в математической статистике, для данных случаев статистических на-

блюдений, используют понятие генеральной совокупности.

Генеральной совокупностью называется совокупность всех мыслимых наблюдений, которые могли бы быть сделаны при данном реальном комплексе условий измерений.

Число членов, образующих генеральную совокупность, называется объемом генеральной совокупности.

В значительном количестве случаев мы можем произвести сколь угодно много наблюдений случайной величины X, т. е. генеральная совокупность бесконечна. Однако в некоторых случаях, например, при контроле заработной платы сотруд-

ников на предприятии, генеральная совокупность состоит из конечного числа (например, сотрудников).

Принято выделять три основных типа генеральной совокупности:

1)конечно и реально существующая, например, число предприятия (органи-

зации);

2)бесконечно и реально существующая, например, множество действитель-

ных чисел, лежащих между нулем и единицей;

3)воображаемая (гипотетическая) конечная или бесконечная, например, ко-

личество находящихся в обращении на территории России денежных купюр достоинством 50 рулей.

 

 

 

7

 

 

Не

редко,

под

генеральной совокупностью

понимают

другое

определение, а именно, генеральная совокупность это совокупность объектов, из

которых производится выборка.

Выборочной совокупностью или просто выборкой объема «n» называется совокупность «n» объектов, отобранных из исследуемой генеральной совокупности.

Иногда используют другое понятие выборки: Выборка это совокупность случайно отобранных объектов.

Ряд наблюдений x1, x2 ,...xn принято рассматривать как выборку объема «n»

из конечной или бесконечной генеральной совокупности.

Таким образом, можно дать следующее определение выборочного метода. Выборочный метод это метод статистических наблюдений, состоящий в том,

что на основании характеристик и свойств выборки x1, x2 ,...xn делаются заклю-

чения о числовых характеристиках и законе распределении случайной величины

Х.

1.3 Виды выборок и способы отбора объектов для них

При составлении выборки можно поступать двумя способами: после того как объект отобран и над ним произведено наблюдение, 1) либо он может быть возвращен, 2) либо не возвращен в генеральную совокупность. По этой причине, выборки подразделяют на: повторные и бесповторные.

Повторной называют выборку, при которой отобранный объект (перед отбо-

ром следующего) возвращается в генеральную совокупность.

Бесповторной называют выборку, при которой отобранный объект в гене-

ральную совокупность не возвращается.

На практике обычно пользуются бесповторным случайным отбором.

Если объем генеральной совокупности достаточно велик, а выборка состав-

ляет лишь незначительную часть этой совокупности, то различие между повторной и бесповторной выборками стирается.

Для того чтобы по данным выборки можно было достаточно уверенно судить об интересующем признаке генеральной совокупности, необходимо, чтобы объ-

екты выборки правильно его представляли.

Это требование коротко формулируют так: выборка должна быть репрезентативной (представительной), т. е. достаточно хорошо представляла исследуемую случайную величину.

В силу закона больших чисел можно утверждать, что выборка будет репрезентативной, если ее осуществить случайно: каждый объект выборки отобран случайно из генеральной совокупности; если все объекты имеют одинаковую вероятность попасть в выборку.

 

8

 

Существуют

специально разработанные методы

получения

репрезентативных выборок, суть которых сводится к тому, чтобы при извлечении выборки каждый элемент генеральной совокупности имел одинаковую с другими элементами вероятность быть включенным в выборку. Другими словами, выбор элементов из генеральной совокупности должен быть случайным.

Случайность выборки обеспечивается применением различных способов отбора объектов наблюдения для выборки, которые можно разделить на 2 вида:

1. Отбор, не требующий разбиения генеральной совокупности на части (простой отбор). Сюда относятся: а) простой случайный бесповторный отбор; б)

простой случайный повторный отбор; в) простой случайный отбор с помощью случайных чисел.

2. Отбор, при котором генеральная совокупность разбивается на части (отбор с разбиением генеральной совокупности на части). Сюда относятся: а) типический отбор; б) механический отбор; в) серийный отбор.

Рассмотрим 1-й вид отбора.

Простым отбором называют такой отбор, при котором объекты извлекают по одному из всей генеральной совокупности.

Простой отбор можно осуществить различными 3-мя способами (а, б, в).

а) Простой случайный повторный отбор, применяемый для небольшого объё- ма генеральной совокупности.

Например, для извлечения п объектов из генеральной совокупности объема N поступают так: выписывают номера от 1 до N на карточках, которые тщательно перемешивают, и наугад вынимают одну карточку; объект, имеющий одинаковый номер-с извлеченной карточкой, подвергают обследованию; затем карточку возвращают в пачку и процесс повторяют, и т. Д. Так поступают п раз – в итоге получают простую случайную повторную выборку объема п.

б) Простой случайный бесповторный отбор применяется для небольшого объ- ёма генеральной совокупности, аналогичен простому случайному повторному отбору, лишь за тем исключением, что извлеченные карточки не возвращаются в пачку.

в) Простой случайный отбор с помощью случайных чисел применяется для большого объёма генеральной совокупности, причём может быть как с повторным, так и бесповторным отбором объектов.

При использовании случайного отбора с помощью случайных чисел пользуются либо готовыми таблицами «случайных чисел», в которых числа располо-

жены в случайном порядке, либо используют генератор случайных чисел и еалиизуютметод Монте-Карло.

Для повторного отбора выборки, при использовании таблиц «случайных чи-

сел», например, чтобы отобрать 50 объектов из пронумерованной генеральной совокупности, открывают любую страницу таблицы случайных чисел и выписывают подряд 50 чисел; в выборку попадают те объекты, номера которых совпадают с выписанными случайными числами. Если бы оказалось, что случайное число таблицы превышает число N, то такое случайное число пропускают.

При осуществлении бесповторного отбора выборки, в отличии от повторного отбора выборки случайные числа таблицы, уже встречавшиеся ранее, следует пропускать.

9

Рассмотрим 2-й вид отбора выборки - Отбор с разбиением

генеральной совокупности на части.

Как указывалось выше, к данному отбору относятся: а) типический отбор; б) механический отбор; в) серийный отбор.

а) Типическим называют отбор, при котором объекты отбираются не из всей генеральной совокупности, а из каждой ее «типической» части. Например, если

оценивается уровень заработной платы на крупном предприятии, то отбор производят не из всех сотрудников предприятия, а из сотрудников типичных подразделений этого предприятия (управленческого персонала, сотрудников производственных подразделений, сотрудников вспомогательного персонала).

Как правило, типическим отбором пользуются тогда, когда обследуемый признак заметно колеблется в различных типических частях генеральной совокупности.

б) Механическим называют отбор, при котором генеральную совокупность «механически» делят на столько групп, сколько объектов должно войти в выборку, а из каждой группы отбирают один объект. Например, если нужно отобрать 20% депозитных вкладов населения в банке, то отбирают каждый пятый депозитный вклад; если требуется отобрать 5% депозитных вкладов населения в банке, то отбирают каждую двадцатый депозитный вклад, и т. д.

Следует заметить, что иногда механический отбор может не обеспечить репрезентативности выборки.

в) Серийным называют отбор, при котором объекты отбирают из генеральной совокупности не по одному, а «сериями», которые подвергаются сплошному обследованию. Например, если оцениваются пенсионные вклады населения в городе, в субъекте государства, в регионе, в целом в стране, то подвергают сплошному обследованию пенсионные вклады только нескольких банков.

Серийным отбором пользуются тогда, когда обследуемый признак колеблется в различных сериях незначительно.

На практике часто применяется комбинированный отбор, при котором соче-

таются указанные выше способы. Например, иногда разбивают генеральную совокупность на серии одинакового объема, затем простым случайным отбором выбирают несколько серий и, наконец, из каждой серии простым случайным от-

бором извлекают отдельные объекты.

2. Статистический ряд. Статистический закон распределения случайной величины

Предположим, что изучается некоторая дискретная или непрерывная случайная величина, закон распределения которой неизвестен. Для оценки закона распределения этой случайной величины или его числовых характеристик, отбира-

ется выборка и производится ряд независимых измерений (наблюдений)

10

x1, x2 ,...xn . Наблюдаемые значения xi называют вариантами.

Статистический материал, полученный в результате измерений (наблюдений),

представляют в виде таблицы, состоящей из двух строк, в первой из которых да-

ны номера измерений, а во второй — результаты измерений (см. табл.2.1).

Таблицу указанного вида называют простым статистическим рядом. Он

представляет собой первичную форму представления статистического материала.

Таблица 2.1

Простой статистический ряд

Статистический материал в виде простого статистического ряда при большом числе измерений трудно обозрим, по нему практически невозможно оценить закон распределения исследуемой СВ X. Поэтому для визуальной оценки закона распределения исследуемой СВ Χ производят группировку данных.

Если изучается дискретная случайная величина, то наблюденные значения располагаются в порядке возрастания (или убывания) и подсчитываются часто-

ты mi (число наблюдений xi значения, т.е. варианты xi ) или частости mni (отно-

сительные частоты- отношение частоты mi к объёму выборки n) появления оди-

наковых значений случайной величины Х.

В результате получаем сгруппированные статистические ряды следующего вида (таблица частот – табл.2.2, а таблица частостей (относительных частот) –

табл.2.3:

Таблица 2.2

Статистический ряд частот