Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Теория вероятностей и математическая статистика. Прикладная статистика с использованием MS EXCEL

.pdf
Скачиваний:
8
Добавлен:
12.11.2023
Размер:
3.04 Mб
Скачать

Федеральное агентство по образованию

Государственное образовательное учреждение высшего профессионального образования «Пермский государственный технический университет»

А.А. Адамов

ТЕОРИЯ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКАЯ СТАТИСТИКА.

ПРИКЛАДНАЯ СТАТИСТИКА С ИСПОЛЬЗОВАНИЕМ

MS EXCEL

Утверждено Редакционно-издательским советом университета

в качестве учебного пособия

Издательство Пермского государственного технического университета

2008

УДК 519.21(075.8) А28

Рецензенты:

доктор физико-математических наук, профессор В.Э. Вильдеман (Пермский государственный технический университет); доктор технических наук, ведущий научный сотрудник ИМСС УрО РАН, профессор И.К. Березин

(Пермская сельскохозяйственная академия)

Адамов, А.А.

А28 Теория вероятностей и математическая статистика. Прикладная статистика с использованием MS Excel: учеб. пособие / А.А. Адамов. – Пермь: Изд-во Перм. гос. техн.

ун-та, 2008. – 174 с.

ISBN 978-5-398-00030-6

Содержит материал для самостоятельного изучения основных положений прикладной статистики и освоения с помощью MS Excel техники статистической обработки реальных данных в ходе инженерной и управленческой практики.

Содержание примерно соответствует третьей части популярного учебника и руководства В.Е. Гмурмана по теории вероятностей

иматематической статистике, в нем изложены необходимые теоретические положения, параллельно рассмотрено «классическое» решение примеров и их решение с помощью MS Excel.

Приведены задания для выполнения расчетно-графических работ

ипояснения по их выполнению.

Может быть использовано студентами различных инженернотехнических специальностей при изучении прикладной статистики в рамках курса высшей математики, специализированных курсов, при выполнении курсовых и дипломных работ.

УДК 519.21(075.8)

Издано в рамках приоритетного национального проекта «Образование» по программе Пермского государственного технического университета «Создание инновационной системы формирования профессиональных компетенций кадров и центра инновационного развития региона на базе многопрофильного технического университета»

ISBN 978-5-398-00030-6

© ГОУ ВПО «Пермский

 

государственный технический

 

университет», 2008

ОГЛАВЛЕНИЕ

 

ПРЕДИСЛОВИЕ.....................................................................................

5

1. ОСНОВНЫЕ ПОНЯТИЯ МАТЕМАТИЧЕСКОЙ

 

СТАТИСТИКИ..........................................................................................

9

1.1. Генеральная совокупность и выборка ......................................

10

1.2. Основные распределения случайных величин,

 

используемые в математической статистике..................................

13

1.2.1. Стандартное нормальное распределение N (0; 1) ............

14

1.2.2. Распределение χ2 ...............................................................

21

1.2.3. Распределение Стьюдента..................................................

25

1.2.4. Распределение Фишера (Фишера – Снедекора)...............

30

Вопросы для самопроверки и защиты расчетно-графической

 

работы № 1 ..............................................................................................

33

2. ПЕРВИЧНАЯ ОБРАБОТКА РЕЗУЛЬТАТОВ

 

(ДЛЯ ОДНОМЕРНОЙ ВЫБОРКИ) ......................................................

35

2.1. Графический анализ выборки, полигоны и гистограммы,

 

выборочная функция распределения...............................................

39

2.1.1. Построение гистограмм вручную и в MS Excel...............

43

2.2. Числовые характеристики статистического (выборочного)

 

распределения ....................................................................................

49

2.2.1. Вычисление числовых характеристик выборки

 

в MS Excel ......................................................................................

55

2.3. Точечная оценка неизвестных параметров распределения....

59

2.3.1. Метод наибольшего правдоподобия.................................

59

2.3.2. Метод моментов..................................................................

62

2.4. Интервальное оценивание неизвестных параметров

 

нормально распределенной генеральной совокупности................

64

2.4.1. Доверительный интервал для оценки

 

математического ожидания нормального распределения

 

при известной дисперсии .............................................................

65

2.4.2. Доверительный интервал для оценки математического

 

ожидания нормального распределения при неизвестной

 

дисперсии.......................................................................................

70

2.4.3. Доверительный интервал для оценки дисперсии

 

нормального распределения.........................................................

71

2.5. Точечная и интервальная оценки вероятности успеха

 

для биномиального закона распределения (испытания

 

по схеме Бернулли) .......................................................................

76

 

3

Вопросы для самопроверки и защиты расчетно-графической

 

работы № 2...............................................................................................

78

3. ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ ................................

80

3.1. Правильные решения и ошибки, допускаемые

 

при проверке статистических гипотез .............................................

85

3.2. Проверка параметрических статистических гипотез ..............

89

3.3. Проверка параметрических статистических гипотез

 

с помощью тестов MS Excel...............................................................

99

3.4. Проверка непараметрических статистических гипотез..........

110

3.3.1. Критерий согласия χ2 (Пирсона) .....................................

112

Вопросы для самопроверки и защиты расчетно-графической

 

работы № 3..............................................................................................

127

4. УКАЗАНИЯ ПО ВЫПОЛНЕНИЮ КОНТРОЛЬНЫХ РАБОТ

 

И УСТАНОВКЕ ПАКЕТА АНАЛИЗА MS EXCEL ...........................

128

4.1. Задание для расчетно-графической работы № 1.....................

131

4.2. Задание для расчетно-графической работы № 2.....................

132

4.3. Задание для расчетно-графической работы № 3.....................

139

Библиографический список ..................................................................

141

ПРИЛОЖЕНИЕ 1. ВВЕДЕНИЕ В MS EXCEL: ОБЩАЯ

 

ХАРАКТЕРИСТИКАИФУНКЦИОНАЛЬНЫЕВОЗМОЖНОСТИ.....

142

1. Понятие электронной таблицы....................................................

142

2. Общая характеристика интерфейса MS Excel............................

144

3. Технология ввода данных в MS Excel.........................................

147

4. Графические возможности Excel.................................................

152

5. Средства структуризации и первичной обработки данных......

155

Контрольные вопросы ......................................................................

158

ПРИЛОЖЕНИЕ 2...................................................................................

159

4

ПРЕДИСЛОВИЕ

Развитие наукоемких технологий, как правило, основано на применении высоких статистических технологий организации и управления производством. Особенно активно они используются в высокотехнологичных отраслях промышленности для решения задач точности изготовления и взаимозаменяемости деталей машин, для оценки ресурса и надежности техники. Без вероятностно-статистических методов немыслима оценка и анализрискавмедицине, страховойифинансовой деятельности.

Прикладная статистика позволяет специалистам самого разного профиля успешно применять программные интеллектуальные инструменты принятия решений, основанные на вероятности и статистике. Базой для такого анализа является организация сбора, упорядоченной регистрации, группировки и обработки необходимой информации с использованием современных компьютеризированных средств.

Прикладная статистика опирается на математический аппарат теории вероятности и математической статистики. Изучение и практическое освоение этих разделов высшей математики немыслимо без решения большого круга примеров

изадач.

Вкачестве учебной литературы по теории вероятности

истатистике для студентов технических вузов широко используются многократно переизданные учебники и учебные пособия В.Е. Гмурмана [1–2]. Их недостатком в современных условиях является ориентация на ручной способ всех вычислений

исложное использование многочисленных справочных таблиц при решении примеров.

Это обстоятельство существенно снижает производительность труда студентов и инженеров за счет трудоемкости калькуляторных вычислений даже при решении учебных задач

5

малой размерности и не способствует освоению доступной вычислительной техники для решения этого класса задач обработки реальных данных.

Самостоятельное программирование формул, алгоритмов

играфического представления данных для решения задач статистической обработки малоэффективно при наличии большого спектра специализированного программного обеспечения, которое представлено в коммерческих статистических пакетах прикладных программ типа STATISTICA, SPSS, STATGRAPHICS, ЭВРИСТА, SYSTAT и др., в специализированных моду-

лях математических пакетов Mathematica, MatLab, MatCAD, Maple и др.

Более доступным и достаточным для большинства пользователей персональных компьютеров является табличный процессор Excel, входящий в состав пакета Microsoft Office

иизучаемый в большинстве курсов по информатике. В данном пособии изложение базируется на использовании версии табличного процессора MS Excel 2003.

MS Excel 2003 имеет большое количество встроенных

статистических функций, кратко описанных в прил. 2, и большое число статистических инструментов, доступных через надстройку «Анализ данных». Они позволяют проводить комплексный статистический анализ реальных данных по заданной теме. Имеющиеся пособия [3–6] ориентированы в основном на выполнение статистико-экономических расчетов в Excel. Литература по Excel весьма обширна, для первоначального ознакомления можно рекомендовать пособия [7–8]. Полезным электронным учебным пособием по статистике является ресурс фирмы StatSoft [8], поддерживающий использование пакета STATISTICA.

Разнообразную текущую статистическую информацию можно получить из доступных интернет-ресурсов, например сайта Федеральной службы государственной статистики РФ

6

www.gks.ru; сайта Центра макроэкономического анализа и краткосрочного прогнозирования www.forecast.ru.

Целью данного учебного пособия является изучение основных положений прикладной статистики и освоение с помощью Excel техники статистической обработки реальных данных, возникающих в инженерной практике, при экспериментальных исследованиях, при повседневной регистрации различных показателей работы производственных подразделений, при принятии решений в условиях статистической вариации данных.

По содержанию пособие примерно соответствует третьей части учебника и руководства [1–2], в нем изложены необходимые теоретические положения, параллельно рассмотрено классическое решение примеров и их решение с помощью

Excel.

В первой главе приведены основные понятия математической статистики и рассмотрены наиболее употребительные в статистике распределения: стандартное нормальное, χ2,

Стьюдента и Фишера (Фишера – Снедекора). Применение статистических функций Excel направлено на вычисление вероятностей и квантилей различных распределений взамен табличных значений.

Вторая глава посвящена первичной статистической обработке одномерной выборки: построению гистограмм, вычислению числовых характеристик, точечным и интервальным оценкам параметров.

В третьей главе рассмотрены вопросы проверки параметрических и непараметрических статистических гипотез.

Далее даны указания по выполнению расчетно-графи- ческих работ и установке пакета «Анализ данных» MS Excel, приведены варианты самостоятельных расчетно-графических работ для каждой главы пособия.

7

Вприл. 1 дано краткое введение в MS Excel, достаточное для начального освоения пакета. В прил. 2 приведены краткие справочные данные по статистическим функциям

MS Excel 2003.

Впособии содержится много ссылок на примеры, поэтому ниже для облегчения поиска примеров дана таблица их расположения.

Таблица расположения примеров

Стр.

Стр.

Стр.

Стр.

Стр.

Стр.

1.1

17

1.2

20

1.3

20

1.4

23

1.5

28

1.6

37

2.1

36

2.2

37

2.3

43

2.4

56

2.5

57

2.6

60

2.7

67

2.8–

68

2.10

71

2.11

73

2.12

77

2.13

77

 

 

2.9

 

 

 

 

 

 

 

 

 

3.1

90

3.2

97

3.3

95

3.4

97

3.5

97

3.6

102

3.7

105

3.8

109

3.9

114

3.10

121

 

 

 

 

8

1. ОСНОВНЫЕ ПОНЯТИЯ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ

Математическая статистика занимается разработкой методов сбора, систематизации, обработки и анализа результатов наблюдений массовых случайных явлений для выявления существующих закономерностей.

Математическая статистика тесно связана с теорией вероятностей, которая также изучает массовые случайные явления. Основным связующим звеном являются предельные теоремы теории вероятностей.

Различие этих разделов математики: теория вероятностей изучает закономерности случайных явлений на основе теоретических абстрактных вероятностных моделей, а математическая статистика оперирует непосредственно результатами ограниченных реальных наблюдений над случайным явлением.

Основными задачами математической статистики являются:

определение способов сбора, группировки и визуализации статистических данных;

разработка методов обработки и анализа полученных данных в зависимости от целей исследования (оценка неизвестной вероятности события; оценка неизвестной функции распределения; оценка параметров распределения, вид которого известен; оценка зависимости от других случайных величин

ит.д.);

проверка различных статистических гипотез по резу-

льтатам наблюдений: о виде неизвестного распределения, о значениях параметров известного распределения, о равенстве средних, о равенстве дисперсий и т.п.;

– определение параметров и функций для моделей случайных процессов и теории массового обслуживания.

Определим основные понятия математической статистики.

9

1.1. Генеральная совокупность и выборка

Генеральная совокупность все гипотетическое множе-

ство имеющихся однородных объектов с изучаемыми признаками или множество возможных результатов всех мыслимых наблюдений или измерений признака, производимых в неизменных условиях над одним объектом. Генеральная совокупность может быть конечной или бесконечной.

Зачастую проводить сплошное обследование объектов трудно, экономически нецелесообразно или невозможно. Также нет смысла бесконечно повторять наблюдение или измерение одного признака на одном объекте. В этих случаях используют выборочное обследование – из генеральной совокупности выбирают и исследуют часть ее элементов (объектов для измерения их признаков или наблюдений исследуемого признака на одном объекте).

Выборка – набор объектов или результатов наблюдений, случайно отобранных из генеральной совокупности.

Математическая трактовка выборки – последователь-

ность независимых одинаково распределенных одномерных или многомерных (векторных) случайных величин, характеризующих изучаемые объекты.

Объем генеральной совокупности N и объем выборки n

число объектов в рассматриваемой совокупности. Существенно различающиеся виды выборки объектов:

повторная – каждый отобранный объект перед выбором следующего возвращается в генеральную совокупность;

бесповторная – отобранный объект в генеральную совокупность не возвращается.

Разница между ними становится малой, если объем выборки значительно меньше объема генеральной совокупности.

Винженерной практике чаще всего используются бесповторные выборки в предположении n/N <<< 1.

10