Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Прикладная статистика

..pdf
Скачиваний:
3
Добавлен:
12.11.2023
Размер:
9.53 Mб
Скачать

Издательско-торговая корпорация «Дашков и К ‘»

И. А . П а л и й

ПРИКЛАДНАЯ

СТАТИСТИКА

Учебное пособие

Допущено Министерством образования Российской Федерации в качестве учебного пособия для студентов высших учебных заведений, обучающихся по направлению «Технические науки» и социально-экономическим специальностям

Москва, 2008

УДК 31 ББК60.6

П Н

Рсцсилскты:

В. А. Далиигер—доктор педагогических шук, профессор Окского госу­ дарственного педагогического университета;

кафедра высшей математик» Окского государственного технического университета.

Палий И. А. Прикладная статистика; Учебное посо-

ЛИ бие. — М.: Издательско-торговая корпорация «Дашков и КЧ 2008. — 224 с.

Г5ВИ 978-6-91131-563-4

^Учебное пособие подготовлено в соответствии с требованиями Государственного обрвоователыюгастандарга.Рассмдтреныследующие разделы курса: выборка, ее графическое представление и число­ вые характеристики; двумерные выборки; временныеряды; экономи­ ческие индексы; точечные и интервальные оценки параметров гене­ ральной совокупности; проверка параметрически ж инспараметричес-

юпепшотеа^

Изложение сопровождается подробно разобранными примера­ ми, иллюстрациями, диаграммами.

Для студентов технических и социально-экономических специ­ альностей вузов всех форм обучения.

15ВЫ 978-6-91131-563-4

@ И. А. Палий, 2008

Оглавление

 

ВВЕДЕНИЕ............................................

7

ГЛАВА I

 

Генеральная совокупность и выборка ш генеральной

 

совокупности .

9

ГЛАВА И

 

Выборка, ее представление и числовые характеристики...........

12

2Л. Представление выборки...

 

2.1.К Таблица частот и интервальная таблица частот . . . . . .

12

2.1.2.Графическое представление выборки. Полигон,

гистограмма, кривая накопленных частот

.............

1$

2.2. Числовые характеристики выборки

...................................

 

18

2.2.1. Выборочное среднее, мода, медиана.

.................18

2.2.2. Квартили, декатнлн, персснтнли ...

 

.................21

2.2.3. Измерение разброса: размах, выборочная дисперсия,

выборочное среднее квадратическое отклонение

 

 

{стандартноеотклонение), коэффициент ................вариации

22

2.2.4.0

симметричных н несимметричных

 

 

распределениях...............

 

 

24

2.2.5. Вычисление выборочного среднего и выборочной

 

дисперсии дляобъединения двух выборок.............................

 

25

2.2.6. Общая, межгрупповая и внутригрупповая

 

 

дисперсии —

 

 

27

2.2.7. КриваяЛоренца и показатели концентрации................

28

2.3. Задачи

.............................

.............................. 32

ГЛАВА III

 

 

 

 

Обработка результатов наблюдений пометоду

 

 

наименьших квадратов..................................... ..........................

 

 

39

3.1. Двумерные ....................выборки

 

 

39

3.2. Графическое представление двумерных выборок—

 

диаграммы ...........................................................рассеяния

 

 

41

3.3. Выборочный коэффициент корреляции —

 

 

числовая характеристика двумерной ..................выборки

43

3.4. Метод наименьших .........................................квадратов

 

 

46

3.5. Другие ............. .............................уравнения регрессии

г :

 

51

3.5.1.

Парабола второго порядка

 

 

,..51

3 5,2. Показательная ..................................................функция

 

 

51

3.5.3. Стеленная ........................................................функция

 

 

52

3

 

3.5.4. Гиперболическая функция.........................................

52

 

3.5.5.0

квазилинейном уравнении регрессии

. 52

 

3.5.6. Пример построения нелинейного уравнения

55

 

регрессии..............

3.6. Расчет коэффициентов линейногоуравнения

57

 

регрессии посгруппированным данным...........................

3.7. Индекс корреляции................

58

3.81 Индекс Фехнера и корреляциошиюс отношение.............

59

3.9. Задачи

......... .................

64

ГЛАВА IV

 

... 71

Временные ряды.......................................................

4.1.

Что такос временной ряд?

71

АЛ, Понятие об анализе временных рядов...........

76

 

4,2.1.0

значениях временного ряда..................

76

 

4.2.2. Трендывременных рядов ..

77

4.2.2Л. Линейный тренд..............................................

78

 

4.2.2.2. Параболический тренд.

79

 

4.2.2.3. Показательная функция......................

.81

 

4.2.2.4. Исключение трендовой составляющей.......................

82

4.2.2.5. Скользящие средине.................................

.. 83

4.2.3.

Сезошше колебания н индексы сезонности....... ..................

84

4.3.

Задачи.............................

88

ГЛАВА V

 

95

Понятие об индексах.........................................................................

5.1. Индивидуальные (частные) индексы........

95

5.2. Общие индексы....................................................................

98

5.2.1. Афегатные индексы.....................................................

98

5.2.2. Средние индексы...........................................................

99

5.2.3. Индексы цен..................................................................

99

5.2.4. Дефлятирование стоимостных величин......................

100

53. Задачи......................

 

102

ГЛАВА VI

 

 

Проверка гипотезы о законе распределения гелегальной

104

совокупности по критегию Пигсонл (критерию X1) ........................

6.1. Пример..................................................................................

 

104

6.2. Немного теории..................................................

108

6.3. Другие примеры..............................................................

п 1

6.3.1. Проверка гипотезы о нормальном звконс

11 1

распределения.....................................................................

6.3.2. Проверка гипотезы о равномерном законе

..115

распределения

4

6.3.3. Проверка гипотезы о биномпалиюм законе

 

распределения................ ...................................................

117

6.3.4. Проверка гипотезы о законе распределения

 

Пуассона.........................

113

6.3.5. Последний пример.......................................................

120

6.4. Задачи........................................

122

ГЛАВА VII

 

Понятие о точечпмх и интервальных оценках параметров

 

ГЕНЕРАЛЫюЯ СОВОКУПНОСТИ......................

128

7-1- Выборочные статистики

128

7Л, Точечные оценки параметров генеральной

 

совокупности

130

7.3.0 точности и надежности точечных оценок..................

133

7.3.1. Еще об определении нужного объема выборки...........

137

7.4. Поншпс об интервальных оценках параметров

 

генеральной совокупности......................................

140

7.4.1. Построение доверительного интервала для

 

неизвестного математического ожидания а нормально

распределенной генеральной совокупности, когда

 

дисперсия -о2генеральной совокупности известка..

.. 140

7.4.2. Построение доверительного интервала для

 

неизвестной вероятностир «успеха»...

......... 141

7.4.3. Построение доверительного материала для

 

неизвестного математического ожидания нормально

 

распределенной генеральной совокупности, когда

 

дисперсия о2генеральной совокупности неизвестна............

143

7.4.4. Построение доверительного интервала для

 

неизвестной дисперсии о2 нормально распределенной

генеральной совокупности

145

7.4.5. Построение доверительного интервала для

 

разности математических ожидании нормально

 

распределенных генеральных совокупностей

146

7.5. Задачи...................................................................................

150

ГЛАВА VIII

 

Понятие с проверке статистических гипотез.................................

159

8.1. Основные определения..........................

159

8.1.1. Что такое статистическая гипотеза?............................

159

8.1.2. О процедуре прояеркн нулевой гипотезы....................

160

8.1.3. Ошибки, допускаемые при проверке

 

статистических гипотез..........................................................

161

8.2. Проверка параметрических гипотез по критериям

значимости...........

..163

5

8.2.

]. Проверка гипотезы

ни математического

163

ожидания ...

...

...

.............

8.2.

и . Случай, когда дисперсия ^генеральной

163

совокупности известна........................................................

 

 

8.2.1.2. Проверка гипотезы о значении всроягаосги

165

«успеха».......................................

 

 

 

8.2.1.3. Проверка гипотезы о значении математического

 

ожидания, когда дисперсия генеральной совокупности

167

неизвестна............................................................................

 

 

 

8.2.2.Проверка гипотезы о равенстве математических

ожиданий двух генеральных совокупностей

.170

8.2.2.1. Случай, когдадисперсиио,3 к <^3 считаюгея

 

известный...............................

........... . ..................170

8.2.2.2. Случай, когда а 02гнеизвестны, но известно,

.. 171

чю <г,3 =о33 ................................................................

 

8.2.3. Проверка гипотезы о значении дисперсии..................

171

8.2.4. Проверка гипотезы о равенстве дисперсий двух

172

генеральных совокупностей..................................................

 

8.2.5. Проверкагипотезы о значении коэффициента

174

корреляциир..............................

, ..........

8.3. Проверка непараметрических гипотез.............................

176

8.3.1. Проверка гипотезыо законе распределения

 

генеральнойсовокупности по критерию Колмогорова—

176

Смирнова (^-критерию).....................

 

8.3.2. Проверка гипотезы об извлечении двух выборок

178

нз одной и той же генеральной совокупности......................

8.3.2.1. Проверка но Л-критерию..........................................

178

8.3.2.2. Проверка по критерию Вилкоксона..........................

179

8.3.2.3. Критерии знаков.............

. ....................................

182

8.3.3. Проверкагипотезы о независимости двух

184

дискретных случайных величин......................

 

8.4. Ранговая корреляция..........................................................

 

187

8.4.1. Коэффициентранговой корреляции Спирмена . . . . .

188

8.4.2. Связанные ранги..........................................................

 

190

8.4.3. Коэффициент ранговой корреляции Кендэла...............

191

8.4.4. Коэффициент конкордзцни Кендэла............................

192

8.5. Задачи..................................................................................

 

194

Приложения;

 

211

1. Нормальное распределение................................................

 

2. Распределение Стьюдеитл..................................................

 

215

3. ^-распределение........................................

 

217

4. Распределение Фишера.....................................................

 

219

Литература................................................................................

 

222

ВВЕДЕНИЕ

Жизнь без мочага и кон\[а, Нас всех подстерегаемслучай.

А. Блок.

Статистика изучает случайные явления, которые, по своей сути, пс поддаются однозначному описанию н прогнозирова­ нию, Например, нельзя абсолютно точно предсказать, сколько людей родится или умрет в стране за данный промежуток време­ ни. Нельзя с точностью до коленки (цента, сантима) определить доход некоторой семьи за определенный промежуток времени (можно найти на дороге монетку в 10 копеек, можно выиграть б лотерею, получить неожиданное наследство и, наоборот, мож­ но потерять часть денег из-за болезни, или неверно принятого решения, или биржевого кризиса). Невозможно с точностью до минуты определить, какое время проработает купленный теле­ визор (компьютер, автомобиль) до первой поломки.

Жизнь человека, общества, цивилизации складывается из случайных явлений. Чтобы общество было устойчивым, а жизнь предсказуемой, важно нс давать случаю слишком большой воли (любая попытка совсем исключить из жизни случай обречена на провал).

Современные задачи планирования, управления, прогнозиро­ вания невозможно решать, не располагая достоверными статис­ тическими дапегими и нс используя статистические методы обра­ ботки этих данных. Стремление объяснить настоящее и заглянуть в будущее всегда было свойственно человечеству, а для решения этих задач применялись различные методы. Статистика при опи­ сании случайных явлений использует язык науки — математику. Это значит, что реальные ситуации заменяются вероятностными схемами и анализируются методами теории вероятностен. Выра­ зительная сила математики хак языка очень велика.

Серьезные математические методы стали использоваться для анализа статистических наблюдений сравнительно недавно. Че­ ловечество осознало необходимость сбора статистических дан-

7

кых о различных сторонах жизни общества значительно раньше появления сопутствующего развитого математического аппарата. Но н сравнительно несложные методы сбора и анализа данных оказались важным инструментом, помогающим принимать ра­ зумные решения.

Любые статистические данные всегда неполны и неточны и другим}! быть нс могут. Задача статистики заключается в том, чтобы дать обоснованные выводы о свойствах изучаемого явле­ ния, анализируя неполные н неточные данные. Статистика дока­ зала, что умеет справляться с подобными проблемами.

Глава!

ГЕНЕРАЛЬНАЯ СОВОКУПНОСТЬ И ВЫ БОРКА И З ГЕНЕРАЛЬНОЙ СОВОКУПНОСТИ

В одноммгновенье видеть вечность, Ограмн й мир —в зерне песка, В единой горсти бесконечность

Инебо в чашечке цветка

В.Блейк (перевод С. Маршака)

Понятия генеральной совокупности и выборки из нее яв­ ляются псрвсжачальЕгыми в статистике. Строгие определения пришли из теории вероятностен, хотя терминология математи­ ческой статистики отличается от терминологии теории вероят­ ностен. Вместо случайной величины X в теории вероятностен в математической статистике говорят о генеральной совокупно­ сти X. Таким образом, понятие генеральной совокупности тож­ дественно понятию случайной величины, т.е. включает в себя описание области определения (пространства элементарных исходов), множества значений, функциональной зависимости, закона распределения.

Вместо эксперимента, в результате которого случайная вели­ чина ^приняла значение х (в теории вероятностей), в математи­ ческой статистике говорят о случайном выборе из генеральной совокупности X значения х.

Вместо п независимых экспериментов, в результате которых случайная величина ^приняла значения хр хг ха(в теории ве­ роятностей), в математической статистике говорят о случайной

9

выборке объема п значений дг ху хпиз генеральной совокуп­ ности А!

При нестрогом подходе под генеральной совокупностью понимают множество всех объектов некоторого наблюдения в совокупности с множеством всех значений этого наблюдения, соответствующих каждому объекту. А под выборкой объема «г понимают множество из п объектов, реально подвергшихся наблюдению, в совокупности с п значениями наблюдения для каждого объекта. Например, социолог, изучающий мнение из­ бирателей, под генеральной сояокупкостьЕО понимает множест­ во всех избирателен данной страны, а под выборкой объема п — множество из л человек, которых он опросил. Мы будем иметь в виду н такую точку зрения на генеральную совокупность.

Основная задача статистики — получить обоснованные вы­ воды о свойствах генеральной совокупности, анализируя извле­ ченную из нее выборку хг хг .... хщ.Более подробно описать закон распределения генеральной совокупности; подобрать значения параметров этого закона, оценить числовые характеристики ге­ неральной совокупности; если генеральная совокупность — мно­ гомерная случайная величина, оценить всевозможные коэффи­ циенты корреляции между се составляющими; если имеется несколько выборок, извлеченных из разных генеральных сово­ купностей, определить, одинаково распределены эти генераль­ ные совокупности или нет; одинаковы ли определенные число­ вые характеристики этих генеральных совокупностей или кет и т.д.

Бее перечисленные вопросы сформулированы на языке тео­ рии вероятностей. От статистики требуются ответы и на другие вопросы: можно ли утверждать, что новое лекарство эффектив­ нее излечивает от некоторой болезни, чем старое? Какой будет численность населения страны в следующем году? Существует ли связь между значениями предела прочности и предела теку­ чести различных марок стали? Чтобы ответы на подобные воп­ росы соответствовали действительности, нужно уметь строить подходящие вероятностные модели для реальных ситуаций. А для этого нужно уметь представить выборку в подходящем

10