Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
VUKOLOV2.pdf
Скачиваний:
136
Добавлен:
05.06.2015
Размер:
2.12 Mб
Скачать

3. Лабораторные работы по статистическим методам

Работа 3. Оценивание характеристик генеральной совокупности по выборке.

Методы группировки. Построение таблицы частот и гистограмм

Основные понятия. Генеральная совокупность, выборка, статистический и вариационные ряды, группировка, таблица частот группированной выборки, распределение выборки, эмпирическая функция распределения, гистограмма частот.

Выборочные характеристики генеральной совокупности: среднее, мода, медиана, дисперсия, асимметрия, эксцесс, начальные и центральные моменты, выборочные квантили и квартили, размах выборки.

Критерии для выбора наилучшей оценки параметров распределения: состоятельность, несмещенность, эффективность.

Литература.

[1], гл. 19, § 1, § 2; [2], гл. 1, с. 6 - 9; гл. 2, с. 10 - 30; [3], гл. 3, с. 61 - 66.

 

Исходные данные для вычислений в работах 3 –

 

5 (в каждом варианте 20 чисел - строка).

 

 

 

Номер варианта

 

 

 

 

 

 

 

1

1 2 2

4 3 3 1

1 4 2

1 3

2 1

1 2

2

5

6

7

2

0 6 2

3 5 8 3

2 1 9

4 4

9 1

3 2

6

1

2

4

3

2 4 1

3 1 2 2

2 5 1

5 1

4 2

0 4

3

3

1

0

38

4

2 4 5

3 1 7 5

4 5 7

 

6 6

 

5 2

 

2 1

 

4

7

 

 

2

 

1

 

 

 

 

 

5

4 4 8

5 9 3 9

3 3 3

 

7 5

 

3 6

 

7 8

 

4

6

 

 

5

 

9

 

 

 

 

 

6

8 4 9

3 7 3 4

9 6 9

 

5 8

 

4 7

 

7 4

 

3

5

 

 

4

 

9

 

 

 

 

 

7

3 7 9

5 7 9 9

5 2 6

 

7 4

 

3 9

 

8 8

 

8

6

 

 

5

 

6

 

 

 

 

 

8

14 10 9

6 9 6 6

8 10 9

11 7

 

8 9

 

7 12 8

 

7 8 13

 

 

9

8 3

3 10 4 10 8 12 5 11 5 5

6 6

4 11 7

 

 

3 4 11

 

 

10

7

8

12

11

8

8 12

10

8

12

5

11

9 10

11

10

 

12

 

8

 

7

9

 

 

11

13 14

20

6

11 6

10

11 10 12

 

3

11

17

 

8

12 19

11

13

8

11

12

12 11

 

11

16 14 16 10

9

 

11

9

 

11 13

9

15

11 10 15

14

14

11

13

9

9

14

11 10 12

7

19

17 14

 

10

8

8

11

12 10 11

14

8

13

14

11 10

 

12

17 17 19 11 15

 

5

11

11

14 6

 

7

14 11 13

13

8

5

 

15

21 14

 

7

13 17 18

15 17

 

8

14

 

20

11 10 11

13

20

18

 

19 17

11

16

19 13

 

12

21 14 19 16 14

 

8

11

15

13 17

17

15 18

 

15

20 16

13

17

15 21

 

18

15 18 23 23 16

 

13 19

14

15 21 22

22

 

14

 

16

 

22 17

14

18

18 17

 

15

23 12 28 17 17

 

18 10

25

20 17 18

23

 

23

 

21

 

27 25

22

19

31 15

 

17

15 17 18 17 18

 

23 20

23

20 25 20

25

 

18

 

20

 

18 19

19

20

18 21

 

19

17 19 17 19 21

 

24 19

23

21 18 20

22

 

24

 

19

 

20 22

18

21

25 19

 

24

22 20 16 16 19

 

22 22

23

21 20 23

21

 

19

 

17

 

17 18

21

22

19 13

 

26

16 27 19 23 32

 

18 18

14

17 21 22

23

 

24

 

25

 

30 31

26

23

25 26

 

21

24 22 23 20 20

 

22 26

24

21 22 23

25

 

25

 

20

 

21 22

23

24

12 20

 

23

27 17 23 23 21

 

25 20

22

25 21 17

15

 

13

 

14

 

24 18

19

25

30 25

 

25

26 16 30 30 23

 

27 25

25

17 18 19

18

 

27

 

22

 

23 23

20

Задание. По выборке из своего варианта выполнить следующие расчеты и задания:

1)построить статистический и вариационный

ряды;

2)вычислить оценки математического ожидания, моды и медианы, несмещенную и смещенную оценки дисперсии, размах выборки;

3)построить таблицу частот и накопленных частот для сгруппированной выборки (число интервалов равно 4);

4)построить гистограмму частот и относительных частот;

39

5) ввести данные в пакет STATISTICA, выполнить все расчеты пп. 1) - 4), сравнить результаты и записать в отчет.

Выполнение в пакете STATISTICA

Дана выборка объемом 20:

11 10 12 17 17 19 11 15 5 11 11 14 6 7 14 11

13 13 8 5.

Запустите программу STATISTICA. В Переключателе модулей выберите Basic Statistics/Tables (Основные статистики/таблицы)

Рис.3.1. Вид меню функции сортировки

и

нажмите кнопку Switch to (Переключиться в). Создайте

40

новый файл для ввода данных, выполив следующие операции File → New Data… Вместо имени файла new.sta введите новое имя, например, свою фамилию, чтобы в дальнейшем сохранить данные и показать их преподавателю. После ввода имени нажмите ОК. Файл данных создан.

Расширение имени файла .sta присваивается автоматически. В поле VAR1 введите выборку, приведенную выше. Если недостаточно строк (как правило, программа по умолчанию предлагает 10),

воспользуйтесь кнопкой Cases (Наблюдения), затем кнопкой Add (Добавить) и в строке Number of Cases to Add (Количество добавляемых строк) запишите число 10 (для данного примера).

Для построения вариационного ряда щелкните по кнопке Переключателя модулей и вызовите новый модуль, который называется Data Management (Управление данными), далее в подпункте Analysis (Анализ) главной строки выберите функцию Sort (Сортировка) (убедитесь, что поле, в котором вы работаете, не изменилось - VAR1) (рис.3.1).

Сортировку данных можно проводить как в порядке возрастания (Ascen), так и в порядке убывания (Desc). Обратите внимание на то, что при выполнении сортировки перемещаются все строки электронной таблицы, а сортировка выполняется с участием всех значений, в том числе незаполненных (пропущенных) значений переменной VAR1, которые принимаются равными нулю.

После построения вариационного ряда вернитесь в диалоговое меню Basic Statistics/Tables - стартовая панель модуля вызывается кнопкой Analysis главной строки. В стартовой панели модуля выберите подменю

Descriptive Statistics (рис.3.2). Кнопка More Statistics

41

отвечает за подсчет тех величин, которые вы хотите найти (рис.3.2)

42

Рис.3.2. Вид меню функции Descriptive Statistic (слева) и More Statistics (справа)

Программа предлагает вычисление следующих статистик:

43

Valid N - число элементов выборки (n);

Mean - среднее значение (выборочное среднее x - оценка математического ожидания);

Sum - сумма;

Median - оценка медианы;

Standard Deviation - оценка стандартного отклонения (среднего квадратического отклонения s);

Variance - несмещенная оценка дисперсии s2; Standard error of mean - стандартная ошибка

среднего = sn ;

95% confidence limits of mean - 95%-ные

доверительные

интервалы

для

среднего

(математического

ожидания

 

генеральной

совокупности);

 

 

 

Minimum & maximum - максимальное и

минимальное

 

 

значение

выборки;

 

 

 

Lower & upper quartiles - верхний и нижний квартили;

Range - размах (разность между максимумом и минимумом);

Quartiles range - разность между верхним и нижним квартилями;

Skewness - выборочный коэффициент асимметрии; Kurtosis - выборочный коэффициент эксцесса; Standard error of skewness - стандартная ошибка

коэффициента асимметрии;

Standard error of kurtosis - стандартная ошибка коэффициента эксцесса.

Отметьте необходимые характеристики, введите имя анализируемой переменной VAR1 в левом верхнем углу и нажмите ОК.

44

Полученные результаты представлены в виде таблицы (рис.3.3).

Рис.3.3. Таблица результатов

Для проведения группировки выборки вызовите модуль Frequency tables из стартовой панели модуля

Basic Statistics/Tables (рис.3.4).

Рис.3.4. Диалоговое окно модуля Frequency tables

В этом диалоговом окне можно либо задать размер интервала командой Step size (причем необязательно задавать начальное значение, компьютер может сделать это автоматически при установленной "галочке"

45

напротив слов at minimum), либо просто задать количество интервалов командой No. of exact intervals (установив количество интервалов, равное четырем, для данного примера).

Результаты группировки данных при установке размера интервала Step size:3,5 приведены на рис.3.5.

Рис.3.5. Результаты группировки выборки Для построения гистограммы воспользуемся этим

же окном (см. рис.3.4), в котором присутствует кнопка , отвечающая за построение.

Итоговый вид гистограммы представлен на рис.3.6: кривая Exp. Normal - график плотности нормального распределения с математическим ожиданием x = 11,5 и средним квадратическим отклонением s = 3,953679.

Рис.3.6. Итоговый вид гистограммы

46

 

 

 

 

 

From: VAR1 (1.sta)

 

 

 

 

 

 

120

 

 

 

 

 

 

 

 

 

 

 

 

100

 

 

 

 

 

 

 

 

 

 

 

 

80

 

 

 

 

 

 

 

 

 

 

 

Cumul. Percent

60

 

 

 

 

 

 

 

 

 

 

 

40

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

20

 

 

 

 

 

 

 

 

 

 

 

 

0

7,00000

10,0000

12,0000

14,0000

17,0000

Missing

 

5,00000

 

6,00000

8,00000

11,0000

13,0000

15,0000

19,0000

Рис.3.7. График накопленных относительных частот

Постройте график накопленных относительных частот (огиву) для переменной VAR1. Для этого выполните следующие операции: Analysis ® Frequency tables, введите имя переменной VAR1 и нажмите кнопку Frequency tables на панели процедуры (см. рис.3.4) ® в появившейся таблице частот, выберите столбец Cumul. percent и шелкните правой кнопкой мыши по его имени ® в меню выберите

Custom Graphs….-line plot, OK.

График накопленных относительных частот представлен на рис.3.7.

Замечание: если некоторые ячейки столбцапеременной не заполнены, то они учитываются как отсутствующие значения (missing). Например, если в файле 1.sta 22 v×30 c в качестве переменной VAR1 ввести подряд с первой строки 20 чисел, то наблюдения 21 - 30 являются пропущенными значениями. При вычислении таблицы частот пропущенные значения

47

учитываются при подсчете относительных частот (Percent) и накопленных относительных частот (Cumul. Percent): эти значения будут вычисляться делением не на 20 (по числу введенных чисел), а на 30, т.е. на число наблюдений в переменной VAR1.

48

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]