Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

матемVM_Санюкевич А.В._ч

.2.pdf
Скачиваний:
12
Добавлен:
01.03.2016
Размер:
721.03 Кб
Скачать

 

S

=0

,

 

 

 

 

a

 

 

 

1

 

 

 

 

............

(1.13)

 

 

 

 

 

 

 

S

 

 

 

 

 

 

 

 

 

 

a

 

 

=0.

 

m

 

 

 

 

 

Если система (1.13) имеет единственное решение, то оно будет искомым.

1.6 Частные случаи

Укажем вид нормальных систем для определения параметров зависимостей 1-7.

1. Парабола y = ax2 + bx + c :

ax2j

+ bx j

+ c n = y j ,

 

 

 

 

j

j

 

j

 

 

 

 

 

+ bx2j

+ cx j

= x j y j ,

ax3j

 

j

j

j

j

 

 

 

ax4

+ bx3

+ cx2

= x2

y

j

.

 

j

j

j

j

 

 

 

j

j

j

j

 

 

 

Если ввести обозначения

P = x j , Q = x2j

, R = x3j

, Q = x2j ,

j

j

j

j

H 1 = y j , H 2 = x j y j , H 3 = y j x2j ,

j j j

то система (1.14) примет вид:

a Q + b P + c n = H1 ,a R + b Q + c P = H 2 ,a S + b R + c Q = H3 .

2. Прямая y = a x + b :

ax2j

+ bx j

= x j y j ,

 

 

 

j

j

 

j

 

 

ax j

+ bn = y j .

 

 

 

j

 

j

 

 

 

После обозначений

 

 

 

 

 

 

P = x j , Q = x2j , H 1

= y j , H

2

= x j y j

j

j

 

 

j

 

j

(1.14)

(1.15)

(1.16)

система (1.16) запишется так:

 

 

 

a Q + b P = H2

,

(1.17)

 

,

 

a P + bn = H1

 

 

3. Экспонента y = a ebx . После логарифмирования равенства, получим ln y = ln a + bx .

Следовательно, нормальная система запишется в виде:

11

bx2 +

j j

bx j +j

С учетом обозначений

 

 

 

= x j

ln a

x j

 

j

 

j

n ln a = ln y j .

j

P = x j , Q = x2j

, H 1

= ln y j ,

j

j

 

j

ln y j ,

(1.18)

H 2

= x j ln y j

 

j

систему (18) можно записать в простой форме

 

 

 

b Q + P ln a =

H2

,

(1.19)

 

 

 

b P +n ln a = H1.

 

 

4. Степенная

функция

y = axb .

После

логарифмирования равенства

получим ln y = ln a + bln x. Тогда

 

 

 

 

 

 

 

 

 

= ln x j ln y j ,

bln2 x j

+ ln a

ln x j

 

j

 

j

 

j

(1.20)

bln x j + n ln a = ln y j .

 

 

j

 

j

 

 

 

 

 

 

 

 

Вводим обозначения

 

 

 

 

 

P = ln x j , Q = ln2 x j , H 2

= ln y j , H 1 = ln x j ln y j .

j

j

 

 

j

 

j

Следовательно, из системы (1.20) получим систему

b Q + P ln a = H1 ,b P +n ln a = H2 .

5. Логарифмическая функция y = a ln x + b .

 

 

 

 

 

= y j ln x j ,

aln2

x j + b

ln x j

 

j

 

j

 

j

aln x j + n b = ln y j .

 

j

 

 

j

 

 

 

 

 

Обозначим

(1.21)

(1.22)

P = ln x j , Q = ln2 x j , H 1

= y j , H 1

= ln x j ln y j .

j

j

j

j

Система (1.22) запишется в виде

 

 

 

 

 

= y j ln x j ,

 

aln2

x j + b

ln x j

 

 

 

 

 

 

 

(1.23)

 

j

 

j

 

j

aln x j +n b = ln y j .

 

 

 

j

 

 

j

 

 

 

 

 

 

 

6. Гипербола y = a + bx .

12

 

 

 

a

1

 

+ b

1

=

 

 

x j

 

 

 

 

 

j

 

j

x2j

j

 

 

 

 

 

 

1

 

 

 

 

 

 

b

 

+ n a = y j .

 

 

 

 

Обозначим

 

 

j

 

x j

 

 

 

j

 

 

 

 

 

 

 

 

 

 

P =

1

, Q = ln2 xj , H 1

=

 

j

x j

 

j

 

 

 

j

Тогда

 

 

 

a P + b Q = H2 ,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

b P +n a = H1.

7. Гипербола y =

 

 

.

 

 

 

 

 

 

 

ax + b

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y j , x j

y j , H 2

=

y j

.

x j

 

j

 

(1.24)

(1.25)

ax2j

y j + b x j y j

= x j ,

 

 

j

j

j

(1.26)

by j

+ ax j y j = n,

 

 

j

j

 

 

После обозначений

 

 

 

 

P = x2j y j , Q = x j y j , H 1 = y j , H 1

= x j

j

 

j

j

j

получим систему вида

a P + b Q = H1,

 

 

(1.27)

 

 

 

 

 

b R +a Q = n.

 

 

Недостатком метода наименьших квадратов является громоздкость вычислений. Поэтому к нему прибегают обычно при обработке наблюдений высокой точности, когда нужно получить весьма точные значения параметров.

1.7 Порядок выполнения работы

а) Изучить краткий теоретический курс.

б) Подобрать вид эмпирической формулы для индивидуального задания. в) Ответить на контрольные вопросы.

г) Оформить отчет по лабораторной работе, учитывая рекомендации.

1.8 Рекомендации по выполнению лабораторной работы и оформлению отчета

После изучения основных теоретических сведений, данных в настоящем методическом указании, студент, получив индивидуальное задание, приступает к его выполнению.

Рекомендуется выполнять работу в следующей последовательности:

а) построить точки, данные в таблице-задании на миллиметровой бумаге; б) соединив построенные точки плавной кривой, сделать предварительный

вывод о виде эмпирической формулы.

13

Если предполагается квадратичная или линейная зависимость, то необходимо пользоваться аналитическими критериями, данными в настоящих методических указаниях. Для всех остальных случаев необходимо использовать критерии, данные в таблице 1.2. Все вычисления рекомендуется оформлять в виде таблицы 1.3 (как при решении примера-образца 1.3). После того, как вид эмпирической формулы будет определен, необходимо приступить к нахождению параметров эмпирической формулы и получить значения a, b, c подобранной эмпирической формулы.

1.9 Индивидуальные задания

x

 

1

 

2

 

3

 

4

 

5

 

 

6

 

7

 

8

 

9

 

10

вар.

 

 

 

 

 

 

 

 

 

 

 

1

y

5,823

 

8,503

 

8,960

 

10,833

12,704

 

15,483

 

20,066

 

18,521

 

21,797

 

23,766

2

y

10,82

 

33,90

 

84,36

 

177,83

324,90

 

538,48

 

831,47

 

1207,92

1690,79

2285,97

3

y

0,172

 

0,118

 

0,112

 

0,092

 

0,079

 

0,065

 

0,050

 

0,054

 

0,046

 

0,042

4

y

 

5,47

 

11,61

 

22,21

 

49,09

 

109,29

 

243,70

 

544,12

 

1203,97

2679,86

5962,88

5

y

3,023

12,259

28,093

55,748

95,087

148,115

216,701

293,788

391,129

503,343

6

y

3,823

 

5,889

 

5,157

 

5,606

 

5,923

 

7,067

 

9,958

 

6,680

 

8,191

 

8,371

7

y

5,823

 

5,103

 

3,093

 

2,733

 

2,464

 

3,150

 

5,666

 

2,071

 

3,308

 

3,246

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

1

 

1,8

 

2,6

 

3,4

 

4,2

 

 

5

5,8

6,6

7,4

8,2

вар.

 

 

 

 

 

 

 

8

y

5,575

7,988

8,390

10,587

12,660

 

12,151

15,727

18,703

21,777

23,285

9

y

10,97

30,37

67,13

131,51

228,06

 

360,75

542,71

775,71

1066,89

1421,05

10

y

0,179

0,125

0,119

0,094

0,079

 

 

0,082

0,064

0,053

0,046

0,043

11

y

4,999

9,271

17,679

32,232

60,497

116,805

217,696

413,420

784,502

1485,436

12

y

1,775

9,015

19,934

39,254

65,808

 

97,793

142,454

195,635

258,517

329,887

13

y

3,475

5,442

4,937

6,017

6,854

 

 

5,031

7,239

8,806

10,440

10,484

14

y

5,575

4,619

2,692

2,865

3,045

 

 

0,711

2,502

3,719

5,051

4,828

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

1

 

 

1,5

 

 

2

 

 

2,5

 

 

3

 

 

 

3,5

 

4

 

4,5

 

5

 

5,5

вар.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

15

 

y

6,178

 

3,435

 

8,343

 

5,579

 

6,327

 

7,012

 

8,049

 

6,078

 

7,599

 

10,132

16

y

9,178

11,748

26,343

38,767

61,327

91,575

131,049

177,516

238,599

312,945

17

 

y

0,162

 

0,291

 

0,120

 

0,179

 

0,158

 

0,143

 

0,124

 

0,165

 

0,132

 

0,099

18

 

y

4,703

 

3,167

 

6,076

 

3,347

 

3,862

 

4,524

 

5,029

 

8,458

 

8,624

 

7,928

19

 

y

4,178

 

2,845

 

10,235

11,090

16,644

23,369

31,717

 

38,363

 

49,839

 

63,692

20

 

y

4,678

 

1,793

 

6,383

 

3,203

 

3,475

 

3,641

 

4,128

 

1,584

 

2,513

 

4,439

21

 

y

6,178

 

2,018

 

5,843

 

2,129

 

1,994

 

1,833

 

2,049

 

-0,728

 

-0,001

 

1,746

14

 

x

 

1

 

1,6

 

2,2

 

2,8

3,4

 

4

 

 

4,6

 

 

5,2

 

5,8

 

6,4

 

вар.

 

 

 

 

 

 

 

 

 

 

 

 

22

y

3,033

7,030

8,060

9,758

12,014

14,184

15,302

 

16,834

 

21,287

 

20,587

 

23

y

5,03

18,86

41,16

79,47

137,57

218,68

325,75

 

464,19

 

640,18

 

849,76

 

24

y

0,330

0,142

0,124

0,102

0,083

0,071

 

0,065

 

 

0,059

 

0,047

 

0,049

 

25

y

5,131

4,861

4,698

5,394

6,236

7,361

 

7,530

 

 

8,754

 

11,957

 

10,903

 

26

y

1,533

11,916

27,244

53,458

92,627

146,193

215,202

303,075

414,219

542,419

 

27

y

0,033

3,640

3,825

4,447

5,485

6,343

 

6,080

 

 

6,180

 

9,161

 

6,956

 

28

y

3,033

4,668

3,642

3,394

3,755

4,059

 

3,328

 

 

3,022

 

5,646

 

3,121

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

1

 

 

3

 

5

 

 

7

 

9

 

11

 

 

 

13

 

 

 

15

 

 

17

 

19

 

вар.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

29

 

 

y

3,474

 

7,573

10,998

 

16,371

18,872

24,390

 

26,103

 

31,365

 

33,517

41,011

 

30

 

 

y

1,233

 

1,254

2,666

 

3,495

3,669

3,933

 

 

5,995

 

 

4,858

 

5,718

 

3,973

 

31

 

 

y

0,288

 

0,132

0,091

 

0,061

0,053

0,041

 

 

0,038

 

 

0,032

 

0,030

 

0,024

 

32

 

 

y

1,474

 

3,770

4,217

 

6,263

5,266

7,186

 

 

5,233

 

 

6,781

 

5,183

 

8,900

 

33

 

 

y

0,533

 

3,885

11,437

 

20,393

30,362

41,907

 

56,607

 

69,368

 

85,313

99,780

 

34

 

 

y

2,133

 

2,965

5,718

 

8,044

9,791

11,675

 

15,387

 

15,921

 

18,468

18,423

 

35

 

 

y

0,469

 

0,337

0,175

 

0,124

0,102

0,086

 

 

0,065

 

 

0,063

 

0,054

 

0,054

 

36

 

 

y

1,466

 

2,975

2,828

 

3,794

5,536

8,298

 

 

14,204

 

18,898

 

28,536

40,508

ЛАБОРАТОРНАЯ РАБОТА № 2

ВЫБОРОЧНЫЙ МЕТОД

Построение графика эмпирической функции распределения, гистограммы частот, вычисление статистических характеристик непрерывных случайных величин.

2.1 Основные понятия

Статистическое исследование может осуществляться по данным несплошного наблюдения, основная цель которого состоит в получении характеристик изучаемой совокупности по обследованной ее части. Одним из наиболее распространенных в статистике методов, применяющих несплошное наблюдение, является выборочный метод.

Выборочным называют метод статистического исследования, при котором обобщающие показатели изучаемой совокупности устанавливаются по некоторой ее части на основе положений случайного отбора. При выборочном методе обследованию подвергается сравнительно небольшая часть всей изучаемой совокупности. При этом подлежащая изучению статистическая совокупность, из которой производится отбор части единиц, называется генеральной совокупностью. Отобранная из генеральной совокупности некоторая часть единиц, подвергающаяся обследованию, называется

выборочной совокупностью или просто выборкой. Объемом совокупности

15

называется число объектов, входящих в совокупность. В проведении ряда исследований выборочный метод является единственно возможным.

В результате первой стадии статистического исследования – статистического наблюдения – получают сведения о каждой единице совокупности. Задача второй стадии статистического исследования состоит в том, чтобы упорядочить и обобщить первичный материал, свести его в группы и на этой основе дать обобщающую характеристику совокупности. Этот этап в статистике называется сводкой.

Результаты сводки могут быть представлены в виде статистических рядов распределения. Статистическим рядом распределения называют упорядоченное распределение единиц совокупности. Статистический ряд, расположенный по возрастанию или убыванию вариант, называется вариационным. Статистические ряды распределения позволяют систематизировать и обобщать статистический материал. Однако они не дают всесторонней характеристики. Чтобы решить ряд конкретных задач, выявить особенности в развитии явления, обнаружить тенденции, установить зависимости, необходимо произвести группировку статистических данных.

2.2 Группировка статистических данных

Для проведения группировки выделяют группировочный признак или основание группировки. Чем больше групп, тем точнее будет воспроизведен характер исследуемого объекта. Однако слишком большое число групп затрудняет выявление закономерностей при исследовании социальноэкономических явлений и процессов. Поэтому в каждом конкретном случае при определении числа групп следует исходить не только из степени колеблемости признака, но еще учитывать и особенности объекта и цель исследования. Одна из таких процедур основана на использовании формулы Стерджесса для определения оптимального числа групп: k 1 + 3,322 lgn , где n – объем

выборки.

После определения числа групп следует определить интервалы группировки. Интервал – это значения варьирующего признака, лежащие в определенных границах. Длину интервала определяем по формуле

h = xmax xmin ,

k

где xmax и xmin – максимальное и минимальное значения вариант в выборке, k – число групп. Началом первого интервала берется xmin . Прибавляя последовательно h, получают границы остальных интервалов: x1 = xmin + h ,

x2 = x1 + h , x3 = x2 + h и так далее.

После этого строится ряд распределения. Для этого в первый столбец (или строку) таблицы заносят границы интервалов. Во второй столбец (или строку) таблицы заносят число вариант попадающих в данный интервал ni – частоту.

Если просуммировать все частоты, то должны получить общее число

16

k

наблюдений (объем выборки): ni = n . Если частоты поделить на объем

i=1

выборки, то в результате получим относительные частоты (частости): wi = nni (i =1,k ).

2.3 Графическое изображение вариационного ряда

Существенную помощь в анализе вариационного ряда и его свойств оказывает графическое изображение.

Для дискретного вариационного ряда в качестве графического изображения используют полигон. Полигоном частот называют ломаную линию, состоящую из отрезков, соединяющих точки (x1;n1) ,(x2;n2 ) ,...,(xk ;nk ) .

Полигон относительных частот представляет собой ломаную, состоящую из отрезков, соединяющих точки (xi ;wi ) (i =1,k ).

При обработке и отображении экспериментальных данных, в которых изучаемый признак может принимать любое значение из некоторого интервала, используют следующие способы представления данных: гистограммы; полигон частот; полигон накопленных частот (кумулята).

Столбиковая диаграмма, в которой основания столбиков, расположенные на оси абсцисс – это интервалы значений варьирующего признака, а высоты столбиков – частоты или относительные частоты, соответствующие масштабу по оси ординат, называется гистограммой. Гистограмма частостей является статистическим аналогом плотности распределения вероятностей генеральной совокупности.

Полигон для интервального ряда строится так же, как и для дискретного, но в качестве вариант используются середины интервалов. Полигон частот получается из гистограммы, если соединить середины вершин прямоугольников ломаной линией.

Преобразованной формой вариационного ряда является ряд накопленных частот. Это ряд значений числа единиц совокупности с меньшими и равными нижней границе соответствующего интервала значениями признака. Такой ряд называется кумулятивным. Можно построить кумулятивное распределение "не меньше, чем", а можно "больше, чем". В первом случае график кумулятивного распределения называется кумулятой, во втором – огивой.

2.4 Эмпирическая функция распределения

Эмпирической функцией распределения выборки называется функция

F (x),

определяющая

для всякого

x R относительную частоту события

X < x , то есть F (x) = nx

=

ni , где

nx – число вариант, меньших x; n – объем

 

n

 

xi <x n

 

выборки.

Она является

аналогом

интегральной функции распределения

F(x) = P(X < x) в теории вероятностей. Основные свойства функции F (x): 1) значения функции F (x) принадлежат отрезку [0;1];

17

2)функция F (x) – неубывающая;

3)F (x) =0 при x<xmin и F (x) =1 при x>xmax.

2.5 Выборочные оценки параметров распределения

Следующим этапом изучения вариации признака в совокупности является измерение характеристик силы, величины вариации. Пусть x1, x2,..., xn – выборка из генеральной совокупности.

Размахом вариации называется абсолютная разность между максимальным и минимальным значениями признака R = xmax xmin .

Средним значением выборки или выборочным средним называется число

 

 

 

n

 

 

 

k

 

 

 

 

xi

 

 

 

xi ni

 

x

В

=

i=1

или, если даны частоты вариант, x

В

=

i=1

. Среднее отклонение

n

k

 

 

 

 

 

 

ni

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i=1

 

значений признака от средней арифметической величины равно нулю. Выборочной дисперсией случайной величины X называется число

 

 

 

 

 

 

 

n

(x

 

x

 

)2

 

 

 

 

 

 

 

 

 

k

(x

 

x

 

)2 n

 

 

 

 

 

 

 

 

i

В

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

В

i

 

 

 

 

 

 

D

В

=

i=1

 

 

 

 

 

= x2 x 2

или D

В

=

i=1

 

 

 

 

 

= x2 x 2

,

 

 

 

 

 

 

 

 

 

 

 

k

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

В

 

 

 

 

 

 

 

 

 

 

 

В

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ni

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k

 

 

 

 

 

 

i=1

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

x2n

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

i

 

i

 

 

 

 

 

 

 

 

 

где x2

=

i=1

 

 

– средний квадрат (x2

=

i=1

 

 

).

 

 

 

 

 

 

 

 

 

n

 

k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ni

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

Показателем силы вариации выступает средний модуль отклонений:

 

 

 

 

 

 

k

 

 

 

 

 

 

 

1

n

 

 

 

xi xВ

ni

 

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

aВ =

 

xi

xВ

или aВ =

 

. Простота расчета и интерпретации

 

 

k

 

n i=1

 

 

 

 

ni

 

 

 

 

 

 

 

 

 

 

 

i=1

 

 

 

 

составляют

положительные

стороны

данного

показателя,

однако

математические свойства модулей "плохие".

Поэтому в качестве такого показателя используется среднее квадратическое отклонение. В статистической литературе среднее квадратическое отклонение от средней величины принято обозначать малой

греческой буквой

сигма

σ

 

 

 

или s.

Квадрат

среднего

 

квадратического

отклонения дает величину дисперсии. Таким образом,

 

 

 

 

 

 

 

 

для ранжированного ряда

для интервального ряда

 

 

 

 

 

 

 

 

 

 

 

 

 

k

 

 

 

 

)2 n

 

 

 

n

 

x

 

)

2

 

 

 

 

(x

 

x

 

 

 

(x

 

 

 

 

 

 

=

 

i

 

В

 

i

σ =

i=1

i

 

 

В

 

 

 

 

σ =

i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ni

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i=1

 

 

 

 

 

Среднее квадратическое

 

 

отклонение по

 

величине

 

 

в реальных

18

совокупностях всегда больше среднего модуля отклонений. Соотношение σ : a зависит от наличия в совокупностях резких, выделяющихся отклонений и может служить индикатором "засоренности" совокупности неоднородными с основной массой элементами: чем это соотношение больше, тем сильнее подобная "засоренность".

2.6Генеральные оценки параметров распределения

Всравнении с другими видами несплошных наблюдений преимущество выборочного наблюдения заключается в том, что по результатам этого наблюдения можно оценить искомые параметры генеральной совокупности.

Любой параметр θ , найденный по выборке, извлеченной из генеральной совокупности X, является подходящей оценкой параметра θ этой совокупности, если он удовлетворяет трем условиям:

1) М(θ ) =θ ;

2) lim P(θ θ <ε) =1;

n→∞

3) D(θ ) – является минимальной.

Параметр θ , удовлетворяющий условиям 1)-3) называется соответственно

несмещенной, состоятельной и эффективной оценкой параметра θ генеральной совокупности признака X.

Выборочное среднее xВ является несмещенной оценкой для

математического ожидания генеральной совокупности.

Выборочная дисперсия DВ является смещенной оценкой для дисперсии генеральной совокупности. В качестве несмещенной оценки принимается

величина s2 = n n1 DВ исправленная выборочная дисперсия. Соответственно,

исправленное среднее квадратическое отклонение s = n n1σ .

2.7 Порядок выполнения работы

а) Изучить краткий теоретический курс.

Для данных, полученных в результате эксперимента и записанных в виде статистического ряда:

б) Записать значения выборки в виде вариационного ряда; в) Найти размах вариации; по формуле Стерджесса найти оптимальное

число интервалов, длину интервала и составить интервальное распределение выборки;

г) Построить гистограмму и полигон относительных частот выборки; д) Построить график эмпирической функции распределения;

е) Найти числовые характеристики выборки xВ , DВ , aВ , σВ , s2, s. ж) Оформить отчет по лабораторной работе.

19

2.8Пример выполнения работы

Врезультате статистических наблюдений некоторой совокупности относительно признака Х были получены выборочные данные.

66

71

71

71

69

66

73

73

72

72

72

66

69

68

73

74

70

70

74

76

62

74

66

72

72

69

69

69

74

71

69

76

76

71

78

68

74

71

68

64

67

74

75

68

71

71

71

68

71

61

70

65

66

69

68

72

81

72

71

74

78

73

67

75

68

69

63

69

72

73

77

73

71

71

67

67

69

71

74

66

69

70

74

74

68

75

74

69

67

74

77

74

73

63

75

 

 

 

 

 

 

 

 

 

 

1.Для данных задания составим вариационный ряд, то есть расположим их

впорядке возрастания:

61

62

63

63

64

65

66

66

66

66

66

66

67

67

67

67

67

68

68

68

68

68

68

68

68

69

69

69

69

69

69

69

69

69

68

69

69

70

70

70

70

71

71

71

71

71

71

71

71

71

71

71

71

71

71

72

72

72

72

72

72

72

72

73

73

73

73

73

73

73

74

74

74

74

74

74

74

74

74

74

74

74

74

75

75

75

75

76

76

76

77

77

78

78

81

 

 

 

 

 

 

 

 

 

 

Обозначим через

xi

варианты

признака

X.

Из

данных

видим,

что xi

принимает любое целое значение из интервала (61;81) . Следовательно, можно предположить, что X – дискретная случайная величина. Объем выборки n = 95.

2. Так как случайная величина X принимает много различных значений, то составим интервальное распределение выборки. Для этого найдем размах

вариации: R = xmax xmin = 81 61 = 20 .

Для выбора оптимальной длины интервалов используем формулу Стерджесса:

h =

xmax xmin

=

81 61

20

 

20

2.6 ,

1 + 3,322 lgn

1 + 3,322 lg95

1 + 3,322 1,978

7,57

 

 

 

 

 

где n – объем выборки, h – длина интервала. В качестве границы первого интервала выберем значение x1 = xmin =61. Границы следующих частичных

интервалов вычисляем по формуле x1 + d h

( d =1,2,....). Находим середины

интервалов: xi =

xi + xi+1

. Подсчитываем

число значений результатов

 

2

 

 

эксперимента, попавших в каждый интервал, то есть, находим частоты

интервалов

ni . Далее вычисляем частости (относительные

частоты)

w

= ni

=

ni

и плотности частот ni (для построения гистограммы частот). Все

 

i

n

95

h

 

 

 

полученные результаты поместим в общую таблицу:

20