Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

MathSatistika

.pdf
Скачиваний:
23
Добавлен:
20.04.2015
Размер:
419.11 Кб
Скачать

1

ЭЛЕМЕНТЫ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ.

Математическая статистика (МС) – раздел прикладной математики, который, основываясь на положении теории вероятностей, разрабатывает методы сбора, анализа и обработки результатов эксперимента.

МС называют наукой об общих способах обработки результатов эксперимента.

Вбиологических, медицинских и других исследованиях обычно имеют дело с определѐнным множеством объектов, отличающихся друг от друга и в тоже время имеющих некоторые сходные существенные признаки, которые изменяются (варьируют) от объекта к объекту и которые являются объектом измерений.

Врезультате эксперимента получают множество значений измеряемой величины

(признака). Его называют простой статистической совокупностью (СС) или простым

статистическим рядом, а каждое значение измеряемого признака – вариантой ( xi ).

Измеряемые признаки подразделяют на дискретные и непрерывные.

Дискретные признаки могут принимать лишь определенные значения из некоторого ряда чисел, например, число подтягиваний спортсмена на перекладине, число дней пропущенных занятий заболевшим студентом, число попаданий и промахов при серии выстрелов и т.п.

Непрерывные признаки могут принимать любые значения в определѐнном интервале. Например, время прохождения 100 – метровой дистанции студентами, значение ар-

териального давления крови, продолжительность человеческой жизни и т.п.

n

 

Количество членов в статистической совокупности называют объѐмом

.

 

Изменение изучаемого признака в СС называют вариацией признака.

 

 

В МС пользуются понятием выборки и генеральной совокупности (ГС).

 

ГС это самая общая СС, содержащая бесконечно много членов, т.е. объѐм ГС

n .

 

 

 

 

 

 

Выборка – это СС, являющаяся частью некоторой ГС. Еѐ объѐм

n – конечное чис-

ло. Малой называют выборку, объѐм которой n 30 .

 

 

 

Число m ,

показывающее, сколько раз конкретная варианта x

встречается в вы-

i

 

 

i

 

 

 

борке, называется частотой варианты.

 

 

 

Отношение частоты

m к объѐму выборки n называется относительной часто-

 

 

 

i

 

 

 

 

P

m

 

 

 

 

той P варианты:

i

.

 

 

 

i

i

n

 

 

 

 

 

 

 

 

 

 

Сумма частот всех вариант выборки составляет еѐ объѐм:

k

 

 

 

i

n

 

m

i 1

 

 

,

k количество, отличающихся по значению, вариант.

Выборка должна быть репрезентативной, т.е. представительной (достаточно полно отражать свойства ГС, из которой она извлечена).

Статическое представление результатов эксперимента. I. Табличный способ. Вариационные ряды.

Как правило, первичные экспериментальные результаты представляют собой неупорядоченный набор чисел, записанных исследователем в порядке их получения. Это, как отмечалось выше, простой статистический ряд.

Ранжирование – расположения вариант в порядке возрастания (или убывания) и подсчета частот каждого нового значения варианты.

В результате получают ранжированный вариационный ряд. Это двойной числовой ряд, в котором указаны все отличающиеся значения вариант и их повторяемость (частоты).

2

Вариационные ряды бывают дискретные (для дискретных признаков) и интервальные (для непрерывных признаков).

Дискретный вариационный ранжированный ряд.

x

x

x

 

 

x

 

i

1

 

2

 

k

 

 

 

m

m

m

 

m

i

1

 

2

 

 

k

P

P

P

 

P

i

1

 

2

 

k

 

 

 

Для статистического представления большого числа измерений непрерывной СВ используют интервальный статистический ряд. Для этого все результаты измерений разбивают на определѐнное количество малых интервалов определѐнной ширины x (лучше одинаковой для всех интервалов) и подсчитывают число вариант, попадающих в

каждый из них, т.е.

находят частоты mi

(или относительные частоты Pi ) для малых ин-

тервалов. Такой ряд представляется таблицей вида:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Интервал

xо

x1

x1

x2

 

xi-1

xi

xk-1

xk

значений xi

 

 

 

 

 

 

 

 

 

 

 

mi

m1

 

m2

 

mi

 

mk

 

P i

P

1

 

P 2

 

P i

 

P k

 

*

 

*

 

*

 

 

*

 

 

*

 

 

 

 

 

 

 

 

 

 

 

 

 

II. Графическое представление экспериментальных результатов.

Для повышения наглядности эмпирических вариационных рядов используют их графическое представление. Графиком дискретного ряда является полигон. Различают полигон частот и относительных частот. Полигон представляет собой ломаную линию, вер-

шины которой имеют координаты втором (рис.8.1 и рис.8.2).

(x , m )

i

i

в первом случае, или координаты

(xi , Pi )

во

mi

m2

m1

x1

x2 x3

Рис. 8.1.

x4

x5n

Pi

P2

P1

x

x1

x2 x3

x4

x5n

x

Рис.8.2.

Интервальный ряд графически представляют гистограммой частот mi или ги-

стограммой относительных частот P*i .

Гистограмма частот представляет собой ступенчатую фигуру, состоящую из прямоугольников, основанием которых являются интервалы ширины x интервалов, а

3

высоты равны значениям плотности частот на интервалах, т.е. равны отношениям

Гистограмма частот для интервального ряда имеет вид:

mix

.

mix

Гистограмма относительных частот имеет аналогичный вид, но по оси oY откладывают плотность относительной частоты на интервале.

Смысл площади Si отдельного прямоугольника на гистограмме частот:

 

 

 

 

 

 

 

 

 

 

 

S

 

x

m

m

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

i

i

x

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

Площадь отдельного прямоугольника на

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

x

гистограмме частот численно равна ча-

 

 

 

 

 

 

 

 

1

2

x

x

x

стоте соответствующего интервала.

x

 

3

4

 

5n

 

 

 

 

 

 

 

 

Площадь всей гистограммы, рав-

 

 

 

 

 

 

 

 

 

 

 

ная сумме площадей всех прямоугольников, представляет собой сумму частот всех малых интервалов mi , т.е. объѐм выборки. На гистограмме относительных частот основание отдельного прямоугольника xi равно ширине интервала, а высота – плотности относи-

тельной частоты на интервале

mi n x

. Площадь отдельного прямоугольника

S

 

x

m

 

i

 

 

 

 

i

i

 

 

 

n x

 

 

 

i

или

S

 

 

m

 

i

 

 

 

 

i

 

n

 

 

 

. Т.е. площадь отдельного прямоугольника равна относи-

тельной частоте соответствующего интервала. Площадь всей гистограммы равна сумме относительных частот всех интервалов, т.е. равна 1:

k Si

i 1

k

m

 

i

 

i 1

n

 

1

.

Числовые характеристики выборки.

I. Характеристики положения. Эти характеристики определяют положение центра эмпирического распределения. К ним относят среднее арифметическое x , медиану Ме и моду Мо.

Среднее арифметическое, или просто среднее, представляет собой такое значение признака, сумма отклонений от которого выборочных значений признака равна нулю (с учетом знака отклонения).

Простая средняя арифметическая находится, если каждая варианта в выборке встречается один раз, т.е. все mi 1. Вычисляется x по формуле:

 

1

n

 

x

i

n

x

 

 

 

 

i 1

 

Взвешенная средняя арифметическая

xв зв ш находится по сгруппированным дис-

кретным результатам измерений, когда хотя бы одна варианта в выборке встречается неоднократно, т.е. имеет частоту больше единицы:

 

 

x m

x

m

... x

m

1

k

 

 

xвзвш

1 1

2

2

k

k

 

 

xi mi .

m1 m2 ... mk

 

 

 

 

 

 

n i 1

4

где объѐм выборки

 

k

 

n

 

i

 

m

 

i 1

 

.

Если результаты измерений в эксперименте сгруппированы в интервальный ряд, то под xi понимают средние значения величины в каждом интервале.

Медианой Ме выборки называют варианту, которая делит ранжированную выборку на две равных по числу членов части. При этом все члены по одну сторону от медианы больше, а по другую – меньше медианы.

При n -нечетном медианой будет являться варианта, занимающая серединное значение в выборке, т.е. стоящая посредине выборки:

 

 

 

 

Me x

 

 

 

 

n 1

 

 

 

 

2

Если же объем выборки n – четное число, то Ме равна в этом случае средней

арифметической вариант

xn

и

xn

:

 

2

 

2

1

 

 

 

x

n

x

Me

 

2

 

 

 

 

 

2

n

1

2

 

Модой Мо выборки называют наиболее вероятное значение варианты, т.е. значение варианты, частота которой наибольшая.

В случае интервального ряда при симметричном распределении результатов Мо равна среднему арифметическому модального интервала – интервала с наибольшей частотой.

II.Характеристики рассеяния

Размах вариации R.

Размах вариации вычисляется как разность между максимальной и минимальной вариантами выборки:

 

 

R x

м акс

x

м ин

 

 

 

 

Дисперсией выборки

2

называют среднее арифметическое квадратов отклонения значе-

В

 

 

 

 

 

ний признака xi от его среднего арифметического xВ . Выборочную дисперсию вычисляют по следующим формулам:

для выборки объемом n , в которой все варианты имеют различные значения xi :

1n

В2 n (xi xВ )2 ,

i1

для выборки, представленной дискретным вариационным рядом, в котором каждая из

различных вариант

x

имеет частоту m

:

 

i

i

 

k

2 В

1k

n mi (xi

i1

x

 

)

 

 

2

 

В

 

.

для выборки, представленной интервальным вариационным рядом:

 

1

k

В2

mi (

 

 

 

)2 ,

xi

xВ

 

 

n i 1

где xi - средние арифметические отдельных интервалов.

На практике дисперсию нередко удобнее вычислять по формуле:

В2 xi2 (xB )2 ,

 

 

 

 

5

где x

2

- усредненное значение квадратов всех вариант.

 

i

 

 

 

Средним квадратическим отклонением

В

называют положительный корень квадрат-

ный из дисперсии:

 

 

 

 

 

 

2

.

 

 

 

 

 

 

В

 

 

 

 

Коэффициент вариации.

Среднее квадратичное отклонение не всегда достаточно полно яние значений изучаемого признака вокруг выборочной средней

характеризует рассе-

x

В

. Например, для

 

 

xВ 6,7 В 2 означает большой разброс вариант, а для xВ 100 значение В 2 указывает на высокую степень одинаковости вариант, на их очень плотное распределение

вокруг

xВ

. Для более полной характеристики разброса вариант вокруг

xВ

вводят поня-

тие относительно среднего отклонения, которое и называют коэффициентом вариации

V

. Его выражают в процентах и вычисляют по формуле:

V

 

100%

В

x

 

 

 

В

 

Коэффициент вариации используется и как показатель однородности выборочных

наблюдений. Принято считать, что если V не превышает 10%, выборку можно считать однородной, т.е. полученной из одной генеральной совокупности.

Коэффициент вариации применяется в основном для сравнения выборок из однотипных генеральных совокупностей.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]