Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

2_Izuchenie_zakona_normalnogo_raspredelenia_sl

.pdf
Скачиваний:
13
Добавлен:
22.02.2015
Размер:
486.55 Кб
Скачать

Государственное образовательное учреждение Высшего профессионального образования

"ВОРОНЕЖСКАЯ ГОСУДАРСТВЕННАЯ МЕДИЦИНСКАЯ АКАДЕМИЯ им. Н.Н. БУРДЕНКО"

КАФЕДРА МЕДИЦИНСКОЙ ФИЗИКИ

Методические указания студентам по теме практического занятия

ИЗУЧЕНИЕ НОРМАЛЬНОГО ЗАКОНА РАСПРЕДЕЛЕНИЯ СЛУЧАЙНЫХ ВЕЛИЧИН

Воронеж 2009

РАЗДЕЛ: Основы медицинской статистики.

ТЕМА: Изучение нормального закона распределения случайных величин.

ЦЕЛЬ: Дать студенту первокурснику основные сведения о нормальном законе распределения Гаусса, который широко используется в математической статистике.

ЗНАТЬ: Математическое выражение нормального закона распределения, пара-

метры распределения, свойства, которыми обладает теоретическая кривая нормально-

го распределения.

УМЕТЬ: Вычислять основные параметры распределения с использованием вы-

числительных средств для обработки результатов измерений, строить графики гисто-

граммы и полигона частот распределения.

МОТИВАЦИЯ ТЕМЫ:

В биологии и медицине большую роль играет изменчивость многих характери-

стик (структуры и функций) биосистем. Одним из наиболее адекватных способов опи-

сания характера изменчивости является применение соответствующего закона распре-

деления. Он определяет вероятность того, что результат измерения случайной величи-

ны случайно выбранного индивидуума будет лежать в определенном интервале значе-

ний. Среди многих законов распределения особое значение имеет нормальный закон распределения Гаусса. Он является предельным законом, к которому приближаются все остальные при весьма часто встречающихся типичных условиях с возрастанием числа испытаний.

САМОСТОЯТЕЛЬНАЯ РАБОТА СТУДЕНТОВ ВО ВНЕУРОЧНОЕ ВРЕМЯ.

Изучить теоретический материал занятия по следующей логической структуре учебного материала:

1. Основные числовые характеристики дискретных и непрерывных случайных вели-

чин, характеризующие биологические системы:

математическое ожидание;

дисперсия;

среднее квадратическое отклонение.

2.Функция распределения и плотность вероятности:

математические выражения;

связь между этими величинами.

3.Графики функции распределения и плотности вероятности нормального закона Гаусса.

4.Основные особенности нормального распределения.

СРЕДСТВА ДЛЯ САМОПОДГОТОВКИ

1. Учебная и методическая литература:

а) основная

Ремизов А.Н. Медицинская и биологическая физика. - М.: Высшая школа. 1987.

Ремизов А.Н. Медицинская и биологическая физика. - М.: Высшая школа. 1996.

с.24-50

Лобоцкая Н.Л., Морозов Ю.В., Дунаев А.Л. Высшая математика. -М.: Высшая школа 1987. с.205-216.

Эссаулова И.А. и др. Руководство к лабораторным работам по медицинской и биологической физике. - М.: Высшая школа, 1987, с.8.

Лекции по разделу "Основы медицинской статистики"

б) дополнительная

Вентцель Е.С. Теория вероятностей. М.: 1979, с.115.

Поляков И.В., Соколова Н.С. Практическое пособие по медицинской статисти-

ке. - Л.: Медицина, 1975. с.38.

Масальгин Н.А. Математико-статистические методы в спорте. М.: Физкультура

испорт. 1974.с.63-90.

Сборник задач по математике для ВУЗов. Теория вероятностей и математиче-

ская статистика. Под ред. А.В. Ефимова. М.: Наука. 1990. с.83.

– Колде Я.К. Практикум по теории вероятностей и математической статистике.

М.: Высшая школа, 1991. с.28

– Минцер О.П. и др. Методы обработки медицинской информации. Киев.: Выс-

шая школа. 1991. с. 28.

2.Консультации преподавателей (еженедельно по индивидуальному плану).

ОЦЕНКА НОРМАЛЬНОСТИ ВАРИАЦИОННЫХ РЯДОВ Результат медико-биологического эксперимента или отдельного клинического

наблюдения называют вариантой (х), а набор вариант, расположенный в возрастаю-

щем (убывающем) порядке – вариационным рядом.

х1, х2, …, хi, … , хn

где n – количество наблюдений (длина вариационного ряда).

Основными параметрами, которые характеризуют вариационный ряд являются: 1. Величины, которые в зависимости от обстоятельств принимают те или иные зна-

чения, называются случайными величинами. Они могут быть непрерывными (из-

мерения объема грудной клетки) или дискретными (количество очков выпавшее на игральной кости).

2. Вероятность наступления события – отношение числа исходов благоприятствую-

щих наступлению данного события (m) к числу всех возможных исходов испыта-

ния (n):

m P(xi) n

n

Для дискретной случайной величины P(xi) 1.

i1

3.Математическое ожидание (среднее значение) случайной величины – сумма про-

изведений всех возможных ее значений на вероятности этих значений:

n

M(X) x1p1 x2p2 ... xnpn xi pi

i 1

4. Дисперсия случайной величины – математическое ожидание квадрата отклонения случайной величины от ее математического ожидания:

D(X) M[X M(X)]2

5. Среднее квадратическое отклонение – квадратный корень из дисперсии (вводят для оценки рассеяния случайной величины в единицах той же размерности):

D(X)

Полный набор всех вариант есть генеральная совокупность. На практике, как правило, невозможно получить все варианты генеральной совокупности, поэтому ис-

следуется выборочная совокупность.

Самым распространенным распределением в природе, экономике и т.д. является нормальное распределение. Случайная величина с нормальным распределением может принимать любые значения в интервале от - до + и имеет функцию плотности веро-

ятности:

 

 

1

 

(x a)2

f(x)

 

 

e 2σ2

 

 

 

 

σ

 

2π

 

 

 

 

где а – математическое ожидание случайной величины; - среднее квадратическое от-

клонение; 2 – дисперсия случайной величины Кривая нормального распределения имеет колоколообразную форму (рис. 1),

симметричную относительно прямой х=а (центр рассеивания). В точке х=а функция

достигает максимума: f (x)

max

 

 

1

 

и образует перегибы в точках х1=а- и х2=а+

σ

 

 

 

 

 

 

2π

(рис. 2).

По мере возрастания х–а функция монотонно убывает, асимптотически при-

ближаясь к нулю. При изменении значения изменяется вид графика: при увеличении значения в m раз максимальное значение функции уменьшается в m раз и график

"вытягивается" в обе стороны вдоль оси х=а. При уменьшении значения происходит обратное. При изменении значения а график функции f(x) смещается вдоль оси (рис.1).

 

 

 

 

 

Для кривых:

 

 

 

 

 

 

 

 

 

 

 

 

a1=0, а2=0, а3 0;

 

 

 

 

 

 

 

 

 

1 2, 2= 3

 

 

 

 

 

 

 

 

Рис. 1.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рис. 2

Наряду с плотностью вероятности используют так же функцию распределения

непрерывной случайной величины:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

F(x) f (x)dx

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

На основании формул (1) и (2) получаем функцию распределения:

 

 

 

 

x

 

 

 

 

 

 

1

 

 

x

 

(x a)2

 

 

 

 

 

 

 

 

 

 

 

 

 

2 2

 

 

 

F(x)

f (x)dx

 

 

 

e

 

dx

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Введем новую переменную t

x a

 

и получим

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

t a t2

 

 

 

 

 

 

 

x a

 

 

F(x)

 

 

 

 

 

e

2

dx

Ф(t) Ф(

 

)

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Значения функции Ф(t) приведены в соответствующих таблицах. График функ-

ции изображен на рис. 3.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a

 

 

 

 

 

 

 

 

 

 

На основании выражения

 

Pab f (x)dx

 

 

 

 

 

 

 

 

 

 

 

 

 

 

b

 

 

 

 

 

 

 

 

 

 

можно вычислить вероятность того, что случай-

 

 

 

 

ная величина при нормальном распределении

 

 

 

 

находится в интервале (х1, х2):

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Р(х1 х х2) Ф(

x2 a

) Ф(

x1 a

)

 

 

 

 

 

 

 

 

 

Рис. 3.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Это выражение можно использовать для расчета вероятности нахождения слу-

чайной величины в интервалах а , а 2 ,

а 3 . Расчет показывает, что величина ве-

роятности составляет: Р=0,68268 (для а ); Р=0,95450 (для а 2 ) и Р=0,99730≈1 (для

а 3 ). Таким образом, случайная величина X с нормальным распределением практи-

чески не принимает значений, которые отличались бы от среднего значения по абсо-

лютной величине больше чем на 3 . Это утверждение называется правилом "трех сигм" (рис. 2).

Как и другие законы распределения нормальный закон Гаусса не является бес-

предметной абстракцией, а представляет математическое выражение реальных зако-

номерностей, существующих в массовых случайных явлениях. В частности, многие величины в биологии и медицине распределены по нормальному закону.

Закону Гаусса подчиняются:

рост и вес взрослых людей;

верхнее артериальное давление крови при исследовании большого контингента

пациентов;

–длина сосудов, размеры органов, вес и объем мозга, определенные при массовых анатомических обследованиях;

абсолютные ошибки показания приборов, измерений;

содержание ферментов у здоровых людей.

Указанные примеры составляют незначительную часть от всего многообразия случайных биологических величин, подчиняющихся нормальному закону распределе-

ния.

Распределение Гаусса является распределением, к которому в соответствии с за-

коном больших чисел при неограниченном увеличении числа испытаний стремятся

(сводятся) все законы распределения. В этом случае применение закономерностей нормального распределения теоретически обосновано и в вопросах медицинской ста-

тистики, когда число объектов велико, расчет статистических данных в предположе-

нии о нормальности распределения исходного материала является правомерным.

В лабораторных условиях и в клинических исследованиях число испытуемых объектов, как правило, невелико, поэтому утверждение о нормальном распределении полученного экспериментального материала требует строгого математического обос-

нования. Тем более что применение статистических критериев Стьюдента, Фишера и т.д., расчет корреляционных и регрессионных параметров и многие другие методы ма-

тематической статистики базируются на предположении о нормальном распределении исходных вариационных рядов.

Существуют различные методы оценки нормальности распределения результа-

тов наблюдений.

ГОСТ рекомендует для проверки нормальности распределения группы результа-

тов пользоваться критерием Пирсона, критерием Мизеса-Смирнова, а также состав-

ными критериями.

Самым распространенным является критерий согласия Пирсона, который при-

меняется всегда, когда требуется определить степень различия между фактическим распределением и теоретическим, в частности, нормальным распределением.

Сущность метода сравнения экспериментального вариационного ряда и соответ-

ствующего ему нормально распределенного ряда состоит в том, что строится теорети-

ческий нормально распределенный ряд с параметрами исходного ряда, т.е. математи-

ческие ожидания (М(Х) или Х) и среднеквадратические отклонения ( ) эксперимен-

тального и теоретического рядов равны.

Далее определяется величина 2 (хи-квадрат) по формуле:

2 k (nj n'j )2 ,

j 1 n'j

где nj – частоты экспериментального вариационного ряда; n'j – теоретические частоты; k – число классов вариант.

Для нормального распределения с параметрами X и теоретические частоты равны:

 

 

 

 

 

 

t

2

 

 

 

n

 

e

 

j

n'

j

 

 

 

2

 

 

 

σ 2π

 

 

 

 

 

 

 

 

 

 

 

~

 

 

 

 

 

 

 

 

 

 

 

 

 

n – длина вариационного ряда; - величина классового интервала; t

 

 

xj

X

 

– нор-

j

 

 

 

 

 

 

 

 

 

 

 

~

 

xj 1 xj

 

 

 

 

 

 

 

мированное отклонение середины j-го интервала; xj

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

Далее возникает вопрос: как велика может быть величина 2, чтобы пренебречь различием между рядами?

Для ответа на этот вопрос пользуются таблицей предельных значений 2 (табли-

ца 1), которые зависят от уровня значимости критерия Р и числа степеней свободы,

которые при сравнении с нормальным распределением равно k–3

Если при заданном уровне значимости и соответствующем числе степеней сво-

боды 2< 2теор то считают, что отклонение экспериментального распределения от нор-

мального незначительно и далее можно считать экспериментальные данные нормально распределенными. В общем случае оценка нормальности распределения данного ва-

риационного ряда состоит из следующих этапов:

1. Вычислить среднее арифметическое X и среднеквадратическое отклонение данного ряда;

2. Варианты данного вариационного ряда разбить на классы и определить экспе-

риментальные частоты (nj);

3. Рассчитать частоты теоретического нормального распределения (n'j) с основ-

ными параметрами X и ;

4. Вычислить значение критерия 2 и сравнить с табличным ( 2теор).

Прежде чем приступать к решению задачи, рассмотрим пример. Из партии рези-

сторов, имеющих приблизительно одинаковое сопротивление взяли наугад 50 шт и измерили точно их сопротивление.

Данные измерения 50 сопротивлений

N

[Ом]

N

[Ом]

N

[Ом]

N

[Ом]

N

[Ом]

 

 

 

 

 

 

 

 

 

 

1

820

11

843

21

842

31

809

41

810

2

833

12

806

22

803

32

802

42

827

3

835

13

795

23

820

33

823

43

840

4

821

14

811

24

819

34

824

44

818

5

824

15

821

25

803

35

851

45

834

6

795

16

823

26

847

36

832

46

811

7

837

17

839

27

847

37

803

47

821

8

835

18

826

28

807

38

809

48

826

9

843

19

832

28

812

39

819

48

827

10

822

20

804

30

834

40

807

50

830

1. Рассчитаем среднее арифметическое X и среднеквадратическое отклонение для данного ряда с помощью с помощью программы Microsoft Exel. Введем значения в ячейки листа (например, А1–А50). Активируем курсором мыши пустую ячейку (на-

пример, А2). Выберем Вставка Функция (или нажать иконку fx). В строке Категория

выберем Статистические, в окне Выберите функцию СРЗНАЧ. Нажмите ОК. В

появившемся окне в строке Число 1 необходимо указать массив значений (это можно сделать выделив мышью введенные значения – ячейки А1–А50). В нижней строке ок-

на появится среднее арифметические значение для исследуемой выборки. При нажа-

тии кнопки ОК эта величина сохранится в выбранной ячейке (А2). Активируем сле-

дующую пустую ячейку (например, В2) и повторим действия, выбрав в качестве рас-

четной функции СТАНДОТКЛОН.

КОНТРОЛЬНЫЙ ПРИМЕР 1:

Вычислить основные параметры вариационного ряда

15, 10, 12, 14, 12, 13, 11.

В результате расчета получаем:

X=12,42857≈12,4; =1,718249≈1,7.

В результате расчета получаем:

X=822,44; =14,38843

2. Для определения экспериментальных частот (nj) составим статистический ряд,

для чего запишем значения 50 сопротивлений в возрастающем порядке

Rj [Ом]

795

795

802

803

803

803

804

806

807

807

809

809

810

811

811

812

819

819

820

820

821

821

821

822

823

823

823

824

824

826

826

827

827

830

832

832

833

834

834

835

835

837

839

840

842

843

843

847

847

851

Варианты данного вариационного ряда разбить на классы. Число классов вари-

ант k определяется по формуле:

k n

где n=50 – количество наблюдений, называемое длиной вариационного ряда.

k n 50 7

Необходимая величина классового интервала ( ) определяется по формуле:

 

 

xjmax xjmin

 

 

 

 

 

 

 

 

 

 

 

 

 

K

 

 

 

 

Rjmax Rjmin

 

 

851 795

 

56

8

K

7

 

7

 

 

 

 

 

Разбиваем диапазон значений 50 сопротивлений на 7 классов с величиной клас-

сового интервала 8. Данные заносим в таблицу 1.

 

 

 

 

 

 

Таблица 1.

 

 

 

 

 

 

 

 

 

~

Экспериментальные

Плотность

Теоретические частоты n'j

k

xj min- xj max

xj

частоты nj

вероятности f

 

 

точно

округленно

 

 

 

 

 

 

 

 

 

 

1

795-803

799

3

0,007

2,8

3

 

 

 

 

 

 

 

2

803-811

807

10

0,015

6

6

 

 

 

 

 

 

 

3

811-819

815

4

0,024

9,6

10

 

 

 

 

 

 

 

4

819-827

823

14

0,028

11,2

12

 

 

 

 

 

 

 

5

827-835

831

8

0,023

9,2

10

 

 

 

 

 

 

 

6

835-843

839

6

0,015

6

6

 

 

 

 

 

 

 

7

843-851

847

5

0,007

2,8

3

 

 

 

 

 

 

 

 

 

 

 

 

 

50

 

 

 

 

 

 

 

Рассчитать среднее значение ~xj для каждого интервала:

 

 

 

 

 

~

 

xmax xmin

 

 

 

 

 

xj

 

 

 

 

 

 

 

 

2

 

~

 

Rmax Rmin

 

803 795

 

 

 

 

xj

 

 

 

 

799 и т.д. Данные занести в таблицу 1.

2

2

Определить экспериментальные частоты nj, подсчитав количество вариант встречающихся в каждом интервале. Данные занести в таблицу 1.

Рассчитать теоретическую плотность вероятности для каждого интервала (f) с

помощью программы Microsoft Exel. Активируем курсором мыши пустую ячейку. Вы-

берем Вставка Функция (или нажать иконку fx). В строке Категория выберем Ста-

тистические, в окне Выберите функцию НОРМРАСП. Нажмите ОК. В появившемся

окне:

в строке Х необходимо указать среднее значение для интервала (~xj );

в строке Среднее – среднее арифметическое значение вариационного ряда ( X);

в строке Стандартное_откл – среднеквадратическое отклонение вариационного ряда ( );

в строке Интегральная – ввести слово "ложь". Программа в этом случае будет ис-

пользовать для расчетов уравнение нормального распределения:

 

1

 

(x a)2

f(x)

 

e 2σ2

 

 

 

 

 

σ 2π

Внижней строке окна появится значение плотности вероятности для соответст-

вующего интервала. Данные занести в таблицу 1, повторить операцию для всех интер-

валов, изменяя ~xj .

Теоретическая частота (n'j) является произведением плотности вероятности (f) на

объем выборки (n) и величину классового интервала ( ):

n'j= f n

Провести соответствующие расчеты для каждого интервала, данные занести в

таблицу 1.

ПРИМЕЧАНИЕ: расчетные значения теоретических частот округлять до целых значе-

ний, но сумма теоретических частот должна быть равна сумме экспериментальных

частот.

КОНТРОЛЬНЫЙ ПРИМЕР:

Вычислить теоретические частоты для сгруппированного в 8

классов вариационного ряда:

n=100; =10; X=417; =13,5

j

1

2

3

4

5

6

7

8

~

450

440

430

420

410

400

390

380

xj

nj

1

7

20

30

25

10

6

1

f

0,001

0,007

0,019

0,029

0,026

0,013

0,004

0,001

n'j

1

7

19

29

26

13

4

1

Вычислить значение критерия 2

по формуле 2

k

(n

j

n'

j

)2

, где nj – часто-

 

 

 

 

 

 

n'j

 

 

 

 

j 1

 

 

 

 

 

ты экспериментального вариационного ряда; n'j – теоретические частоты; k – число

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]